みなさんこんにちは!日々機械学習を学ぶ外科医のさとうです。
今回はClinical Gastroenterology and Hepatologyに2020年に掲載されたAI・機械学習と大腸がんに関する論文を一緒に勉強していきましょう。
今回紹介する論文はこちらです。
Google scholarから検索。
今回の論文
論文:Validation of an Algorithm to Identify Patients at Risk for Colorectal Cancer Based on Laboratory Test and Demographic Data in Diverse, Community-Based Population
著者:Jennifer L. Schneider et al.
雑誌:Clinical Gastroenterology and Hepatology 2020;18:2734–2741
AIでラボデータと人口統計データから大腸がん発症のリスクを特定する
<背景>
米国では、スクリーニング対象となる成人の約30~40%が、大腸がん(CRC)スクリーニングを受けていないといわれている。我々は、コミュニティベースの民族的に多様な大規模コホートにおいて、CRCのリスクが高い患者を特定するために、一般的な臨床検査データを用いた機械学習アルゴリズムによって生成された予測スコアを検証した。
<方法>
1996~2015年の北カリフォルニアのデータを用いて、ケースコントロール研究を行った。50~75歳で血球検査を受けた際にはCRC既往がなかったが、その後CRCと診断されたコホートメンバーを対象症例とした。このコホートのデータで、検査値と人口統計学的情報を用いて、CRCのリスクが高い患者を特定するアルゴリズムの能力を検証した。検査性能は、ROC曲線の曲線下面積、 およびオッズ比(OR)と95%CIを用いて評価した。高いスコア(特異性が97%以上と定義)と低いスコアを比較した。
<結果>
高いスコアのアルゴリズムでは、今後6カ月以内にCRCの診断を受ける患者を35.4%の感度(95%CI 33.8-36.7)、AUROC 0.78(95%CI 0.77-0.78)で特定できた。スコアが高かった患者は、早期CRC(OR, 13.1; 95% CI, 11.8-14.3)および進行期CRC(OR, 24.8; 95% CI, 22.4-27.3)と今後6カ月以内に診断されるリスクが高かった。スコアが高かった患者では、近位部および遠位部のがんのORは34.7(95%の CI, 31.5-37.7)および12.1(95%CI, 10.1-13.9)であった。アルゴリズムの精度は、血液検査の結果からCRCの診断までの期間が長くなるほど低下した。アルゴリズムの性能は性別や人種による差はなかった。
<結論>
血球検査と人口統計データを用いてCRCのリスクが高い患者を特定する予測モデルを検証した。このアルゴリズムは、検査が必要な人口の3%を特定し、今後6カ月以内にCRCの診断を受けた患者の35%を特定した。
<Background>
Approximately 30%–40% of screening-eligible adults in the United States are not up to date with colorectal cancer (CRC) screening. We aimed to validate a predictive score, generated by a machine learning algorithm with common laboratory test data, to identify patients at high risk for CRC in a large, community-based, ethnically diverse cohort.
<Method>
We performed a nested case–control study using data from members of Kaiser Permanente Northern California (1996–2015). Cases were cohort members who received a complete blood cell count at ages 50—75 y, did not have a prior or current diagnosis of CRC diagnosis at the time of the blood cell count, and were subsequently diagnosed with CRC. We used data from the cohort to validate the ability of an algorithm that uses laboratory and demographic information to identify patients at increased risk for CRC. Test performance was evaluated using area under the receiver operating characteristic curve (AUROC) and odds ratios (OR) with 95% CI values to compare high (defined as 97% specificity or more) vs low scores.
<Results>
A high score from the algorithm identified patients with a CRC diagnosis within the next 6 months with 35.4% sensitivity (95% CI, 33.8–36.7) and an AUROC of 0.78 (95% CI, 0.77–0.78). Patients with a high score had an increased risk of diagnosis with early-stage CRC (OR, 13.1; 95% CI, 11.8–14.3) and advanced stage CRC (OR, 24.8; 95% CI, 22.4–27.3) within the next 6 months. In patients with high scores, the ORs for proximal and distal cancers were 34.7 (95% CI, 31.5–37.7) and 12.1 (95% CI, 10.1–13.9), respectively. The algorithm’s accuracy decreased with the time interval between blood test result and CRC diagnosis; performance did not differ by sex or race.
<Conclusion>
We validated a predictive model that uses complete blood cell count and demographic data to identify patients at high risk of CRC. The algorithm identified 3% of the population who require an investigation and identified 35% of patients who received a diagnosis of CRC within the next 6 months.
さいごに
いかがでしたでしょうか。今回はAIを用いた消化器領域の研究について一緒に勉強しました。
完全未経験から独学でプログラミング、Pythonを学んだ私の経験をこちらに紹介しています。
Twitterでも役立つ情報を配信していますのでよかったらフォローしてみてください!
では、また!