不十分なエビデンスに基づき商業化されたがんのスクリーニング検査とどう向き合うか

-文献名-
Juntaro Matsuzaki, et al. Prediction of tissue-of-origin of early stage cancers using serum miRNomes. JNCI Cancer Spectrum, 2023, 7(1), pkac080.

-要約-

【背景】
悪性新生物(がん)は本邦の死因順位の第1位であり、全死亡者の25%以上を占めており、がん死亡を減少させるために、簡便ながんの早期診断技術の開発が待望されている。各臓器に特化した様々な診断技術が着実に進歩している一方、単一の低侵襲検査システムによって多種の悪性腫瘍を一度にスクリーニングできる「多がん早期検出(multi-cancer early detection: MCED)」技術の実用化が検討されている。MCEDの検出対象物として最も有望なのは血液であり、そこに含まれる細胞外DNA(cell-free DNA:cfDNA)、細胞外RNA、エクソソームなどの細胞外小胞、血小板(tumor-educated platelet)中のRNAなどによる検査技術開発が進行している。血中の細胞外RNAのうち、最も量が多く含まれているものがマイクロRNA (miRNA)です。miRNAは細胞外小胞に包含されるなどの様式で細胞外へ分泌され、他の細胞に取り込まれることによって、細胞間コミュニケーションツールとしての役割を担うことがある。腫瘍サイズが小さい段階から、腫瘍細胞やその周辺の細胞などが通常とは異なるmiRNAの分泌を自律的に開始することから、従来の腫瘍マーカーよりもその変化が早く血中に現れやすく、がん早期診断に適しているのではないかと考えられている。
2014年より国立研究開発法人日本医療研究開発機構の次世代治療・診断実現のための創薬基盤技術開発事業の支援を受け、『体液中マイクロRNA測定技術基盤開発プロジェクト』が実施された。
【方法】
国立がん研究センターバイオバンク、国立長寿医療研究センターバイオバンク等を活用し、固形がん9,921例[乳がん675例、膀胱がん399例、胆道がん402例、大腸がん1,596例、食道扁平上皮がん566例、肺がん1,699例、胃がん1,418例、肝細胞がん348例、膵がん851例、前立腺がん1,027例、卵巣がん400例、骨軟部肉腫299例、脳腫瘍241例]と非がん対照5,643例、および各種良性疾患626例の血清miRNAプロファイルを解析した。

【結果】
全体の5分の4に相当するサンプル数で機械学習モデルにmiRNAデータを学習させ、残りの5分の1のデータによってがんの種類を予測したところ、診断予測精度は全ステージで0.88(95%信頼区間:0.87-0.90)、特に早期診断の意義が高いステージ0からIIに限っても精度0.90(95%信頼区間:0.88-0.91)と高い性能が得られた(Figure2)。数字は正しく診断された割合(%)を示す。診断ステージ0からIIにおいても、ステージIII~IVと同等の性能がみられ、早期診断ツールとしての活用が期待できる。胆道がんは他がんに比べて診断難易度が高いことも判明した。(BR: 乳がん、BL: 膀胱がん、BT: 胆道がん、CR: 大腸がん、ES: 食道扁平上皮がん、GA: 胃がん、GL: 脳腫瘍、HC: 肝細胞がん、LU: 肺がん、OV: 卵巣がん、PA: 膵がん、PR: 前立腺がん、SA: 骨軟部肉腫)

Figure2


なお、この性能は機械学習アルゴリズムによって大きな差異があり、機械学習の最適化の重要性も明らかとなった。研究グループでは、血中miRNA診断に最適なアルゴリズムとして、深層学習を含む階層的アンサンブルアルゴリズム (the Hierarchical Ensemble Algorithm with Deep learning: HEADモデルと命名)を構築し、上記の診断予測精度を達成したが、用いる機械学習アルゴリズムによっては、HEADモデルよりも診断性能が大きく劣っていた。さらに本研究で作成したデータベースに加えて、公開されているmiRNA情報も活用することで予測精度を向上させる「転移学習」が活用できることや、この統合情報より、がんの種類を予測するために重要なmiRNAの絞り込みを行った結果も報告した。

【考察】
本研究の成果は、バイオバンクに保管された血清を用いて得られたものである。新たに収集した血清検体でもこの結果が再現されるかどうか、検証を進めています。また本研究で見出した、特に注目すべきmiRNAの血中での含有量が、どのようなメカニズムで調節されているのかを引き続き追究している。本研究で得られたmiRNAデータと、解析に用いた機械学習コードはすべて公開しており、この研究領域のさらなる活性化を促進するためのリソースとしての活用が期待される。

【開催日】2025年7月9日