-文献名-
Triple cardiovascular disease detection with an artificial intelligence-enabled stethoscope (TRICORDER) in the UK: a cluster-randomised controlled implementation trial
Kelshiker, Mihir A et al. The Lancet, Volume 407, Issue 10529, 704 – 715
-要約-
Research in context
この研究以前のエビデンス
2023年10月1日にPubMedで「人工知能」AND「ランダム化比較試験」AND「実装研究」AND「リアルワールドエビデンス」AND「プライマリケア」という用語を使用して検索した。過去10年間に英語で発表された査読済み論文を対象とした。特にプライマリケアの現場において、臨床効果と文脈的な実装結果の両方を取り入れたプラグマティック試験方法論を用いて人工知能(AI)技術を前向きに評価した発表済み研究は確認されなかった。「人工知能」AND(「心血管」OR「心不全」OR「心房細動」OR「弁膜症」)AND「ポイントオブケア」AND「心電図」AND「前向き」という用語を使用した別の検索でも、AI聴診器などのAI統合型波形記録ハードウェアを医療現場で大規模に実装した研究は見つからなかった。最も近い比較対象は、米国のプライマリケアクリニック45施設を対象としたクラスターランダム化試験であるEAGLE研究であり、AIによる確率を用いて12誘導心電図レポートを補完することで、左室駆出率低下(≤50%)の検出率が向上することが示されました。2025年7月21日に文献検索を更新しましたが、これらの結論を変える新たなエビデンスは見つかりませんでした。
この研究のもたらす価値
我々の知る限り、TRICORDERは臨床AI技術の初のクラスターランダム化比較試験であり、また国のプライマリケアシステムにおける初の大規模導入試験である。この試験には、AI研究の分野では代表性が低い英国国民保健サービス(NHS)のプライマリケア診療所205施設が参加した。ランダム化比較試験の導入方法は、既存研究における主要なギャップに対処し、アルゴリズム検証にとどまらず、実世界におけるアルゴリズムのパフォーマンス、診断効果、採用パターン、導入状況に応じた障壁を評価することを目指した。TRICORDERで研究中のAI聴診器は、心不全、心房細動、弁膜症といったプライマリケアで診断が遅れがちな疾患に対する3つの異なるアルゴリズムを統合している。成果は、患者レベルの分析のためにAI聴診器データで強化されたNHSセキュアデータ環境(実世界データ)への新たなアクセスを通じて測定された。 972 人の臨床ユーザーと 12,872 人の患者検査を通じて、3 つの症状のそれぞれの検出率の向上は、アルゴリズムの性能が堅牢であるにもかかわらず、人口規模では達成されず、使用方法に依存していることが示され、低い普及率や関連するワークフローの不整合など、現実世界での導入において克服する必要がある大きな課題が明らかになりました。
入手可能なすべてのエビデンスが示すこと
TRICORDERによるPOC(ポイントオブケア)AI技術の研究は、プライマリケアにおける心血管疾患の検出能力向上の可能性を浮き彫りにしています。プライマリケアでは、臨床効果は実社会での導入とワークフローへの統合に密接に関連しています。このランダム化比較試験は、医療システムにおけるAI技術の効果的な導入とその後の影響を確実にするために、実践的な有効性研究と並行して実装科学を組み込んだ研究設計の重要性を実証しています。
以下生成AIを使用して要約しています。
________________________________________
1. Introduction(緒言)
心血管疾患(CVD)は、世界的に死亡や医療費増大の最大の要因であり、診断の遅れが予後を悪化させている 。特に心不全、心房細動(AF)、弁膜症(VHD)の3疾患は一般的で治療可能だが、多くの場合、救急入院という進行した段階で初めて診断される 。英国のデータでは、心不全患者の70%以上が入院後に診断されているが、その半数は入院前の段階で一次診療(プライマリ・ケア)に症状を訴えて受診していた 。
AI搭載聴診器は、心電図(ECG)と心音図(PCG)を解析することで、心不全(特に駆出率が低下した心不全:HFrEF)、AF、VHDを高い精度で検出できることが先行研究で示されている 。しかし、これまでの研究はアルゴリズムの検証が主であり、多忙な実診療に導入した際の臨床的効果や実装上の課題を大規模に検証した試験は存在しなかった 。本研究は、この「技術」と「実装」のギャップを埋めるべく計画された 。
________________________________________
2. Method(方法)
TRICORDER試験は、2023年10月~2024年5月に、英国の205のプライマリケア施設で実施した非盲検クラスター無作為化対照比較実装試験である。(英国国立衛生研究所[NIHR]などの助成を受けている)
参加施設を、介入群(96施設、登録患者70万1,933例[平均年齢44.5歳、女性48.9%])または対照群(109施設、85万1,242例[43.5歳、47.9%])に無作為に割り付けた。
介入群の医師は、AI搭載聴診器(Eko DUO)が最大6台提供され、1時間の日常診療におけるAI聴診器使用の研修を受けたうえで臨床導入した。対照群は通常診療を行った。介入の性質上、参加者(施設、臨床医、患者)の盲検化は不可能だった。
心音検査において、AI聴診器は15秒間の単一誘導心電図と心音図信号を記録した。これらのデータは3つのアルゴリズムに入力され、「左室駆出率低下(≦40%)」「心房細動」「弁膜症」の有無について、二値予測(陽性または陰性)の結果が返答された。
主要エンドポイントは、新たに診断コードが付与されたあらゆる心不全(全サブタイプ)の発症率とし、英国国民保健サービス(NHS)のSecure Data Environmentから得たデータに基づき、1,000人年当たりの発症率(発症率比[IRR])として算出した。
● データソース(Discover SDE): 155万人以上の登録患者データを含む「NHS Discover Secure Data Environment」を活用した 。これは、プライマリ・ケアとセカンダリ・ケア(病院)の記録を統合し、リアルタイムでアウトカムを追跡できる高度なデータ基盤である 。
● 解析手法:
○ 意図した治療(ITT)解析: 割り付けられたすべての患者を対象とする解析。実際のデバイス使用の有無にかかわらず、システム全体の導入効果を評価する 。
○ プロトコル遵守(PP)解析: 実際にAI検査を受けた患者と、背景因子を揃えた(傾向スコアマッチング)対照群を比較する解析 。
________________________________________
3. Results(結果)
試験期間中(2023年10月〜2024年5月)、205の診療所が参加した 。
臨床的アウトカム
● 主要評価項目(心不全検出): ITT解析の結果、1000人年あたりの新規診断率は介入群で2.58、対照群で2.76であり、有意な差は認められなかった(IRR 0.94 [95% CI 0.86–1.02]
● 診断場所: 「入院」ではなく「地域(GP)」で早期に診断される割合についても、群間で差は見られなかった 。
● 二次評価項目(AF・VHD): これらの疾患についても、ITT解析では有意な検出率の向上は見られなかった。
デバイス使用群(PP解析)の結果
一方で、実際にデバイスを使用した患者を対象としたPP解析では、劇的な結果が得られた 。
● 心不全: 検出率が2.33倍に上昇(p = 0.0046)
● 心房細動(AF): 検出率が3.45倍に上昇(p = 0.0013)
● 弁膜症(VHD): 検出率が1.92倍に上昇(p = 0.020)
デバイスの性能と使用実態
● 性能(Table 3): 心不全の陰性的中率は95%と高く、「除外ツール」としての有用性が示された 。しかし、VHDの陽性的中率は0.10(10%)と低く、確定診断には至らない
● 使用の推移(Figure 4): 12ヶ月間で12,725件の検査が行われたが、使用頻度は時間の経過とともに大幅に減少した 。12ヶ月後には、40%の診療所が全く使用しなくなり、上位5施設が全記録の34%を占めるという極端な偏りが見られた
【開催日】2026年3月4日



