アタッチメント理論(愛着理論)と継続性(医師患者関係)

-文献名-
Frederiksen, Heidi Bøgelund, Jakob Kragstrup, and Birgitte Dehlholm-Lambertsen.
“Attachment in the doctor–patient relationship in general practice: A qualitative study.”
Scandinavian journal of primary health care 28.3 (2010): 185-190.

-要約-
【目的】なぜ主治医とのinterpersonal continuityは患者にとって有用なのかを探索する

【デザイン・セッティング・対象】
22名の患者にインタビューを用いた質的研究をした。そのうち12名は毎回同じGPに診てもらっており、10名は馴染みの薄いGP(専攻医)に診てもらっていた。診察を観察後にインタビュー対象者を選択し、主訴(受診理由)、年齢、性別によって合目的に対象者を抽出した。研究テーマは心理学的理論を用いて対応した。

質的分析の方法論:*解釈的現象学的分析
「主治医との関係性を患者はどのように経験しているか?」
インタビュー逐語録の読み込み、テーマを注釈し、各テーマを連結させ、最後に、それらのテーマと
主観的な記述の理論的な意味を解釈するための適切な社会心理学的理論を結びつけた。その過程で、Attachment理論が、役立つ枠組みとして立ち上がってきた。

*Attachment理論とは:John Bowlby,1907―1990
主に幼少期における養育者などとの関係性,ことにアタッチメントattachment(愛着)が,人間の生涯にわたるパーソナリティや社会的適応性などにいかに影響を及ぼすかを問う発達理論。 愛着理論ともいう。

【結果】
患者のinterpersonal continuityの有用性の理解にとって中心的問題は、attachmentの必要性であった。患者はGPとの人間的な関係性の構築をより好み、大多数の患者は医師患者関係の中にある、ある程度の脆弱性を述べた。病気が重症だったり心配が強いほど、患者は脆弱であり、毎回同じGPをより必要としていた。更に、たとえ医師患者関係が好ましくない状況であっても、GPを変えることは困難であると述べていた。

【考察 *抜粋記載】
病気になると、自動的に医師はアタッチメントの対象となる。アタッチメント理論では、安全になることよりも、安心感を得ることへの関心が述べられているが、医師はケアを提供するためのより賢く強い個人として認識される。またアタッチメント理論は、合理的な判断が個人の関係性で説明つかないことも説明することができる。患者は弱い立場(脆弱性)なので、好ましくない医師患者関係の場合も医師を変えるに至らないのだ。

【結論】
Attachment理論は、毎回同じGPに診てもらいたい患者ニーズの原理の説明を提供するかもしれない。患者という弱い立場は、ケア提供者へのattachmentの必要性を作り出す。この欲求は根本的なものであり、病いや怖さを感じる時に活性化される。

【開催日】2020年11月11日(水)

2型糖尿病に対する血糖降下薬の有効性の比較

※この時期のUpToDateにある”What’s new in family medicine”のTopicで参考にされている文献です。
-文献名-
Apostols Tsapas, et al. Comparative Effectiveness of Glucose-Lowerinng Drugs for Type 2 Diabetes. Annals of Internal Medicine. Vol.173 No.4 18 August 2020.

-要約-
【背景】
 2型糖尿病の治療薬にはいくつかの選択肢がある。
【目的】
 成人の2型糖尿病における血糖降下薬の有益性と有害性を比較する。
【データソース】
 開始から2019年12月18日までの複数のデータベースと、2020年4月10日のClinicalTrials.gov。
【試験の選択】
 少なくとも24週間の介入が行われ、死亡率、血糖値、血管アウトカムに対する血糖降下薬の効果を評価した英語による無作為化試験。
【データ抽出】
 ペアのレビュアーがデータを抽出し、バイアスのリスクを評価した。
【データ統合】
 9つの薬物クラスから21の糖尿病治療介入を評価した453試験が含まれた。介入には、単剤療法(134試験)、メトホルミン療法への追加(296試験)、単剤療法とメトホルミン療法への追加の比較(23試験)が含まれた。
心血管リスクが低く薬物療法を受けていない患者では、治療法によって死亡率や血管アウトカムに有意な差は認めなかった。
インスリン療法とGLP -1受容体作動薬のメトホルミン療法への追加で、HbA1cが最も低下した。(Fig.2 B)
心血管リスクが低くメトホルミン療法を受けている患者(298試験)では、死亡率と血管アウトカムに関して治療法間に有意な差は認めなかった。(Fig.2 D)
心血管系リスクが高くメトホルミン療法を受けている患者(21試験)では、経口セマグルチド(リベルザス®)、エンパグリフロジン(ジャディアンス®)、リラグルチド(ビクトーザ®)、徐放性エキセナチド(ビデュリオン®)、ダパグリフロジン(フォシーガ®)が全死亡率を減少させた。(Fig.2 C)
経口セマグリチド、エンパグリフロジン、リラグルチドは心血管死を減少させた。脳卒中のオッズは、皮下セマグルチド(オゼンピック®)とデュラグルチド(トルリシティ®)で低かった。SGLT-2阻害薬は心不全による入院と末期腎不全を減少させた。皮下セマグリドとカナグリフロジン(カナグル®)はそれぞれ糖尿病網膜症と下肢切断を増加させた。
【限界】
 心血管リスクの定義に一貫性がなく、心血管リスクが低い患者の一部の推定値の信頼性が低い。
【結論】
 心血管リスクが低い糖尿病患者では、どの治療法もプラセボと血管アウトカムに差はなかった。心血管リスクが高い患者でメトホルミン療法を受けている場合、特定のGLP-1作動薬とSGLT-2阻害薬は特定の心血管アウトカムに対して良好な効果を示した。
【主要な資金源】
 欧州糖尿病研究財団(European Foundation for the Study of Diabetes)、アストラゼネカからの無制限教育助成金の支援を受けている。

JC202011今江1

JC202011今江2

JC202011今江3

【開催日】2020年11月4日(水)

ペニシリンアレルギーのリスクの層別化

-文献名-
Jason A. Trubiano, et al. Development and validation of a penicillin allergy clinical decision rule. JAMA Internal Medicine. 2020;180(5):745-752.

-要約-
■Importance:
ペニシリンアレルギーは、患者、抗菌薬管理プログラムおよび医療サービスにとって重要な問題である。専門家によるペニシリン皮膚検査を必要としない低リスクのペニシリンアレルギーを特定するために、妥当性を評価されたclinical decision ruleが求められている。

■Objective:
患者から報告されたペニシリンアレルギーのpoint of care リスク評価を可能にするペニシリンアレルギーのclinical decision ruleを開発、検証する。

■Design, setting, and participants:
 この研究では、オーストラリアのメルボルンにある2つの三次医療機関(Austin Health and Peter MacCallum Cancer Centre)からの622人の患者(多施設、前向き、抗菌薬アレルギーテストが行われたコホート)が参加して、ペニシリンアレルギー decision ruleの開発と内的妥当性の評価を行った。ロジスティック解析・変数減少法を使用してペニシリンアレルギーテストの陽性結果を予測する臨床変数を含むモデルを導き出した。最終モデルの内的妥当性の評価には、Bootstrapped sample(※1)と係数から導出されたモデルスコアリングを使用した。外的妥当性の評価は、オーストラリアのシドニーとパース、テネシー州のナッシュビルからの945人の患者(後向き、抗菌薬アレルギーテストが行われたコホート)で実施された。ペニシリンアレルギーを報告した患者は、皮膚プリックテスト、皮内テスト、パッチテストと経口チャレンジ(直接または皮膚テスト後)を組み合わせたアレルギーテストを受けた。データは2008年6月26日から2019年6月3日まで収集され、2019年1月9日から12日まで分析が行われた。
※1:母集団となるデータがある時に、母集団から重複を許してランダムにいくらかデータを取り出して再標本化する手法。予測モデルの生成に使われる。

■Main outcomes and measures:
 Primary outcomeは、外来または入院患者のペニシリンアレルギーテスト陽性という結果。

■Results:
 モデルの開発および内的妥当性の評価に用いられたコホート622人(女性367人(59%)、年齢中央値60歳(四部位範囲48-71歳))、外的妥当性の評価に用いられたコホート945人(女性662人(70.1%)、年齢中央値55歳(四部位範囲38-68歳))から、多変量解析によりペニシリンアレルギーテスト陽性に関連する4つの特徴は、PEN-FAST(penicillin allergy, five or fewer years ago, anaphylaxis/angioedema, severe cutaneous adverse reaction(SCAR), and treatment required for allergy episode)という略語にまとめられた。大基準(major criteria)には、5年以内に発生したアレルギーイベント(2点)、アナフィラキシー/血管浮腫もしくはSCAR(2点)が、小基準(minor criterion)にはアレルギーに治療を要したというエピソード(1点)が含まれた。内的妥当性の評価では、AUC 0.805(※2)、minimal mean optimism(※3) 0.003だった。ペニシリンアレルギー低リスクの分類には、PEN-FAST 3点以下がカットオフと設定されました。この場合、460人の患者のうち17人(3.7%)のみがアレルギーテスト陽性となり、陰性予測値は96.3%(95%CI、94.1%-97.8%)だった。また、外的妥当性の評価でも同様の結果が得られました。
※2:AUCの診断精度の目安 0.7-0.8 fair, 0.8-0.9 good, 0.9-1.0 excellent
※3:optimismとは、モデルの予測精度の過大評価のバイアス

■Conclusion and relevance:
この研究で、PEN-FASTは、正式なアレルギーテストを必要としない低リスクのペニシリンアレルギーを正確に特定できる簡便な基準であることと証明された。3点未満のPEN-FASTスコアは高い陰性予測値を有するという結果から、臨床医にとって、あるいは抗菌薬管理プログラムにおいて、ペニシリンアレルギー低リスクをpoint of careで特定するために役立つということが示唆された。

JC202010堀み1

JC202010堀み2

JC202010堀み3

JC202010堀み4

■Limitation:
・非ペニシリンβ-ラクタム系抗菌薬アレルギー、静脈内投与でのみ起こるペニシリンアレルギーが除外されている
・SCARのようなアレルギー表現型を持つ患者が少ない
・予測モデルの生成に際して、入院患者の割合が多かった
・成人患者のみしか適用できない
・ペニシリンアレルギーとアレルギー表現型の有病率が変化する可能性が高い、民族による違いの検証はネクストステップ

【開催日】2020年11月4日(水)

慢性腎臓病の進行に対するアロプリノールの効果

※この時期のUpToDateにある”What’s new in family medicine”のTopicで参考にされている文献です。

-文献名-
Badve SV, Pascoe EM, et al. Effects of Allopurinol on the Progression of Chronic Kidney Disease. N Engl J Med. 2020;382(26):2504.

-要約-
【背景】
血清尿酸値の上昇は慢性腎臓病の進行と関連している.アロプリノールによる尿酸降下療法が,進行リスクのある慢性腎臓病患者における推定糸球体濾過率(eGFR)の低下を減衰させることができるかどうかは不明である。

【研究のデザインと方法】このRCTは,オーストラリアとニュージーランドの31施設で行われた,二重盲検化,隠蔽化された試験である.痛風の既往がない,ステージ 3 または 4(eGFE15-59) のCKD患者であり,尿中アルブミン/クレアチニン比が 265 mg/gCr以上、または過去 1 年間のeGFR の低下幅が 3.0 ml/min/1.73m2以上である成人集団をアロプリノール(100~300 mg/日)投与郡とプラセボ投与群に無作為に割り付けた.主要アウトカムは,104週目(2年間)までのeGFRの変化.副次アウトカムは,「40%のEGFR低下・末期腎疾患・全死亡の複合アウトカム」,「30%のEGFR低下・末期腎疾患・全死亡の複合アウトカム」,「腎臓アウトカム」「血圧」「アルブミン尿」「血清尿酸値」,「QOLのスコア」,「安全性アウトカム」.

JC202014黒岩1

【結果】
予定していた登録数は620例だったが,登録数が伸びなかったため,369例で募集を終了し,アロプリノール投与群(185例)またはプラセボ投与群(184例)に無作為に割り付けた.1群あたり3人の患者が割り付け後すぐに辞退した。残った363例で主要アウトカムを評価した。(平均eGFRは31.7 ml/min/1.73m2、尿中アルブミン/クレアチニン比中央値は716.9mg/gCr、平均血清尿酸値は8.2mg/dL)
主要アウトカムであるeGFRの変化はアロプリノール群とプラセボ群で有意差は認められなかった(アロプリノール群は-3.33 ml/min/1.73m2[95%信頼区間{CI},-4.11~-2.55],プラセボ群は-3.23 ml/min/1.73m2[95%CI,-3.98~-2.47],平均差は-0.10 ml/min/1.73m2[95%信頼区間{CI},−1.18 ~0.97;P=0.85]であった)(FIG1)。

JC202010黒岩2

JC202010黒岩3

副次アウトカムについては,
「eGFRの40%低下、末期腎疾患、全死亡の複合アウトカム」は,アロプリノール群では63例(35%)、プラセボ群では51例(28 %)に認められた.(リスク比、1.23;95%CI、0.90~1.67;ハザード比、1.34;95%CI、0.92~1.9)であった。「GFRの40%低下、末期腎疾患、全死亡の複合アウトカム」についても似たような結果であった.(TABLE2)

JC202010黒岩4

ベースライン値を調整した場合の血清尿酸値の平均差は, -2.7mg/dLであった(95%CI、-3.0~-2.5)(Fig2A)。尿中アルブミン/クレアチニン比には有意な群間差は認められなかった(fig2B).収縮期血圧(平均差、-1.79mmHg;95%CI、-4.69~1.11)または拡張期血圧(平均差、-3.21mmHg;95%CI、-6.82~3.40)、またはQOLスコア(36項目の短命健康調査QOLサマリースコアの平均差、-4.4;95%CI、-10.5~1.6)においても有意な群間差は認められなかった.

JC202010黒岩5

重篤な有害事象が報告されたのは,アロプリノール群で182例中84例(46%),プラセボ群では181例中79例(44%)であった(Table3).
重篤な有害事象は両群で同程度の頻度で発生した(アロプリノール群では84人[46%]の参加者で170件、プラセボ群では79人[44%]の参加者で167件)(表3および表S6)。発疹を含む非重篤な副作用のリスクには有意差はなかった。
JC202010黒岩6

【Discussion】
CKDで進行リスクの高い患者において,アロプリノールによる尿酸降下療法は,プラセボと比較してeGFRの低下を遅らせることはできなかった。
今回の結果は、血清尿酸値がCKDの進行に因果関係があるという見解を支持するものではないようである。観察研究から得られた証拠は、尿酸値と慢性腎臓病の進行との間に関連性があるだけで、因果関係はないことを示している。

【今回の研究の限界】
・登録が不完全であったために検出力が不十分であったこと
・試験レジメンを中止した患者の割合が高かったこと
・eGFRの計算に血清クレアチニンベースの式を使用していたこと
・代替アウトカムの使用

【開催日】2020年10月14日(水)

笑いの頻度と一般集団における全死亡率および心血管疾患の発症リスクとの関連

-文献名-
Associations of Frequency of Laughter With Risk of All-Cause Mortality and Cardiovascular Disease Incidence in a General Population: Findings From the Yamagata Study.
J Epidemiol. 2020; 30(4): 188–193.

-要約-
背景
過去の研究では心理学的なポジティブ要因とネガティブ要因は死亡率や心血管疾患と関連していることが明らかにされてきた。笑いやユーモアが健康に対しポジティブな要因だという考えは医療従事者だけでなく一般人の間でも浸透してきている。
2013年の横断的データで、1日の笑いの頻度が高いほど、日本の高齢者における心疾患の有病率が低いことが示されていた。しかし、横断的な研究であるため笑いが心血管疾患の予防効果を明確に示すことはなかった。そこで今回、地域社会に根ざした集団において日常的な笑いの頻度と死亡率および心血管疾患との関連を前向きに調査した。

方法
山形県の年1回の健康診断を受けた40歳以上の17152人が対象
7市(山形市、酒田市、上山市、寒河江市、東根市、米沢市、天童市)の40歳以上の住民
除外基準なし
2009-2015年に、合計20969人(男性8558人、女性12411人)の被験者を登録
66人の被験者が他の地域に移動、ベースライン時のデータが不完全であったため3817人を除外
最大8年間(中央値、5.4年)追跡
男性7003人(40.8%)、女性10149人(59.2%)、平均年齢62.8歳
自己申告した1日の笑いの頻度を3つのカテゴリー(週1回以上、1か月以上1週間未満、月1回未満)に分類
毎日の笑いの頻度と全死因死亡率および心血管疾患発生率の増加との関連をCox比例ハザードモデルを用いて決定

「笑い」=「大声で笑う」と定義
ほぼ毎日、1~5回/週、1~3回/月、1回/月未満の4つの選択肢を提供し、自己申告で得られた回答から3つのカテゴリー(≧1/週、≧1/月だが<1/週、<1/月)にグループ分けした
・笑いの頻度別の有病率
週1回以上       :14096人(82.2%)
1か月以上1週間未満:2486人(14.5%)
月1回未満       :570人(3.3%)

JC202010大西1

笑いの頻度が低い群は、男性・現役喫煙者・糖尿病患者・独身者・身体的不活発者の割合が有意に高かった。

結果
追跡期間中(中央値、5.4年)、257人の被験者が死亡し、138人の被験者が心血管イベントを経験した。Kaplan-Meier解析の結果、笑いの頻度が低い被験者では全死因死亡率および心血管疾患発症率が有意に高かった(log-rank P<0.01)。年齢、性別、高血圧、喫煙、飲酒状況で調整したCox比例ハザードモデル解析では、全死因死亡のリスクは、月1回未満で笑う被験者の方が(週1回以上笑う被験者よりも)有意に高い(ハザード比1.95)。同様に、心血管イベントのリスクは月1回以上週1回未満で笑う被験者が(週1回以上笑う被験者よりも)月1回以上笑う被験者の方が高かった(ハザード比 1.62)。

JC202010大西2

<笑いの頻度に応じた全生存期間>
頻度が低い群で、全死因死亡率が有意に高い(P値=0.003)

JC202010大西3

<笑いの頻度に応じた心血管疾患の無病生存期間>
同様の曲線が心血管疾患についても観察された(P値<0.001)

JC202010大西4

<Cox比例分析を用いた、笑いの頻度と死亡率および心血管イベントとの関連性>
・無調整
全死亡率:月1回未満の人が有意に高い(HR 2.38;95%CI、1.42-3.74)
心血管疾患発症リスク:1か月以上1週間未満の人が有意に高い(HR 2.06;95%CI、1.38-3.00)
・年齢・性別・高血圧・糖尿病・喫煙・飲酒状況の調整後
全死亡率:月1回未満の人が有意に高い(HR 1.95;1.16–3.09).
JC202010大西5

<笑いの頻度と全死亡率の関連性のサブグループ解析>
女性、非高血圧、糖尿病患者、肥満、知覚される精神的ストレスのレベルが中程度、大学卒業以上のサブグループにおいて、月1回未満の群では、全死因死亡率が有意に高い。
笑いの少ない群では、他の群(4.2~4.7%)に比べて精神的ストレスが低い有病率(7.8%)が高く、笑いの少ない群では精神的ストレスが高い=重度の有病率は他の群(70.3~72.9%)と同程度。

検討
笑いの頻度は、男性、現在の飲酒者、糖尿病、低身体活動、配偶者のいない生活の高い有病率と関連していた。年齢、性別、および喫煙、飲酒状況、高血圧、糖尿病などの複数のよく知られた危険因子を調整した後でも、笑いの頻度が全死亡率および心血管疾患の発症率と独立して関連していることが明らかになった。確立された危険因子とは無関係に、笑いそのものが長寿化や心血管疾患発症率の低下に寄与していることが示唆された。

笑いの頻度が全死亡率と心血管疾患に及ぼす影響は不明であるが、いくつかの可能性が示唆されている。
・笑いは健康を促進する行動と関連している可能性がある。この研究では、笑いの頻度が高い群では、現在の喫煙・飲酒者の割合が低く、身体活動が低いことが示されていた。
・過去の研究で、免疫系に関して、笑いは様々な免疫学的要因に影響を与えることが示されている。
・笑いは血管内皮を改善する:機能や動脈硬化を抑制、食後血糖値やストレスのバイオマーカーである唾液性クロモグラニンAの増加を抑制。

笑う頻度は女性では有意で、男性では有意でなかった。一般的に男性は感情を表に出さない傾向があり、今回の調査では女性よりも男性の方が大声で笑う頻度が低かった。
日常的に頻繁に笑うことの効果は、高齢者、肥満のある人、中等度のストレスレベルの人でより強く認められた。

・本研究の強み
前向き研究、大規模なサンプルサイズ
年齢、性別、高血圧、糖尿病、喫煙状況、飲酒状況など、複数のよく知られた危険因子を用いて調整が行われた

<制限>
・笑いの定義に誤差あり
「大声で笑う」が笑いの定義だったので、無言で笑う、微笑む、などは笑いとしてカウントされていない→笑いの頻度が過小評価されている可能性あり。しかし、笑いの度合いには個人差あり→過大評価も過小評価も両方を引き起こしているかも。
・無症状の心血管イベントの症例があったかも
・健康意識の高い、選択バイアスがあったかも
調査対象者は地域の健康診断の参加者→健康意識が高く、社会活動のレベルが高かった可能性がある。

結論
毎日の笑いの頻度は、日本人一般集団における全死亡率と心血管疾患の独立した危険因子である
笑いの頻度を増やすことで、心血管疾患のリスクが減少し、寿命が延びる可能性があることを示唆している
笑い療法は、容易にアクセスでき、受け入れられやすく、費用もかからない
→一般の人々に笑い療法を広く普及させることを支持するものである。

【開催日】2020年10月14日(水)

75歳以上の成人にがん検診の中止について話し合うためのプライマリ・ケア医の準備戦略

※この時期のUpToDateにある”What’s new in family medicine”のTopicで参考にされている文献です。

-文献名-
Mara AS, et al. A strategy to Prepare Primary Care Clinicians for Discussing Stopping Cancer Screening With Adults Older Than 75years. Innovation in Aging. 2020; Vol4(4): 1-12.

-要約-
【背景と目的】
75歳以上の高齢者,特に余命が10年未満の人ではがんが過剰にスクリーニングされている.本研究は、プライマリ・ケア・プロバイダー(PCP)にマンモグラフィや大腸がん(CRC)検診の中止について話し合うためのスクリプト(台本.参考文献18の研究で開発されたもの)を提供し、さらに患者の10年後の余命に関する情報を提供することが、患者のこれらのがん検診受診意向に与える影響を調べることを目的とした。

【研究のデザインと方法】
ボストン周辺の7箇所の施設(クリニック,地域の健康センター,大学病院など)に勤務するPCPを対象に実施した.PCPの予約記録から選定された参加者(患者)は受診前後にアンケートに記入した。PCPには、診察前にスクリーニングの中止について話し合うためのスクリプトと患者の10年後の平均余命に関する情報が提供され,研究終了時にアンケートに記入した。質問内容はがん検診の中止について話し合うことと患者の余命についてである。診察前後の患者のスクリーニングに対する意志(1-15のリッカート尺度;スコアが低いほど意図が低いことを示唆する)をWilcoxonの符号付き順位検定を使用して比較した。

【結果】
45のPCPから75歳以上の患者90人(電話で依頼した対象患者の47%)が参加した。 患者の平均年齢は80.0歳(SD = 2.9)、43人(48%)が女性、平均寿命は9.7年(SD = 2.4)であった。37人のPCP(12人が地域密着型)が質問票に記載した。PCP32人(89%)はスクリプトが有用であると考えており、29人(81%)が頻繁に使用すると考えていた。また,35人(97%)のPCPが患者の余命に関する情報が役立つと考えていた。しかし、患者の余命について話し合うことに安心感を感じていると答えたPCPは8人(22%)にとどまった。大腸癌のスクリーニングおよびマンモグラフィ検査を希望する意志を表す患者は受診前から受診後にかけて減少した(大腸癌: 9.0 [SD = 5.3]~6.5 [SD = 6.0]、p < 0.0001,マンモグラフィー: 12.9 [SD = 3.0]~11.7 [SD = 4.9]、p = 0.08,大腸癌で有意に減少)。診察前に患者の63%(54/86)がPCPと余命について話し合うことに興味を持っていたが,診察後では56%(47/84)であった。

【ディスカッション】
研究に参加したPCPはがん検診の中止について話し合うためのスクリプトや患者の余命に関する情報が有用であると考えた。結果として,75歳以上の患者はCRC検診を受けようとする意識が低かった可能性がある。
【Translational Significance(現場に適用できる本研究の意義)】
ガイドラインでは、平均余命が10年未満の高齢者にはがん検診を行わないことが推奨されているが、患者にとって有害性が有益性を著しく上回るためである。しかしながら、PCPが高齢者とがん検診の中止について話し合うことはほとんどない。この研究では、PCPが高齢患者の10年後の余命に関する情報およびがん検診の中止について話し合うためのスクリプト(台本)が有用であることが明らかになり、この介入を使用することで、余命が短く、有益な可能性がほとんどない高齢者ががん検診を受けようとすることが少なくなる可能性があることが明らかになった。さらに、本研究では、56%の高齢者が10年後の余命についてPCPと話し合うことに興味を持っていることが明らかになった;しかしながら、10年後の余命について高齢者と話し合うことに快感を感じているPCPはほとんどいなかった。

 

【開催日】2020年10月7日(水)

思春期の主観的心身症状の軽減に及ぼす学校ベースの家庭と連携した生活習慣教育の効果:クラスターランダム化比較試験

-文献名-
Junko Watanabe, Mariko Watanabe, et al.
Effect of School-Based Home-Collaborative Lifestyle Education on Reducing Subjective Psychosomatic Symptoms in Adolescents: A Cluster Randomised Controlled Trial. PLOS ONE. October 25, 2016. DOI: 10.1371/journal.pone.0165285

-要約-
背景 
 思春期は、思春期及それ以降の人生の、肥満[1-3]、メタボリックシンドローム[4]、および有害な心理学的(心身症または精神医学的)症状[5,6]などの潜在的な慢性的な健康問題を、改善または予防するためのいい機会であり、人生の重大なステージである[7]。肥満を予防するためのライフスタイルの改善方法に関する、学校ベースのクラスターランダム化比較試験が、西欧では数多く行われているが、アジアではほとんど行われていない。
 また、肥満だけでなく、精神衛生上の問題も、世界中の子どもおよび青年の10~20%に見られると報告されている[15]。思春期のライフスタイルと主観的心身症状(SPS)スコアとの関連が報告されているが [16,17]、思春期のライフスタイルを変えるための介入がSPSスコアの改善に有効かどうかを検証した研究はほとんどない [18,19]。日本で、SPSスコアの悪い人が急速に増加していることを考慮すると[20]、日本の思春期の青少年に広く用いることのできる、効果的な生活習慣と行動の介入プログラムを開発することが重要である。
そこで我々は、思春期の青少年の不良なSPSスコアを改善するために、学校ベースで家庭とも協働した生活習慣教育プログラム(Program for ADOlescent of lifestyle education in Kumamoto, PADOK)を開発した。PADOKの設計は、先行研究[9, 21-25]で述べられた戦略に基づいており、各食事時の栄養摂取量を評価することで習慣的な食事摂取量を評価するために開発されたFFQW82食物頻度調査票を用いた評価によって、自発的に思春期の生活習慣を変え、食習慣についてのフィードバックを提供することを目的とした[22,23]。家庭での協力支援を加えることで、好ましい効果が得られる可能性がある。

方法
 思春期の生徒を対象としたPADOKの主観的精神身体症状(SPS)の改善に対する有効性を検討した。

【研究デザイン】個々の中学校を配分単位とし、個々の参加者を分析単位とした2アーム型の学校ベースの2群並行クラスター比較対照試験。

【対象】熊本県の19の中学校から募集された、中学1〜2年生の生徒(12~14歳、n=1,565)を研究対象とした。体調不良などで登校していない生徒や、参加したくない生徒は除外した。

【ランダム化、盲検化など】
PADOKグループとコントロールグループには無作為化リストを用いてpermuted-block法で割り付けた。介入の特徴上、被験者への盲検化はできなかったが、評価者には盲検化していた。

【介入】介入は、2013年5月から2014年1月まで、保健の授業中に行われた。
<PADOKプログラム>:Figure 2参照。FFQW82を用いた食事摂取量の評価に基づき、思春期の生徒の不良なSPSを改善させる目的でPADOKプログラムが実施された。PADOKの介入は、6回の教室での授業、5回の生徒と保護者による対話型の宿題計画、授業と宿題のためのテイラーーメイドのテキストブック、そして6ヵ月に4回の学校通信で構成されていた。
<通常ケア>:通常の学校プログラム(対照群)の生徒は、通常のカリキュラムに従って学校が提供する健康教育セッションに参加した。セッションは、FFQW82を用いた食生活評価のために外部から招聘した講師によって提供された。通常のケアとは、参加している各学校で日常的に教えられている食事および/または運動に関する既存の健康カリキュラムであった。 Figure 1, 2

【栄養士・学習支援補助者の研修】
 栄養士である試験指導者によって行われた。研修は終日(8~10時間)、試験管理センターで行われた。研修期間中、介入の根拠が説明され、各レッスンと宿題が対話的に議論された。
訓練を受けた4人のファシリテーターが、登録栄養士と一緒に各セッションを指導した。ファシリテーターは、少なくとも関連分野の大学の学部卒、適切な専門職歴、または思春期の子どもたちとの関わりの経験を有していた。すべてのセッションにおいて、介入はファシリテーターの観察下で行われた。

【アウトカム測定】
質問紙をベースライン時と介入6ヶ月後の時点で、学生に記入してもらった。
<プライマリアウトカム>SPSスコア。SPS質問紙は9つの症状(疲労感、頭痛、倦怠感、イライラ、集中力低下、意欲低下、朝の目覚めの悪さ、胃腸の不調、肩こり)から構成されている。各症状の経験の有無については、「0 = 一度もない」、「1 = まれに」、「2 = 時々」、「3=よくある」、「4=いつもある」 をリッカート尺度で測定し、9 項目のカテゴリ値の合計として SPS スコア(0-36 点)を算出した。SPS、SPS-Dともに、スコアが高いほど症状が悪い。
<セカンダリーアウトカム>学校生活の楽しみ、BMI、食事摂取量などの生活習慣因子をFFQW82で評価した(Table1参照)。FFQW82 は 82 種類の食品リストから構成されており、各食事(朝食、昼食、夕食)ごと、食品群ごとに、過去 1 ヶ月間の食生活を算出することができる。

【解析】
ベースラインでの試験群間のバランスを評価するために記述統計を用いた。クラスター無作為化が成功していることを確認するために、介入群と対照群の差の有意性をカイ二乗検定とt検定を用いて検討した。一次効果は、PADOK群と対照群のSPSスコアのベースラインから6ヵ月間の変化の差を計算することで評価した。一次分析は、intention to treat(ITT)で実施された。解析には最尤法を用いた線形ランダム効果混合モデルを用いた。連続変数の分析には、制限付き最尤法を用いた一般的な線形ランダム効果混合モデルを用いた。介入の効果を調べるために、アウトカム尺度を粗モデル(モデル1)、ベースライン値で調整したモデル(モデル2)、多変量データで調整したモデル(ベースライン、性、年齢、BMIで調整した)(モデル3)を用いた。
セカンダリーアウトカムについては ITT/LOCF 法を用いて二次解析を行った。感度解析は、ITT/LOCF の SPS-D スコアの解析を含む事前に決定された基準に従って、全データセットから特定されたプロトコルセット(PPS)を用いて、一次アウトカムと二次アウトカムの感度解析を行った。二次アウトカムについては、一般化線形ランダム効果混合モデル(ロジスティックモデル)を解析に使用し、関連性をオッズ比とその95%信頼区間(CI)で示した。
結果
【ベースライン】
Figure1参照。
参加19校はPADOK群(10校)と対照群(9校)に無作為に割り付けられた。登録された生徒数は1,509名であった。6ヵ月後、1,420人の参加者が身長、体重、SPS、生活習慣因子、食事摂取量(FFQW82)の最終評価を完了した。
Table1は、PADOK群と対照群に割り付けられた参加者のベースライン特性を示している。
SPSスコアのクロンバッハα係数は0.88であった。ベースライン時のSPSスコアはPADOK群23.2(3.9),対照群22.8(6.6)であった。ベースライン時の各測定された生活習慣因子とエネルギー摂取量(kJ)を持つ参加者の割合は、両群間で大きな差はなかった。ベースライン時の「1回の断食あたりに消費された野菜」については、介入群と対照群の間に統計的に有意な差(P = 0.012)があった。対照群では、介入群よりも高い頻度で習慣化していた。

【プライマリアウトカム】
ITT/LOCF解析で評価した6ヵ月後のSPSスコアのベースラインからの平均変化量は、粗平均差ではPADOK群が対照群に比べて有意に減少した(-0.95、95%CI-1.70~-0.20、P = 0.016)。SPSスコアの減少(すなわち、負の変化)は、対照群と比較して介入群のSPSの改善を示している。ベースライン調整値(-0.72、95%CI -1.48~0.04、P = 0.063)およびマルチバリアート調整値(-0.68、95%CI -1.58~0.22、P = 0.130)のベースラインからの平均変化は、同様の方向性を示したが、有意ではなかった(表2)。ITT/MI法で得られた結果もこれらと同様であった。SPS-Dスコアについては、粗値、ベースライン調整値、マルチバリアート調整値でベースラインからの平均変化が有意であった。また、感度分析では、各分析とも同様の結果が得られた。

【セカンダリーアウトカム】
PADOK群では、ITT/LOCF分析の結果に応じて、測定された生活習慣のいくつかが改善された。これらの改善(モデル2およびモデル3ではオッズ比[OR]<1)が会ったのは、「学校生活を楽しむ」(OR [95%CI]:0.55 [0.33~0.92]、P=0.022、0.52[0.33~0.84]、P=0.008)、「朝食1回あたりの主食消費量」(0.69[0.50~0.96]、P=0.028、0.68[0.48~0. 65])、「朝食あたりの主食消費量」(0.69[0.50~0.96]、P=0.025)、「朝食あたりの野菜消費量」(0.65[0.45~0.93]、P=0.018)であった。モデル3のものは、これと同様であった(表3)。 感度分析(PPS分析)で得られた結果は、上記とほぼ同様の結果が得られた(表3、表4参照)。また、FFWQ82で評価した食事摂取量については、PADOK群と対照群との間に有意な差は認められなかった。 ディスカッション  PADOKの介入プログラムは思春期のSPSスコアの改善に有効であることが示唆された。また、学校生活の主観的な楽しみ、主食、主菜、主菜、朝食時に消費される野菜の1日の摂取量の増加など、いくつかの生活習慣の改善も観察された。  私たちの調査結果は、定期的に朝食を食べた学生は、学校でより良い行動を取り、そうでない人よりも仲間とうまくやっていく可能性が高いことを報告した先行研究のものと一致していた [33]。瞑想、リラクゼーション、レクリエーション、自然の中での時間など、治療的なライフスタイルの変化の多くは楽しいものであり、それゆえに自立した健康的な習慣になる可能性がある [34]。  PADOK群の生徒の先生方が生活習慣教育の重要性についての考え方を変え、一般授業での改善を目指していた可能性は否定できない。そうであれば、それはPADOK介入の副次的効果と考えることができる。PADOKがSPSの低減と健康促進のための生活習慣行動の促進にどのような効果があるのか、その詳細なメカニズムを明らかにするためには、さらなる研究が必要である。 強みと限界  我々は、介入に生徒の保護者を参加させることが重要であると考えた [38]。これを達成するために、生徒はPADOKプログラムから得た知識を保護者と話し合うように求められた。家庭での協力的な支援を含めることは、好ましい効果を得るのに役立つかもしれない。思春期の生徒の身体活動介入に関する以前のクラスター化RCTでは、親の支援を含む介入により、学校関連の身体活動の自己報告が増加した [12, 39]。我々の研究では、生徒、その保護者、登録栄養士の間の情報交換に教科書を使用した。教科書のノートを利用することで、3 者間での自由な情報交換が可能であった。このように、3者間での共通理解が生まれることが期待された。 本研究にはいくつかの限界があった。第一に、PADOKプログラムの成功は管理栄養士のスキルにある程度依存していることである。この問題に対処するために、我々は登録管理栄養士が無作為化試験開始前に行うトレーニングプロセスを開発した。また、SPSの自己申告による評価に依存し、診断的な相互評価は行っていない。したがって、SPSの状態に重要な変化があった可能性がある。  第三に、結果の一般化可能性については、熊本県の日本人中学生に限定した。また、当初 178 校に参加を依頼したところ、19 校が参加に同意し、残りの 159 校は参加を辞退した。その理由として最も多かったのは、「カリキュラムが既に決まっていて変更できない」というものであった。そのため、本試験に含まれるサンプルセットは、平均よりも革新的な学校を過剰に代表している可能性があり、バイアスのリスクがあると考えられる。しかし、無作為化を実施したので、リスクが存在することは否定できないが、バイアスのリスクは小さい。利用可能なデータ[20]によれば、熊本の生徒の健康状態や活動状況は日本の平均的な青年期と大差がなかったことを考えると、この結果は日本の他県の一般的な青年期にも当てはまる可能性がある。第四に、介入期間は6ヶ月であったが、より長期の介入は児童生徒の精神衛生を改善することが明らかにされている[40]。さらに、健康行動介入がメンタルヘルスのアウトカムに「波及効果」を持つ可能性があるという証拠も出てきており[41, 42]、これも考慮すべきである。PADOKプログラムの長期的な効果と費用対効果を評価するためにはさらなる研究が必要である。第5に、クラスタランダム化が成功したことを確認するために、介入群と対照群の間のベースライン値の差を調査した。いくつかの変数が有意な差を示したが、ランダム化の性質上、これらの差は偶然に生じたものである可能性があると考えられる。最後に、LOCF法を用いて欠落アウトカムを推定した。介入群と対照群のフォローアップまでの喪失率は同程度であった(それぞれ40[5.0%]、49[4.9%])。 結論   これまでのところ、日本の青年期に生活習慣の介入を行うことが不良なSPSスコアの改善に及ぼす効果については、クラスターRCTからのエビデンスが不足していた。我々の試験は、この文献のギャップを埋めるものである。その結果、熊本の中学校で実施された生活習慣介入プログラムは、青年のSPSスコアを改善し、朝食時に主食、主菜、野菜を毎日定期的に摂取し、学校生活の楽しみが増えたと報告する参加者の割合を増加させたことが示された。この試験集団はPADOKプログラムのアドヒアランス率が中程度に高いことを示しており、これは、より広範な学校ベースの家庭での共同実践においてPADOKプログラムが実現可能であることを示す重要な指標である。本研究は、熊本地域の児童生徒のみならず、日本の青少年全般を対象とした生活習慣教育介入を設計する上で有用な情報を提供するものである。 JC20201007柏﨑1

JC20201007柏﨑2

JC20201007柏﨑3

JC20201007柏﨑4

JC20201007柏﨑5

【開催日】2020年10月7日(水)

肺癌スクリーニングによる死亡率の低下

※この時期のUpToDateにある”What’s new in family medicine”のTopicで参考にされている文献です。

―文献名-
H.J. de Koning. Reduced Lung-Cancer Mortality with Volume CT Screening in a Randomized Trial. NEJM. 2020 Feb 6; 382(6): 503-513.

―要約-
Introduction
肺癌は癌による死亡の主要な原因であり、診断の時点で約70%進行癌、5年生存率は15%と低い。喫煙率は低下しているものの、いまだに成人の17-28%は喫煙者で、タバコ関連疾患の問題は深刻である。
NLST(米国の肺スクリーニング試験)では、肺癌の高リスク者においてXpとCTによる肺癌クリーニングを比較したところ、CT群で肺癌死亡率が20%低いことがわかっているが、その他に肺癌スクリーニングと死亡率の関連を示す研究はない。
2000年に開始されたNELSON試験(オランダ・ベルギーの肺癌スクリーニング試験)は、高リスク者を10年間追跡した低線量・ボリュームスキャンCTによるスクリーニングが肺癌発生率・死亡率などを減少させるかを調べた研究である。
Method
研究はエラスムス大学医療センター、グローニンゲン大学医療センターが行っており、スクリーニングの参加機関は4つの大学や医療センター(UMCG, University Medical Center Utrecht, Spaarne Gasthuis, and University Hospital Leuven)である。
参加者は喫煙が15本x25年以上もしくは10本x30年以上とした。
Current smoker;2週間以内の喫煙歴がある人
Former smoker;過去10年以内に禁煙した人
除外基準は中等症〜重症の基礎疾患があり2階へあがれないような人、体重140kg以上、過去の腎癌・悪性黒色腫・乳癌、過去5年以内の肺癌の診断・治療、過去1年のCT検査を受けた人である。
女性で上記の基準を満たす参加者は少なく男性に焦点を当てる研究となった。
50歳から74歳までの合計13,195人の男性(一次分析)と2594人の女性(サブグループ分析)が無作為に割り当てられた。→table1
2004年1月から2012年12月までの間で、4回の低線量CTスクリーニング(開始時、1年目、3年目、および5.5年目)を受けた人と、スクリーニングを受けなかった人とを比較した。

追跡期間は5, 7, 10-11年で行った。
肺癌特異的な死亡率を特定するために、死因を特定する臨床専門家委員会が設立され、専門家委員会の認証によって死亡が肺癌であることが結論づけられた。ランダム割付時から肺癌の診断、肺癌による死亡、その他の原因よる死亡を記録した。

JC202009佐野

Results
参加者は前述table1(下記)へ。群間の特性には有意差なし。男性参加者は計13195人で、6538人のスクリーニング群と6612人の対照群に割り当てられている。
CTの実施率は平均90%程度。Indeterminate test(不確実な検査?)では追加検査を行い、55%の結節が解決、最終的に2.1%が検査陽性となった。呼吸器科での精密検査にて合計203件が肺癌と診断され、スクリーニングの陽性率は43.5%であった。
JC202009佐野2

Fig.1 Aは追跡期間および試験グループごとの肺がんの累積発生率であり、10年間でスクリーニング群で5.58例/1000人年、対照群で4.91例/1000人年であった。
Table3より、スクリーニング群ではstage1A/1Bが58.6%と多かったことに比較して、対照群では13.5%だった。Stage4の肺癌はほぼ半数の参加者で診断されているが、スクリーニングで検出されたのは9.4%であった。ほとんどが腺癌だった。
Fig.1Bは10年間での累積死亡率であるが、10年間のフォローアップでの肺癌による死亡はスクリーニング群で156人(2.50人/1000人年)、対照群で206人(3.30人/1000人年)であり、10年後の肺がんによる累積死亡率は、対照群と比較してスクリーニング群で0.76(95%信頼区間[CI]、0.61〜0.94; P=0.01)であった。
JC202009佐野2

JC202009佐野4

Discussion
本試験では、スクリーニング間隔が時間経過とともに伸びているにもかかわらず、高リスク喫煙者の肺癌死亡率が大幅に低下する結果となった。スクリーニングの受診率は高く、男性の87.6%が3回のスクリーニング検査を受けた。また、発見時の肺癌の多くが初期段階であったため、外科的治療などの根治術の適応が増えた。
女性を対象としたサブグループ分析でもCTによるスクリーニングは肺癌死亡率に対して良好な結果が得られた。
大量のサンプルサイズを要するため、全死因では有意差を示すことはできなかったが、肺癌以外の死因に関してはスクリーニング群と対照群で有意差はなかった。
肺癌スクリーニングにおける過剰診断は課題の一つである。10年で19.7%の過剰診断がみられた。
 将来的にはスクリーニングの適応になる高リスク患者の選択がより洗練されることで、CTによる肺癌スクリーニングのメリットが増すであろう。

【開催日】2020年9月23日(水)

救急部門の指導医コメントが研修医の仕事量に与える影響:J(^o^)PAN無作為化比較試験の結果から

―文献名-
Kuriyama A et al. (2016) Impact of Attending Physicians’ Comments on Residents’Workloads in the Emergency Department: Results from Two J(^o^)PAN Randomized Controlled Trials.
PLOS ONE 11(12): e0167480.

―要約-
目的
救急部門は迷信が信じられる傾向にあり、先行研究では満月の夜や13日の金曜日の受信が増加したかなどの調査が行われている。
また文献的には指摘がないが、一般的には「今日は平和だね」「静かな当直になるといいね」という元気なコメントを指導医がすると、突然救急部門が忙しくなるというジンクスが蔓延しているため、指導医からの明るい元気付けるコメントは控える傾向になっている。そこで今回は指導医からの日直帯の救急外来に景気付けのコメントがあるかないかで、救急部門で働く研修医の仕事量がどうかを検討する。その結果、ジンクスが否定された場合は、指導医と研修医でより良い会話ができることが期待される。

方法
倉敷中央病院(1131床の3次医療機関)の救急部門の平日9時から17時の救急外来(J(^o^)PAN-1試験)そして14時から22時までの救急搬送患者(J(^o^)PAN-2試験)のいずれかを診察した25名の研修医を対象として、単施設における2つの並行群、評価者盲検、無作為化試験としてCONSORTガイドラインに沿って実施した。結果に影響しないように研究委員会によって参加同意書は破棄され、研修医には未告知で研究は進められ、研究終了後に研究計画書が公開された。
参加した研修医は “今日は平和だといいね、今日は静かな日になるといいね”などのコマンドを乱数発生器を元に無作為に受け取ったこの研究を知っている6名の救急指導医から、コメントもらった群(介入群)とコメントを受け取っていない群(介入群)に割り付けられた。両試験は2014年6月から2015年3月まで実施され、研修医は、勤務中に診察を受けた患者数、シフトの忙しさや難易度についてアンケートが毎回救急シフト開始時に配布され、5ポイントのLikert尺度で評価し、救急部門の秘書がシフト後にアンケートを回収し、独立した別の指導医がデータセットを作成し、もう一人の医師がデータを分析した。統計解析はWilcoxon順位和検定を使用し、介入群と対照群の間でその他のアウトカムを比較するためにスチューデントのt検定を使用した。研修医への潜在的な学習効果やメッセージの経時的な鈍化効果を除外するために、主要アウトカムについて、各2ヵ月間の最初の10回のシフトで感度分析を行った。すべての統計検定は両側一致で、有意水準はp<0.05であった。すべての解析はStata v.11.2(StataCorp, College Station, TX, USA)を用いて行った。

結果
J(^o^)PAN-1試験では合計169件がランダム化され(介入群81件、対照群88件)、J(^o^)PAN-2試験では178件(介入群85件、対照群93件)がランダム化された。
J(^o^)PAN-1試験では、診察した救急外来患者数(それぞれ5.5人と5.7人、p=0.48)、研修のスケーリングによるシフトの忙しさ(2.8人対2.8人、p=0.58)、または経験したシフトの難易度(3.1人対3.1人、p=0.94)に差は認められなかった。しかし、J(^o^)PAN-2試験では、忙しさ(2.8対2.7;p=0.40)と難易度(3.1対3.2;p=0.75)は群間で同程度であったが、介入群の方が対照群よりも多くの転院患者を診察した(4.4対3.9;p=0.01)。

J(^o^)PAN-1試験では、ストレス(それぞれ2.8対2.9;p=0.40)、食事時間(17.2分対17.3分;p=0.98)、または疲労(3.0対3.0;p=0.85)において、介入群と対照群の間に有意差は認められなかった。さらに、入院数(10.4対10.6;p=0.70)または救急部門を受診した外来患者数(中央値、31対32;Wilcoxon p=0.98)には有意差は認められなかった。J(^o^)PAN-2試験では、ストレス(それぞれ3.0対2.9;p=0.61)、食事時間(15.6分対15.3分;p=0.82)、または疲労(2.9対2.9;p=0.95)において、介入群と対照群の間に有意差は認められなかった(表2)。さらに、入院患者数(14.1対14.0;p=0.86)または転院患者数(中央値、11対12;Wilcoxon p=0.68)には有意差は認められなかった。

結論
指導医からの激励コメントは、救急部門で働く研修医の仕事量への不吉な効果は最小限であった。

 

【開催日】2020年9月23日(水)

2段階うつ病スクリーニング戦略 (2020年6月)

※この時期のUpToDateにある”What’s new in family medicine”のTopicで参考にされている文献です。

―文献名-
Levis B, Sun Y, He C, et al. Accuracy of the PHQ-2 Alone and in Combination With the PHQ-9 for Screening to Detect Major Depression: Systematic Review and Meta-analysis. JAMA. 2020;323(22):2290.

―要約-
重要性:
Patient Health Questionnaire depression module(PHQ-9)は、うつ病の検出と重症度の評価に使用される9項目の自己記入式検査である。Patient Health Questionnaire-2(PHQ-2)はPHQ-9の最初の2項目(抑うつ気分と無気力の頻度を評価する)で構成されており、PHQ-9の評価を受ける患者を特定する最初のステップとして使用することができる(Table1)。

JC202009黒木1

目的:
大うつ病を検出するためのPHQ-2単独およびPHQ-9との併用の精度を評価する。DATA SOURCES MEDLINE、MEDLINE In-Process & Other Non-Indexed Citations、PsycINFO、Web of Science(2000年1月~2018年5月)。DATA SOURCES MEDLINE、MEDLINE In-Process & Other Non-Indexed Citations、PsycINFO、Web of Science(2000年1月~2018年5月)。

研究選択:
対象となるデータセットは、PHQ-2スコアと有効な診断面接による大うつ病診断とを比較した。

データの抽出と解析:
半構造化面接、完全構造化面接、ミニ国際神経精神科面接を用いた研究におけるPHQ-2単独、PHQ-9と組み合わせたPHQ-2に対して、半構造化面接を用いた研究のPHQ-9単独の感度と特異度を推定するために、二変量ランダム効果メタアナリシスを行った。 PHQ-2のスコアは0~6、PHQ-9のスコアは0〜27であった。

結果:
対象となる136件の研究のうち100件(44 318人、大うつ病患者4572人(10%)、平均年齢49 [17]歳、女性59%)から参加者の個人データを得た(Figure1、Table2)。

JC202009黒木2

JC202009黒木3

半構造化面接を用いた研究では、PHQ-2の感度と特異度(95%CI)は、カットオフスコアが2以上で0.91(0.88-0.94)と0.67(0.64-0.71)、3以上で0.72(0.67-0.77)と0.85(0.83-0.87)であった。感度は、半構造化面接と完全構造化面接で有意に高かった。特異性は面接の種類によって有意差はなかった。ROC曲線の下面積(AUC)は、半構造化面接では0.88(0.0-0.89)、完全構造化面接では0.82(0.81-0.84)、MINIでは0.87(0.85-0.88)であった。サブグループ間に有意差は認められなかった(Table3)。

JC202009黒木4

半構造化面接では、PHQ-2が2点以上、PHQ-9が10点以上の感度(0.82 [0.76-0.86])は、PHQ-9が10点以上の単独面接(0.86 [0.80-0.90])と比較して有意差はなかったが、特異度は有意ではあったがわずかに高かった(0.87 [0.84-0.89] vs 0.85 [0.82-0.87])。AUCは0.90(0.89-0.91)であった。この組み合わせにより、PHQ-9の全項目を完了する必要のある参加者数を57%(56%-58%)減少させることが推定された(Table4)。

JC202009黒木5

本研究の強みは、サンプル数が多いこと、すべての研究(発表された研究だけではなく)のすべてのカットオフ値の結果が一致していること、PHQ-2の精度を基準値と参加者のサブグループ別に分けて評価していること、そして、これまでメタアナリシスでは行われていなかったPHQ-2とPHQ-9の組み合わせの評価などである。

Limitation:
第一に、公表されている131件の適格データセットのうち36件(27%)の一次データが含まれていないことである。第二に、サブグループを考慮するとほとんどの場合で改善されたが、研究間では中程度の不均一性があった。これは、精神科以外の医学的診断の有無に関するデータが40%の参加者では得られず、特定の診断についてはより高い割合で欠落していたためであり、また、多くの国や言語を代表する一次研究が少なかったためである。第三に、多くの研究では、すでにうつ病と診断されているか治療を受けている可能性のある参加者を明示的に除外していないが、現在診断されていないか治療を受けていないことが確認された参加者の分析と、これらの情報がない参加者を含むすべての参加者の分析では、統計的に有意な差はなかった。第四に、個々の参加者データのメタアナリシスにおける研究は、実施された面接に基づいて分類されているが、面接が必ずしも意図した方法で使用されているとは限らない可能性がある。半構造化面接を使用した48件の研究のうち、典型的な基準を満たさない面接官を使用した研究が3件、不明確と評価された研究が11件であった。資格のない面接官を使用したことで、基準となる基準カテゴリー間の精度推定値の差が減少した可能性がある。第5に、QUADAS-2のすべての領域においてバイアスのリスクが低いと評価された研究はほとんどなかったため、すべての評価が低い研究のみを用いた感度分析は実施されなかった。

結論と関連性:
PHQスコアと大うつ病診断を比較した研究の参加者データのメタ解析では、PHQ-2(カットオフ2)とPHQ-9(カットオフ210)の組み合わせは、PHQ-9のカットオフスコアが10以上の単独の場合と比較して、感度は同等であったが特異度は高かった。この組み合わせによるスクリーニングの臨床的・研究的価値を理解するためには、さらなる研究が必要である。
JC202009黒木6

【開催日】2020年9月2日(水)