今にも落ちて来そうな空の下で

ジョジョと感染症とその周辺についてのブログ. タイトルは「ジョジョの奇妙な冒険」第59巻(集英社)より

非劣性試験の解釈について

最近開発された抗菌薬はほとんどが既存の薬に非劣性を検証されているので,感染症治療に携わる人は,非劣性試験について少しは勉強しておく必要があると思います。

3年ほど前に書いた「感染症医のための非劣性試験の読み方」シリーズは,今読み返してみてもそれほど内容が古くなっていないと思います。

第1部
第2部
第3部

さて,今回紹介する論文は,非劣性試験は解釈が難しいというものです。NEJM,Lancet,JAMA,BMJ,Annalsといういわゆる五大誌に2011年から2016に掲載された非劣性試験についてCONSORT声明に基づいて結果と結論が示されているかどうかが検証されています。

上で紹介したKANSEN JOURNALにも書きましたが,

「いったん非劣性が示されれば、事前に優越性を示す検定または信頼区間を定義しておいて、ITT解析を用いて優越性を主張することは許容される。」

は,noninferior(劣っていない)の中にsuperior(優れている)が含まれるので,αエラーを増大させないので,統計学的にはOKになっています。でも,なんとなく個人的に違和感があるなぁと思っていました。その違和感の正体がこの論文を読んで少し分かったような気がしました。

 すなわち,非劣性試験でなければinferior(劣っている)になるのに,非劣性試験では,not noninferior (inconclusive)(劣っていないとは言えない)になってしまう(論文中,Figure 1の7のような場合)不公平感からくるのかもしれないと思いました(superiorならsuperiorって言っちゃうのに)。

 これは非劣性デザインの非対称性によると思います。Figure 5のようにNew treatmentとActive controlをひっくり返すと,結論が変わってしまいます。この著者らはひっくり返してみて,どちらかがsuperiorになったらそう記載することを提案しています。一見理にかなっているような気もしましたが,よく考えてみるとこれはこれで問題がありそうです。

 非劣性試験の前提として,新しい治療が既存の治療よりも侵襲が少なかったり,お手軽だったり,コストが安かったりということがあります。メインの薬効とは別にそういうメリットがあるからこそ,新しい治療にゲタを履かせて評価しましょうということです。なので,単にひっくり返して仮に有意に劣っていたということがわかったとしても,その他のメリットを勘案すれば,実際にどちらを選ぶかは状況次第,好み次第ということになります。まあ,この前提が守られていない場合もあるので,その場合は論外なんですけど。

 例えば,ひっくり返すと結果が変わる例として挙げられている,Uncomplicated Acute Appendicitisに対する抗菌薬 vs 虫垂切除のRCT(JAMA. 2015;313(23):2340-2348. )は,非劣性マージン24%で,プライマリエンドポイントのリスク差が−27.0% (95% CI, −31.6% to ∞) (P = .89)なので,論文の結論はnot noninferior(劣っていないとは言えない)ですが,ひっくり返すと虫垂切除の方が absolute difference = 27%; 95% CI 21.3–32.9%でsuperior(手術が有意に優れている) になると。でもこれって約7割の人が手術を回避できるということでもあります。3割くらいは1年間のうちに結局手術が必要になるかも,ということを承知で,まずは抗菌薬治療で様子をみたいという人はいてもいいと思います(個人的には虫垂炎として治療され,実は虫垂癌で,後々結構大変だったという人をみたことがあり,できれば手術した方がいいんじゃないかなぁと思ったりもしますが,まあ稀は稀なのであまり一般化しない方がいいかもしれません)。

また,クラミジア感染のアジスロマイシン1回 vs ドキシサイクリン1週間のRCT(N Engl J Med 2015; 373:2512-2521)も両側95%信頼区間で計算すると,inconclusiveという論文中の結論から新治療(アジスロ)が有意にinferiorになる例として挙げられています。これもSTDという病気の性質上,1回で治療完遂できるというメリットを勘案すると単純にひっくり返すと結論が変わるとは言いがたいのではないかと思います。

ということで,非劣性試験は難しいですね,というお話でした。ただ一つ言えるのは,非劣性試験で検証する前提条件の手軽さ,低コスト,低侵襲(ざっくりとしたイメージは「早い,安い,うまい」)などのどれかがなければ非劣性試験自体の意味がないので,倫理委員会はちゃんとチェックして欲しいなと思います。

急性喉頭蓋炎のvallecula signの診断精度検証研究

急性喉頭蓋炎の頸部X線の所見にvallecula signというのがあります。
急性喉頭蓋炎の診断について,感度98.2%,特異度99.5%と報告されています(Ann Emerg Med. 1997;30:1–6.)が,この報告は対照群が外傷患者や異物の存在が疑われた患者で,いわゆるケース・コントロール型(two-gate)の診断研究なので,診断精度を過大評価している可能性がありました。

「かぜ診療マニュアル 第2版」でもまだ外部検証がされていない,と書いてしまいましたが,2015年に倉敷中央病院から報告されていることに気づきました(調べたつもりだったのですが,調べ方が悪かったようでお恥ずかしいです)。

倉敷中央病院での喉頭蓋炎疑い患者(single-gate study)に対する頸部側面X線のthumb singとvallecula signの診断精度研究です。2011年から2013年にかけて105例を前向きに検証しています。
thumb sign またはvallecula signのどちらかが異常の場合の急性喉頭蓋炎に対する感度は81.0% (64.2 to 97.7) ,特異度は85.7% (78.2 to 93.2), 陽性尤度比は5.67 (3.27 to 9.82),陰性尤度比は0.22 (0.10 to 0.51)で,検査前確率が高い場合は,これだけでは除外しきれないということでした。

vallecula sign単独だと,感度71.4% (52.1 to 90.8) ,特異度88.1% (81.2 to 95.0),陽性尤度比 6.00 (3.21 to 11.20),陰性尤度比 0.32 (0.17 to 0.62)でした。

ただし,人工的な気道管理の適応になるようなグレード3の急性喉頭蓋炎については,全例でthumb singとvallecula signのいずれかが異常になったという結果でした。

次回改訂(の機会があればですが)の際には,追記したいと思います。

言葉の滞空時間と,EBMに基づいた医療

 ある時,Wordの文書校正が「最後の切り札」を重ね言葉として指摘してきました。「えっ?」と思って調べると確かに「切り札」に最後という意味があるので重ね言葉になるようです。ただし,同時に以下のような意見もありました。

「作家の井上ひさし先生も次のように言っています。
同じような言葉を並べて言葉の滞空時間を長くして印象付ける、語呂のよさや言い易さを作り出すために重複した語を並べることがある。重複表現は間違いではない、むしろ積極的に取り入れて、意味をしっかり伝えるべきだ。」

 井上ひさしさんが実際にそういうことを言っていたかどうかまでは確認できていませんが,状況によっては使ってもいいのかもしれません。

 そういえば,「EBMに基づいた医療」という言葉が使われることがあって,EBMがEvidence-based Medicineだから,「EBMに基づいた医療」はEvidence-based Medicine-based Medicineになってしまいます。そういう言葉を使う人はEBMが何の略なのかご存じないのではないか?と内容の信頼性まで損なってしまうような偏見を持っていましたが,あれも実は言葉の滞空時間を長くして印象づけるためのものだったのかもしれません。つまり,「基づいている感」を印象づけたい,圧倒的基づいてる感!,悪魔的基づいている感を!

結核の血液検査ができないと結核は診断されにくいのか?

先日,某市ではクリニックで結核の血液検査ができないので,結核が診断されにくいのではないか?と書かれているものを読み,大変驚きました。
 ここでいう「結核の血液検査」というのは,おそらくクオンティフェロン(以下,QFT)やT-SPOTといったインターフェロンγ遊離試験(interferon-gammma release assay: IGRA)のことを指すと思われます。

 私の認識では,活動性結核の診断についてIGRAは補助的な役割しか持たないので,これができないからといって,活動性結核が診断されにくいかと言われると,どうかなぁ?と思います。

 というもの,結核の見逃しの原因でも最も多いのは,「結核を鑑別診断として思い浮かべていなかった」からだと思うからです(文献的裏付けがあるわけではありませんが,経験上そういうケースが多かったです。おそらく結核の診療経験がそれなりにある方には賛同してもらえるのではないかと思います)。

 IGRAを行おうと思っている時点で,ある程度結核を疑っているはずなので,IGRAが出来なくても他の方法で診断をつめていくことはできます。結核を疑っていないのに,なぜかIGRAの検査がされて,それが疑うきっかけになったというシナリオは,自分の知らない所でこびとが検査をオーダーしない限り,ないでしょう(研修医が勝手にオーダーしていた,とかならありかもしれません)。

 他の見逃しパターンとしては,結核を鑑別に考えていたにもかかわらず,誤った根拠で除外してしまうというのがあります。例えば,症状や画像所見などから結核を考えたものの,IGRA陰性を根拠に結核を否定してしまった,というシナリオが考えられます。

 活動性肺結核を疑った場合,診断上も感染管理上も最も大事なのは,喀痰塗抹,培養検査です。塗抹が陰性の場合は,隔離要件を満たしませんが,それでも肺病変があって疑わしい場合は,気管支鏡など更に検査が必要になってきます。この段階で,補助的にIGRAを行ってもよいかもしれませんが,IGRAが陽性の場合,気管支鏡をやらなくていいかというと,菌を捕まえるためにできればやった方がいいと思います。気管支鏡をやったら死んでしまいそうなほど弱っている人であれば,治療を開始する場合はあると思いますが,その判断はIGRAが陽性でも陰性でも実はあまり変わりません。このとき,IGRA陰性をもって結核を誤って除外してしまう方が大きな見逃しになりかねません。
 また,肺外結核を疑った場合は,当該部位の培養,生検が重要になります。髄膜炎,胸膜炎,腹膜炎,リンパ節炎など,培養や組織診断が重要です。とはいえ,これらの培養や組織診断が陽性になるのは必ずしも高くありません。そういう場合は,IGRAが補助診断として役に立つことはありますが,ここでもやはりIGRA陰性のみで除外できるほどIGRAの精度はよくありません。

 というのは,IGRAの現実世界での診断特性は当初考えられていたよりも高くないからです。活動性結核疑い患者を対象にした,IGRAの診断精度の系統的レビュー(Eur Respir J. 2011;37:100–11. )によると,

・QFT-GIT(日本でいうQFT-3Gと同じ)は,
統合感度 80% (95% CI 75– 84%) ,統合特異度 79% (95% CI 75–82%) 
・T-SPOT.TBは
統合感度81% (95% CI 78–84%) ,統合特異度 59% (95% CI 56–62%)
です。

 さらに,結核は高齢者やHIV患者,ステロイド投与患者など,細胞性免疫が弱っている人が罹りやすいという問題もあります。IGRAはざっくり言うと,細胞性免疫を利用して検査を行っているので,これらの患者さんでは陽性になりにくいのです。すなわち,結核に罹りやすい人は,IGRAが陽性になりにくいというジレンマがあります。
実際,低〜中所得の国のデータ(J INFECT DIS. 2011;204 Suppl 4:S1120–9.)ですが,HIV患者のIGRAの診断特性は

・QFT-GIT:
統合感度 60% (95% CI, 34% to 82%) ,統合特異度 50% (95% CI, 35% to 65%)
・T-SPOT.TB: 
統合感度 76% (95% CI, 45% to 92%),統合特異度 52% (95% CI, 40% to 63%)

と軒並み低いことがわかります。
高齢になればなるほど,QFTが陽性になりにくいという報告もあります(Eur Respir J. 2015;45:279–83.)。

 もっと高い感度や特異度を報告しているIGRAに関する系統的レビュー(例えばChest. 2010;137:952–68. )はありますが,対象集団が臨床的文脈とは乖離している研究を含んでいるという問題があります。例えば,結核の診断が確定している人と,対照群として健常人ボランティアを比較しているような研究です。新しい検査法を開発する場合に,カットオフ値を設定するために明らかに病気を持っていることがわかっている人と,明らかに病気を持っていない人を比べることはやむを得ないことですが,臨床的に使う場合とは対象集団が異なることは想像に難くないでしょう。
 現実世界では,「結核疑い」の人に検査をしたいのであって,すでに結核があると分かっている人と結核がないと分かっている人に検査をする意味はありません。

 また,IGRAの感度や特異度を測定するのは実は結構難しいです。結核が多い地域と少ない地域で行うと結構数値が変わってきます。感度や特異度は疾患固有の指標で,陽性的中率や陰性的中率と異なり対象集団の有病割合に依存しない,というのが教科書的な記載ですが,実際には有病割合が変わると疾患スペクトラムが異なり,これは感度,特異度に影響をもたらします(ここは若干難しい話なので,よくわからない場合は読み飛ばしてください。理論的なことはさておき,有病割合が異なる集団で診断特性を測定すると,研究によって感度,特異度が変わってくるというのはよく観察されています)。

 いずれのシナリオでも,結核を疑ってまずやることは,結核菌を捕まえにいく検査であって,IGRAではありません。クリニックでは結核を捕まえにいく検査はできないというご意見もあるかもしれませんが,それならしかるべき病院へ紹介するべきです。クリニックでのIGRAのみで活動性結核の診断が完結することはあり得ないと思います。
 潜在結核の診断が目的であれば,外来でも有用だと思いますが,活動性結核の診断とは全然話が変わってくるので,割愛します。

 ただ,IGRAの検査は検査前の処理や検査そのものの測定誤差の問題が結構あります。QFTのrepeatability(反復可能性)を調べた研究(Am J Respir Crit Care Med. 2013;187:206–11.)では,8%が初回判定と異なる結果になったというものもあります(ここでいうrepeatabilityはreproducibilityとは異なり,同じ検査室,検査者,機械など同じ条件下で結果が反復できるかどうかを意味します。reproducibilityは異なる検査室,検査者,機械でも再現できるかどうかを意味します)。
 私自身あまり詳しいわけではありませんが,採血後の採血管の混合のさせ方とか,採血してから検査開始までの時間などが結果に影響を与えるようなので,検査頻度の少ないクリニックで外注検査として行った場合,検査の精度の担保が難しくなるのではないかと思ってしまいます。
 
 日本ではBCGを接種している人が多いので,ツ反があてにならず,BCGの影響を受けない検査としてIGRAは期待されていました。が,当初報告されていた高い感度や特異度(検査キットの添付文書とかパンフレットに載っていたりする数字)は,前述のように結核感染が明らかな人と,結核感染が明らかにない人を比べたようなものが多く,過大評価されていた可能性があります。

 実際使ってみると,IGRAが活動性結核の診断に素晴らしく役に立った!と思うことはほとんどありませんが,肺外結核を疑っていて,なかなか菌が捕まらない時にIGRA陽性なら,ほんの少し治療に踏み切りやすいかなというくらいでしょうか。野球に喩えると送りバント的な意味合いです。

 日本結核病学会予防委員会によるインターフェロンγ遊離試験使用指針(結核. 2014;89:717–25.)によると,IGRAの適用は,

1 接触者健診
2 医療従事者の健康管理
3 発病危険が大きい患者および免疫抑制状態にある患者の健康管理
4 活動性結核の補助診断

の4つが挙げられています。決してIGRAだけで結核を診断したり除外したりしないように願います。

 IGRAが検査できないから,結核が診断できないというのは,送りバントが禁止されているから野球の試合に勝てないというようなものではないかと思います,というわかりにくい喩えで締めくくりたいと思います(ちなみに送りバントが有効な条件は非常に限られているそうです)。

 

咽頭炎に対するトラネキサム酸

少し前にLSHTM(ロンドン熱帯医学校)のIan Roberts先生のお話を聞く機会がありました。トラネキサム酸の外傷や産後出血における死亡減少効果を示したRCTを主導された方です。

外傷のCRASH-2 trial
論文はLancet. 2011;377:1096–101–1101.e1–2. 
https://www.ncbi.nlm.nih.gov/pubmed/21439633

↓に日本語訳がありました。
http://crash2.lshtm.ac.uk/CRASH2_Results_Japanese.pdf
↓に日本語で結果をまとめられたパワーポイントファイルがあります。
http://crash2.lshtm.ac.uk/TXAinTrauma_japanese.pptx 

産後出血のWoman trial
http://womantrial.lshtm.ac.uk
論文はLancet. 2017;389(10084):2105–16. 
http://womantrial.lshtm.ac.uk/wp-content/uploads/2017/04/compressed-for-website_WOMAN-1.pdf
出血による死亡はトラネキサム酸群1.5%,プラセボ群1.9%でリスク比0.8です。
NNTにすると1/0.004で250ですが,産褥婦が1人亡くなるということは大変なことなので,トラネキサム酸という安価な薬で効果があることが示されたことは非常に意義深いと思います。また,CRASH-2にしてもWoman trialにしても3時間以内の投与が効果的で,3時間を超えてからの投与になると逆に死亡リスクが増える可能性が示唆されています。これはDICの線溶系が優位のフェーズか,凝固系が優位のフェーズかの違いによるのだろうということでした。
DVTや肺塞栓,脳梗塞など塞栓系の副作用が増えないかどうかを懸念しますが,増えなかったようです。

私自身は,研修医時代におまじない的だなぁと思いながら使っていたトラネキサム酸の効果が示されたことに驚きと感動を覚えました。
そしてもう一つ驚きというか,不勉強だったことにトラネキサム酸の開発者は岡本彰祐先生・歌子先生ご夫妻によって開発されたということでした。

岡本歌子先生は最近までご存命だったようで(Wikipediaによると2016年4月にお亡くなりになったそうですが,90歳を過ぎても研究活動をなさっていたようでした),ネット上にインタビューなどもありました(これを読めばCRASH-2の論文が日本語訳されている理由がわかるかもしれません)。
 
コラム後半〜「神戸へ、そして歌子先生との出会い」
http://www.josei-ikyoku.jp/Charm/item_repo01a

という本も買ってみましたが,なかなかすごい本でした。
当時,女性が医師,医学研究者になるということは,想像を絶する苦労があったのだろうと思います。

さて,これを機会に,以前から疑問だった「咽頭炎に対するトラネキサム酸の効果」
について調べてみました。なぜか
・下記疾患における咽頭痛・発赤・充血・腫脹等の症状
  扁桃炎、咽喉頭炎
・口内炎における口内痛及び口内粘膜アフター
にトランサミン錠は保険適用があります。
以前調べた時に根拠になる論文が見つけられなかったので,「かぜ診療マニュアル」ではスルーしていました。
インタビューフォームをみると,という研究が根拠として引用されていました。そういえば以前調べた時はPubMedで英語の文献しか調べなかったので,こういうのもきちんと確認しないといけないなと思いました。
咽喉頭・口腔疾患におけるTranexamic acid(Transamin)の使用経験 -二重盲検法による. 臨床と研究. 1969;46:243–5. 

古い文献ですが,メディカルオンライン経由であっさり入手することができました。
double blindのRCTですが,「われわれは医局員まで盲目にして先入観念を除き」というパワーワードに時代を感じました。
作用機序は,抗プラスミン作用を介した抗炎症作用のようです。

急性咽喉炎,急性扁桃炎,口内炎を対象にというなんだか雑多な集団のように思えますが,有効だった割合(初診時に医師3人で自覚症状,他覚症状によって重症例,中等度症例,景趣例に分類し,4日後の判定日に再び医師3名,治療に当たった医師により軽快度を判定)は
T1












全体では有意差がついていますが,咽喉頭炎と扁桃炎はともかく口内炎は全く別の病気のような気がするので,一緒に解析するのはあまり釈然としないですが,図4をみると,確かにプラセボ群に比べて効果がありそうには見えます。医師の主観的な判断によるものですが,「医局員を盲目にして」まで判定したものですし。。。
F4


 











この症例数で確定的なことをいうのは難しいですが,副作用もそれほど大きなものはないようですし,使ってみても悪くないような気もしますが,症状緩和ならNSAIDsやアセトアミノフェンでもよいような気もします。
もしかすると止血効果と同様に,きちんと再評価すればもっと見直されてもよい薬なのかもしれませんね。知らんけど。
 

MRSAに対するバンコマイシンのMIC Creepは存在しない

「存在しない」ことの証明は難しいので,厳密にはMIC Creep現象の証拠を確認できなかった,


We have found no evidence of the MIC creep phenomenon.


ですが,最近のClinical Microbiology & Infectionに系統的レビューが出版されていました。

http://www.clinicalmicrobiologyandinfection.com/article/S1198-743X%2817%2930337-3/abstract


この問題,5年ほど前に調べた時は,以下のように,保存によるMICへの影響が大きいのではないかと思っていました(最近,アップデートしていなかったので,古くてすみません)。


J. Clin. Microbiol. 2012; 50: 318-325.によると

・凍結保存していた菌を起こしてきて検査すると,バンコマイシンについてはEテストでは,最初に分離された時のMICよりも保存していた方のMICが下がっていた。Broth Microdilution(BMD)ではこの影響は少なかった。

→経年的にMICが上がってきたというよりも保存の影響のせいで,昔分離された菌のMICが低くでたのかもしれない?

・自動測定機器(Vitek 2),Eテスト,BMDといった,MICの測定方法によってもこの傾向は一致しない


・保存によってバンコマイシン,ダプトマイシンともにMICは下がった。

JCM.01158-12


・測定方法によってもMICはばらつきがあり,EテストはBMDよりも1管高めに,Vitek 2はBMDよりも1管低めにでた。MIC creepがみられたのは,Eテストでのみだった。

J Antimicrob Chemother 2011; 66: 2284-2287.


ということで,「MIC Creepが云々(でんでん)」いう人には「それって本当に存在するんですか?」と問いかけてみましょう。きっと面倒くさいヤツだと思われます。科学的な議論というのは面倒くさいものだと個人的には思いますが。
 

CTでの腎周囲脂肪織濃度上昇は急性腎盂腎炎の診断にあまり有用ではない

いつの頃からかCTで腎周囲の脂肪織濃度上昇が急性腎盂腎炎に特異的な所見であるかのように言われるようになった気がしますが,以前調べた時には診断精度について調べた研究はありませんでした。

膀胱の流出路閉塞との関連性についてという,斜め下の研究があるくらいです。 https://www.ncbi.nlm.nih.gov/pubmed/27123701

以前,ケアネットに↓のように書いたことがありました(要登録) http://www.carenet.com/series/yamamoto/cg001229_011.html?keiro=index
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
印象深かったのは、研修医から尿路感染症の疑いということで相談された症例です。高齢男性でインフルエンザ後に咳、痰が続き、いったん解熱した後に再度発熱してきたという病歴でした。この病歴だとインフルエンザ後の肺炎をまず疑うのになぁと思いながら見に行くと、なぜか尿検査はされずに腹部CTがオーダーされ、腎周囲の脂肪織濃度上昇をもって尿路感染症と考えたとのことでした。胸部レントゲンは撮影されていませんでしたが、腹部CTで肺の下葉が撮影範囲に入っていて、普通に肺炎像が写っていたのを見た時、この問題は闇が深いなと思いました。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
このように,文脈無視でCTだけで腎盂腎炎のあるなしを論ずる研修医が増殖しているような気がします。

最近,腎周囲の脂肪織濃度上昇(perirenal fat stranding: PFS)の急性腎盂腎炎の診断精度について研究をなさったという方からご連絡をいただいたので紹介します。
Fukami H, Takeuchi Y, Kagaya S, Ojima Y, Saito A, Sato H, et al. Perirenal fat stranding is not a powerful diagnostic tool for acute pyelonephritis. Int J Gen Med. 2017;10:137–44. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5428832/
タイトルのように,「腎周囲脂肪織濃度上昇は急性腎盂腎炎の診断にあまり有用ではない」という結論です。

急性腎盂腎炎89例とコントロールとして経皮腎生検319例を比較した,ケース・コントロール型(two-gate)の診断精度研究だと思います。 Table 2のように感度72%(95%CI 61-81),特異度71%(95%CI 66-76),陽性尤度比2.5(95%CI 2.0-3.1),陰性尤度比0.4(95%CI 0.3-0.6)になります〔陰性尤度比は山本が計算)。

(アブストラクトには "The frequency of PFS was 72% in the pyelonephritis group vs 39% in the control group. "とありますが,93/319=29%なので,後者は29%の間違いなのでは?100からこの29をひいた71%が特異度になります。)

このようなケース・コントロール型(two-gate)の診断精度研究では診断精度を過剰評価しやすいといわれます(JAMA. 1999;282:1061–6.)ので,「腎盂腎炎疑い」のような連続サンプリングして症例を集めた場合はもっと精度は落ちることが予想されます。 尤度比は0.5〜2.0の範囲では検査前後の確率にほとんど影響を与えない(拙著の「かぜ診療マニュアル第2版」でも解説しています)ので,おそらく,個人的な印象の通り,PFSの有無が急性腎盂腎炎の診断に寄与する度合いは,ごくわずかだと考えられます。

(論文中ではなぜか傾向スコアを使って背景因子をそろえた計算がされ,アブストラクトにはメインの結果としてそちらの数値が示されていますが,診断精度研究で背景因子をそろえる意義はあまりないような気が・・・)
 

「抗微生物薬適正使用の手引き 第一版」出ました!

「抗微生物薬適正使用の手引き 第一版」が厚生労働省から出ました。
http://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000120172.html
私も作業部会で作成のお手伝いをさせていただきました。

さて,本当の戦いはこれからだ!というとジャンプの打ち切り漫画みたいですが,実際,これはあくまでスタート地点です。これからどうするかが問われます。 


「患者さんが欲しがるから風邪に抗菌薬を処方する」という方もおられるかもしれませんが,そういう患者さんを作ってきたのは他ならぬ医療者です。そう考えると,逆のことをすれば,「風邪に抗菌薬を欲しがらない患者さん」を育てることは,たとえ時間がかかったとしても不可能ではないと思います。


大切なのは『真実に向かおうとする意志』
 
http://blog.livedoor.jp/kmcid929/archives/1748570.html

なのです。
この手引きでは,患者さんへの説明例についても紹介されています。日々の診療の一助にしていただければ幸いです。

この手引きを入り口に,もっと詳しいことを知りたい,勉強したいという方がいらっしゃれば,拙著の「かぜ診療マニュアル第2版」も手に取って頂ければと思います(「手引き」と推奨が若干異なることもありますが,細かい点ですので,気になさらないでください)。

山本舜悟





かぜ診療マニュアル第2版 出版

宣伝の時だけ復活します。
「かぜ診療マニュアル」の第2部,じゃなくて,第2版が出版されました!
第2部なので,当然,表紙は緑色です。
序文に150ページ以上増えたと書いてしまいましたが,厳密には143ページ増でした。お詫びして訂正します。
改訂の動機としては,ACP(米国内科学会)の気道感染症ガイドラインの改訂が2016年初頭に出版されたことが大きいですが,その他にも文献を新しくしたり,マニアックなコラム(→アドバンストレクチャーと改名)も増えています。
初版を買ってくださった人にも使いやすいように,改訂版での主な変更点を巻頭でまとめています。

折しも薬剤耐性アクションプランが話題ですが,これの達成のためには,外来での気道感染症に対する抗菌薬の適正使用,不必要な抗菌薬使用の削減が不可欠です。読者の皆様の外来でのかぜ診療におけるスタンド(stand by meとstand up to両方の意味で)的な役割を果たす本になればと願っています。

アマゾンは例によって在庫をなかなか置いてくれないですが,出版社から直販だと早く入手できると思います。

ちなみに,巻末の↓は編集さんのアイディアです。

tobecontinued







かぜ診療マニュアル
山本 舜悟
日本医事新報社
2017-02-04

 

CRPは役に立つか?について論文を書きました

すっかりブログの更新がご無沙汰になっていました。
時々セミナーなどでお会いする方々に「あのブログを読んでます」とか「もしかしてあのブログの中の人ですか?」などと声をかけられるようになり,全然更新していないので,何だか申し訳ない気持ちで一杯です。

さて,大学院でやった研究で,CRPは役に立つか?をテーマに論文を書きました。
日本では日常的に使用されている血清CRPですが,実際どれくらい役に立つのでしょうか?
数年前の某サイトのpro&con的な議論でも「私はCRPを使うから使う」vs「私にはCRPは必要ないから必要ない」という議論に終始していて,まるで宗教論争じゃないかと思ってしまいました(個人の感想です)。

調べてみると,CRPの感染症における診断性能や予後予測に関する日本の臨床研究は数えるほどしかなく,これだけ日本で使っているのに,議論の土台になるようなデータがほとんどないというのはマズいんじゃあないかなぁと思いました。

そこで,CRPの値が予後とどれくらい相関するのか?というのを疑問に検証してみることにしました。個人的には日本でずっと臨床をやってきて,CRPが高い人はやっぱり重症の人が多いなぁという印象は持っていましたが,それが本当に重症であればバイタルサインにも異常が出ていると言われればそんな気もしていました。CRPがなかったらなかったで,おそらく,個人的にはそれほど困らないのですが,一方で未熟な研修医のプレゼンを聞くよりはCRPの方が頼りになることもあると思います。
自分自身も,明け方やってきた患者さんのCRPが30あった時には,眠れない当直で頭が回らない状態の目覚ましとして役に立ったことはあります。

ということで,意外とCRPが予後と関連するんじゃないかなぁと思いつつ,実際どれくらい役に立つのかを調べてみました。国際的な流行りとしてはCRPよりプロカルシトニンの時代なんですが(実際今回の論文のレビューワーにもなんぜプロカルシトニンじゃなくてCRPなの?と聞かれました),プロカルシトニンも考え方としてはCRPの延長線上にあるものなので,まずはCRPに決着をつけたいと思いました(あと,研究を行った病院ではプロカルシトニンが外注検査だったので,ほとんど測定されていなかったという問題もありました)。細菌感染症の診断に対して,プロカルシトニンの方がCRPよりも優れているとする報告は多いですが,最近ではプロカルシトニンよりもCRPの方が予後予測には優れていたという報告もありますし(Lichtenstern C, Brenner T, Bardenheuer HJ, et al. Predictors of survival in sepsis: what is the best inflammatory marker to measure? Current opinion in infectious diseases 2012;25:328-36.)保険点数もプロカルシトニンが320点(3200円)に対してCRPが16点(160円)と20倍も違います。

ということで以下の論文です。

Yamamoto S, Yamazaki S, Shimizu T, Takeshima T, Fukuma S, Yamamoto Y, et al. Prognostic utility of serum CRP levels in combination with CURB-65 in patients with clinically suspected sepsis: a decision curve analysis. BMJ Open. 2015;5(4):e007049–9. 
http://bmjopen.bmj.com/content/5/4/e007049.full

目的:血清CRPの敗血症における有用性は議論のあるところである。今回,敗血症疑い患者において,血清CRPがCURB-65に対して臨床的有用性の上乗せがあるかどうかをdecision curve analysis(DCA)を用いて評価した。 
デザイン:過去起点コホート研究
セッティング:日本の教育病院の救急外来
対象患者:救急外来で血液培養を採取後に入院した15歳以上
アウトカム:30日間入院死亡割合
結果:最終的なスコア評価には1262名が対象になった。30日間入院死亡割合は8.4%だった。多変量解析で血清CRP15mg/dL以上は独立した予測因子だった(調整オッズ比 2.0; 95%信頼区間 [CI]: 1.3〜3.1)。CURB-65と,これに血清CRP15mg/dL以上を加えて作成した修正CURB-65の予後予測能を比較した。ROC曲線下面積はそれぞれCURB-65が0.76 (95% CI: 0.72〜0.80) ,修正CURB-65が 0.77 (95% CI: 0.72〜0.81)だった。どちらもcalibrationは良好であり,0〜30%のthreshold probabilityにおいて有用だった。CURB-65にCRPを加えることにより,net reclassification improvementは0.387 (95% CI: 0.193〜0.582),integrated discrimination improvementは0.015 (95% CI: 0.004〜0.027)と統計学的に有意な改善がみられたが,DCAでは死亡の予測について両者のnet benefitはほぼ変わらなかった。
結論:血清CRPの測定は,感染巣によらない敗血症疑い患者の死亡の予測において,CURB-65に対する臨床的有用性の上乗せはほとんどなかった。

なんだか面倒くさそうなことをやっているなぁと思われた方もいらっしゃるかもしれません。
単にCRPとアウトカム(死亡)の関連性を重症度で調整して死亡との関連性が統計学的有意に出ました,とすればシンプルでよくあるタイプの研究なんですが,それではどれくらい役に立つのか?他のバイタルサインと比べて付加的な情報があるのか?という問には答えられません。

そこで,既存の重症度スコアにCRPを加えることによって予測能がどうなるかを調べました。既存の重症度スコアはCURB-65を用いました。CURB-65と言えば肺炎の重症度スコアじゃないかと思われる方も少なくないと思いますが,肺炎以外の敗血症疑いや内科患者でもvalidationされています(引用文献は論文参照)。ちょっと意外に思われるかもしれませんが,よく見れば年齢とバイタルサインとBUNに反映されるような大雑把な腎血流と考えれば,肺炎特有の指標でなくてもいいというわけです。

で,重症度スコアや予測スコアを比較するのに,従来はROC曲線下面積(AUC)を比較されることが多かったですが,AUCはdiscriminationの指標です。予測モデルの統計学的な性能の一部を評価することはできますが,これだけで「予測スコアが臨床的に使えるか?」を判断することはできません。

予測確率と実際に観測された確率の一致度をみるcalibrationという指標も大事です。というのは,臨床での判断を問題にした場合,予測される確率が1%の場合と10%の場合と50%の場合では次の行動が変わってくるからです。臨床での判断が変わるのが10%くらいのところであった場合,10%くらいのところの予測能はあまりよくない予測スコアでは,それ以上の確率の一致度がいくら高くても臨床的にはあまり使えるものではないということです。

数年前から,既存の予測スコアに新しいマーカーを加えて再分類能がどれくらい改善するかという指標としてnet reclassification improvement (NRI)やintegrated discrimination improvement (IDI)といった指標が使われるようになっています。当初はこれをメインの指標として評価しようと思っていたのですが,NRIやIDIも臨床での有用性を評価するものではないという批判が出ていることを知りました。
Vickers AJ, Pepe M. Does the net reclassification improvement help us evaluate models and markers? Ann Intern Med. 2014;160(2):136–7. 

このVickersらは臨床上の有用性を評価できる解析として,decision curve analysis (DCA)を提唱しています。「疾患ありの人を正しく分類するbenefit」と「疾患なしの人を誤って疾患があると分類するharm」の重みは通常異なる,という考え方に基づき,真の陽性から,誤分類のコストで補正した偽陽性を引いたものをNet benefitとして計算するものです。

例えば,頭痛の患者さんに対するくも膜下出血を予測する予測スコアがあったとして,予測確率が何%あったら頭部CTを撮るか?ということを考えてみたいと思います。
「予測スコアに基づく事前確率が5%あれば頭部CTを撮る」という人は「5%当たればよい,あとの95%は空振りでも仕方がない」と考えていることになります。すなわち,20人に頭部CTを撮影して,1人のクモ膜下出血を見つけることができれば,あとの19人の結果的に無駄な被爆,CT撮影費用は許容されると考えているということです。

人によってはくも膜下出血の事前確率が1%でも頭部CTを撮るというかもしれません。しかし,事前確率が50%ないと頭部CTを撮るという人はいないでしょう。
この,何%で次の行動が変わるかどうかは,転帰の重大さや検査・治療の侵襲度のバランスで,判断は個人(医師や患者)によって異なります。
このような「臨床での有用性」を評価するのに,決断分析が用いられていましたが,方法論として複雑で,追加データ(患者の好み,検査・治療のコストなど)やいろいろな仮定が必要になるので,簡単にはできません。

VickersらのDCAは,治療するか,治療しないかによるアウトカムのリスクがちょうどつりあうと判断されるポイントをrisk thresholdとして,このポイントで期待されるutility/costがつりあうと考えられます。前述の通り,このthresholdは人によって異なります。横軸にthresholdをとり,縦軸にnet benefitをプロットしていくとDCAを描くことができます。これを他の予測モデルと比較したり,「予測モデルと関係なく全員同じ治療」の線と比較します。ややこしいですが,要はnet benefitが大きいほど(DCAのカーブが上にあればあるほど)予測モデルを使用する正味の利益が多くなるという意味です。

本研究では,CRPはCURB-65の項目と独立して予後と関連し,CURB-65と組み合わせるとNRIやIDIといった統計学的な指標は改善したものの,臨床的有用性を示すDCAはほとんど変わらないという結果でした。すなわち,臨床判断にはあまり役に立たないということです。CURB-65の構成項目のバイタルサインは結構大事なんですね。CRPを見るなとはいいませんが,バイタルサイン(とBUN)にはもっと注目した方がよいと思います。

DCAは計算自体はそれほど難しくないですし,決断分析のような追加データも必要ないので,これから流行るんじゃないかと予想していますが,まだそんなにメジャーではないですね。最近,Annals of Internal MedicineやJAMAに載るような論文でも採用されるようになってきています。
DCAについて,もっと勉強してみたいという奇特な人がいらしたら以下の論文がお薦めです。

・Peirce CS. The numerical measure of the success of predictions. Science 1884; 4:453–454. Net benefitの考え方の基本になった論文
・Pauker SG, Kassirer JP. The threshold approach to clinical decision making. New England Journal of Medicine 1980; 302:1109–1117. 決断分析のthresholdについて
・Vickers AJ, Elkin EB. Decision curve analysis: a novel method for evaluating prediction models. Medical decision making 2006; 26:565–574. DCAを初めて提唱した論文
・Vickers AJ, Cronin AM, Elkin EB, Gonen M. Extensions to decision curve analysis, a novel method for evaluating diagnostic tests, prediction models and molecular markers. BMC Med Inform Decis Mak 2008; 8:53. DCAのoverfit補正(crossvalidation),信頼区間,打ち切りデータへの対処(生存データへの応用),decision curveのスムージングについて 
・Steyerberg EW, Vickers AJ. Decision curve analysis: a discussion. Medical decision making 2008; 28:146–149. Steyerberg(予測モデルの大家)とVickersの対話
・Steyerberg EW, Vickers AJ, Cook NR, et al. Assessing the performance of prediction models: a framework for traditional and novel measures. Epidemiology 2010; 21:128–138. 予測モデルの評価の仕方のまとめ
・Moons KGM, de Groot JAH, Linnet K, Reitsma JB, Bossuyt PMM. Quantifying the added value of a diagnostic test or marker. Clin. Chem. 2012; 58:1408–1417. 診断検査の評価法のレビュー



ERアップデート2015 in 沖縄 参加者募集中です

毎年夏と冬で2回開催されているERアップデートの夏が現在参加者募集中です。

2015年7月3日(金)〜5日(日)
会場は沖縄残波岬ロイヤルホテル です。

林寛之先生,寺澤秀一先生,箕輪良行先生,今明秀先生,太田凡先生,井村洋先生,小淵岳恒先生など救急・総合診療のスーパースターの先生方が講師として参加されます。私など場違いな気がしますが,僭越ながら「感染症と体温」の話と「海外からの帰国者の発熱」についてお話しする予定です。

参加費がちょっと高い(宿泊費と交通費は別にかかる)のが玉に瑕ですが,早めの夏休みのついでに沖縄に遊びに,ではなくて勉強しに行ってみてはどうでしょうか?最近の研修病院は勉強会の参加費や旅費を出してくれるという羨ましいところもあるらしいと風の噂に聞きます。

内容や申し込み方などの詳しい方法は以下のホームページからどうぞ。
http://www.erupdate.jp
 

青木眞先生の「レジデントのための感染症診療マニュアル」の第3版が出ました!

青木眞先生の「レジデントのための感染症診療マニュアル」の第3版が出ました!

今版は各章を執筆協力者達が内容や文献をアップデートしたものを,青木先生と執筆協力者代表の具先生が吟味をすることによって改訂されました。畏れ多くも私も第2章をお手伝いさせていただきました。改訂している最中に新しい文献やガイドラインが出てくるので大変でしたが,これを第2版は青木先生お一人でおまとめになったと思うと気が遠くなるお仕事だなぁと思いました。

単著でよかった本が共著になるとイマイチという例はなくもないですが(Wallachとか),これはしっかり青木先生の目が入っていますので,安心できると思います。

改訂中にアップデートされてしまった事柄はなるべく校正刷りの時に対応しましたが,追いつかないところもあり(特にHCVの治療薬はアップデートが早すぎて正味期限が切れています),もし更なる改訂の機会をいただけるようでしたら,何とかアップデートしたいと思います。

思えば私が初版に出会ったのは大学5回生で麻生飯塚病院で病院実習をしていた時でした。研修医の先生達が「すごい本が出た」と言ってこぞって読んでおられました。この本に出会って人生が変わった,という人も数知れず,私もその一人です。当時は改訂のお手伝いに関わることになるなど夢にも思っていませんでした。完成した本を手に取ると感慨深いです。

青木先生のご講義を拝聴する時に不思議に感じるのは,同じテーマなのに毎回新しい発見があるということです。同じように臨床で疑問に思ったことも,このマニュアルに帰ってくると,「あ,なんだ,ちゃんと書いてあった」と発見することがあり,「原則」というのは本当に大事なんだなぁと思うのです。

感染症を専門にする人もしない人も,困った時に帰ってくる拠り所になる,そんな本だと思います。


 

肺炎球菌肺炎に対する併用療法について

「菌血症を伴う肺炎球菌肺炎で単独療法よりも併用療法の方が予後がよい」ことを支持する研究として
Baddour LM, Yu VL, Klugman KP, et al. Combination antibiotic therapy lowers mortality among severely ill patients with pneumococcal bacteremia. Am J Respir Crit Care Med 2004;170:440–4. doi:10.1164/rccm.200311-1578OC
がしばしば引用されます。まあ,確かに重症患者については併用療法の方が予後がよかったという結果なのですが,なぜか「マクロライド併用がよい」という主張に読み替えられることがしばしばです。

本文の結果のところに書いてありますが,併用の内訳は以下の通りです。
The most frequent combination therapies prescribed were beta-lactam/macrolide (14), vancomycin/beta-lactam (12), beta-lactam/aminoglycoside (7), vancomycin/other antibiotic (4), beta-lactam/quinolone (4), double beta-lactam therapy (2), beta-lactam/ chloramphenicol (2), beta-lactam/trimethoprim-sulfamethoxazole (1), and clindamycin/quinolone (1).
47例の併用療法のうちベータラクタム+マクロライドは確かに最も多い14例なのですが,他はバンコマイシン+ベータラクタム(12例)とか,ベータラクタム+アミノグリコシド(7例)とかなんです。これでマクロライド併用がよいと結論づけるのはちょっと無理があると思います。

また,この研究は「前向き研究で示されている」と「前向き研究」という部分が強調されがちですが,以下の前向き研究のサブグループ解析という位置づけだと思います。全体では単独療法と併用療法で予後に有意差はありません。
Yu VL, Chiou CCC, Feldman C, et al. An international prospective study of pneumococcal bacteremia: correlation with in vitro resistance, antibiotics administered, and clinical outcome. CLIN INFECT DIS 2003;37:230–7. doi:10.1086/377534
http://cid.oxfordjournals.org/content/37/2/230.full 
最初から「重症例で併用療法の効果を検証する」というプロトコールだったのかどうかわかりませんので,探索的に仮説を提唱することはできると思いますが,「たまたまそうだった」可能性は十分あると思います。
サブグループ解析で強い結論を導き出せないことの例としては週刊医学界新聞のこちらの記事がとてもわかりやすいです。
もっとも,他の観察研究でもマクロライド併用が死亡率を下げる可能性は示唆されていますので,重症肺炎の初期治療でベータラクタム+マクロライドもしくはベータラクタム+フルオロキノロンという併用療法を否定するつもりはありませんし,おそらくやった方がよいと思います。でも菌血症を伴う肺炎球菌肺炎だとしても重症でないものにまでこれを適用するのはちょっとやりすぎではないかなぁと思ってしまいます。

この辺りの議論は「侮れない肺炎に立ち向かう31の方法」にまとめましたので,興味のある方はご覧いただければと思います。



4/9のためしてガッテン,フェリチンと倦怠感とうつと不眠と私

昨日(4/9)のためしてガッテンで,フェリチンが低いことがうつや不眠の原因になっていて,フェリチンを補えばこれらが劇的に改善する魔法の薬です,というようなことを言っていました。
↓こんな内容でした。

貧血がなくてもフェリチンが低い女性に鉄剤を投与することによって倦怠感スコアが改善するという研究がいくつかあることは知っていましたが,うつや不眠との関連性も示されたのか!と思いましたが,調べてみるとそうでもないようです。

例えば,これは日本の研究ですが,市役所の職員を対象に血清フェリチン値とうつ症状(CES-Dというスコア)の関連性を調べたもののようです。
Psychiatry Res. 2011 Oct 30;189(3):368-72.
http://www.ncbi.nlm.nih.gov/pubmed/21470691
男性については,フェリチンが低い方がうつスコアが低い傾向があったものの,女性については関連性は示せなかったという結論のようです。番組ではいかにも女性でフェリチンが低いことがうつの原因かのように説明されていましたけどねぇ・・・。
 
また,普通に食事をとっている人が摂取不足で鉄欠乏になることは稀と言われますので,鉄欠乏(血清フェリチンが低い)の状態であれば,どこからか出血している可能性を考えなくてはいけません。閉経前の女性であれば,月経があるので,月経による鉄欠乏が少なくないですが,男性および閉経後の女性で鉄欠乏の状態であれば,通常は消化管のどこかから出血している可能性を考えます。
こういう場合は,胃潰瘍や胃癌,大腸癌が見逃したくない病気です。上記の市役所職員を対象にした研究で男性では血清フェリチン値が低いこととうつ症状の関連性が示されたということですが,男性で血清フェリチン値が低いということは,消化管に何か病気があったのではないかと考えたくなりますので,血清フェリチン値の影響よりもそちらの方との関連性が気になります。

また,こちらはドイツの高齢者を対象にした研究ですが,フェリチンを含めた鉄代謝とうつ症状について関連性はなかったとのこと。
Int Psychogeriatr. 2006 Sep;18(3):437-44. 
http://www.ncbi.nlm.nih.gov/pubmed/16472410

簡易的に調べただけなので,検索漏れはあるかもしれませんが,他にめぼしいものは見つけられませんでした。
う〜ん。どうなんでしょう。フェリチンとうつや不眠は関係があるのでしょうか?
倦怠感については,それなりにデータはありますが,うつや不眠とは関連性があるとは言いがたいように思います。

貧血がなくてもフェリチンが低い女性に鉄剤を補充すると倦怠感が改善するというのはこちら。
規模は大きいと言えませんが,ランダム化比較試験で統計学的に有意な改善があったという結果です。
拙著の「かぜ診療マニュアル」でも「微熱・倦怠感型」の項目で紹介した論文です。
BMJ. May 24, 2003; 326(7399): 1124.
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC156009/

他には以下のようなものもありました。
やはり閉経前で貧血はないがフェリチンが低い「倦怠感を訴える」女性に対して鉄剤またはプラセボを投与するランダム化比較試験で,倦怠感は改善したが,QOL,うつ,不安には影響なし,という結果です。
CMAJ. 2012 Aug 7;184(11):1247-54.
http://www.cmaj.ca/content/early/2012/07/09/cmaj.110950.full.pdf

なんと鉄剤の静注のランダム化比較試験もありました。対象は同様に貧血はないが血清フェリチンが低い,倦怠感を訴える女性です。血清フェリチン値が15ng/ml以下の人については効果があったという結果でした。
Blood. 2011;118(12): 3222-3227
http://bloodjournal.hematologylibrary.org/content/118/12/3222.long

こちらは献血をした女性で,貧血はないけどフェリチンが低かった人を対象に,鉄剤を内服させるかどうかのランダム化比較試験です。いろいろありますね。結果はヘモグロビンとフェリチンは上がったけど倦怠感は変化なし。まあ,献血に行くという時点でベースラインがそれなりに元気だったんじゃないかと思いますので,改善が検出しにくかったのかもしれません。
BMC Medicine 2012, 10:8 
http://www.biomedcentral.com/1741-7015/10/8

ということで,他に説明ができない倦怠感を訴える女性では,貧血がなくても血清フェリチン値が低ければ鉄剤による補充を試してみてもよいというのが私の考えですが,うつや不眠が改善する魔法の薬というのはかなり言い過ぎではないでしょうか?
しばらくの間,外来にフェリチンを測って下さい,という方が殺到するかもしれませんが,なんだかなぁという気がします。

微熱や倦怠感を訴える人への一般外来での対応は「かぜ診療マニュアル」に書きましたので,よろしければ読んでみて下さい(なんだステマか)。


 

呼吸器の薬の考え方,使い方

ブログ「呼吸器内科医」や「寄り道」呼吸器診療で有名な倉原優先生の新刊「呼吸器の薬の考え方,使い方」が出版されました。
http://pulmonary.exblog.jp





前にも書いたかどうか忘れましたが,実は彼が初期研修医時代に同じ病院におり,私のチームで研修してくれました。正直言うと,当時はそんなに論文をたくさん読んでいるイメージはなく,数年後「呼吸器内科医」のブログが彼の手によるものだと知って驚きました。こんなに有名になるならもっと恩を売っておけばよかった,などと邪悪なことを考えてしまいますが,教え子が自分を追い抜いていくのは嬉しいものです。といっても,大したことを教えたわけでもないので,どこで研修してもきっと立派になっていたことでしょう。

さて,この本は呼吸器内科で使われる薬について解説した本です。
最近,吸入薬が意味がわからないくらいたくさん種類が出ているので,こういうまとめは助かります。他にも去痰薬や鎮咳薬などについても,見たことも聞いたこともないものまで載っていてこんなに種類があるんだと驚きました。1つ1つ丁寧に解説されていますが,細かい使い分けというよりは,こんなにたくさんあるけれど,全て使う必要はなく,なるべくデータの多い薬剤について使い慣れていきましょう,というのも本書のメッセージの1つではないかと思いました。

抗結核薬についても記載されているので,呼吸器内科医だけでなく,感染症に携わる感染症医や一般内科医の人にもお勧めです。薬剤師さんにも非常に良いと思います。

知らないこともたくさんあり,興味深く拝見しました。
・排便喘息
・痰壺の由来
・リンコデはとても苦い
・ピラジナミド使用中患者に尿酸値を下げようとアロプリノールを投与するとキサンチンオキシダーゼ阻害作用によりピラジナミドの代謝産物であるピラジン酸の濃度がさらに上昇するという報告があるので使用しない方がよい(使うならベンズブロマロンの方がよい)

などなど。是非手にとってみてください。

尚,倉原先生には「侮れない肺炎に立ち向かう31の方法」で『肺炎を「見抜く」ための画像検査』について執筆してもらいました。


 

採血を省略した修正PSI

またもや直後に間違いを発見したので,黄色時で修正します(2014年3月26日午後3時17分)。確認したつもりだったのに,最近注意力散漫だなぁ。

「侮れない肺炎に立ち向かう31の方法」に「10『訪問診療』での肺炎診療」についてご執筆いただいた,あおぞら診療所の春原光宏先生らの論文を偶然見つけました。

Ishibashi F, Sunohara M, Kawagoe S. Performance of severity scores for home care-based patients suffering from pneumonia. Geriatr Gerontol Int 2014; 
http://www.ncbi.nlm.nih.gov/pubmed/24617550

 肺炎の重症度スコアにPSI (Pneumonia Severity Index)がありますが,結構項目が多く,採血も必要なので,煩雑なのが欠点です。在宅の場ではすぐに採血もできないので,採血やレントゲンが必要な項目を省いてアレンジしたということでした(PaO2はSpO2で代用)。PSIとほぼ変わりないc-indexとのこと(若干,なんで?という気もしますが)。

All the four scores well predicted the mortality, with the area under the curve of the receiver operating characteristic curves of the PSI, the PSI-HC, the A-DROP and the CURB-65 being 0.859, 0.856, 0.778, and 0.806, respectively. 

点数を合計した後のカテゴリー化にはオリジナルのPSIを同じカテゴリーを用いたせいか,カテゴリーVに相当する人がいなかったとのこと。
失礼しました。修正PSIの方は各層の人数が同じになるように分けた,とのことでした(論文では5段階ではなく4段階に分かれているようですが)
The PSI-HC was categorized into five, severity I–V, as the number of patients in each severity was equal

これはカテゴリーを分け直した方がよいのかもしれませんが,症例数が97例とまだ少ないので,致し方ないか。
在宅の現場から出てきた貴重な提案だと思います。手元のデータでexternal validationも可能かもしれないので,今の仕事に目途がついたらやってみようかと思います。


ついでに風邪の方も宣伝。



 

しつこいですが,ドリペネムの話の続き

アップした直後に間違いを発見したので黄色字で修正します(2014年3月24日午後0時34分)。

しつこいと思われるかもしれませんが,子供の頃,「警部補古畑任三郎」が好きだったせいか,こまかいことが気になると夜もねむれないので,もう少し。

Kollef MH, Chastre J, Clavel M, et al. A randomized trial of 7-day doripenem versus 10-day imipenem-cilastatin for ventilator-associated pneumonia. Crit Care 2012; 16:R218. (以下,Kollef2012)
に先だって行われたドリペネムとイミペネムを比較したRCTの
Chastre J, Wunderink R, Prokocimer P, Lee M, Kaniga K, Friedland I. Efficacy and safety of intravenous infusion of doripenem versus imipenem in ventilator-associated pneumonia: a multicenter, randomized study. Crit Care Med 2008; 36:1089–1096. (以下,Chastre2008)
について。

Chastre2008ではドリペネムはイミペネムに非劣性が証明されているのに,Kollef2012は反対の結果が出たのはなぜでしょうか?しかし,よく読んでみると,全く反対の結果というわけでもなさそうです。

Chastre2008の方は
・ドリペネム1回500mgを8時間毎4時間かけて点滴
・イミペネム1回500mgを6時間毎または1gを8時間毎を30〜60分かけて点滴
を比較していて,共に治療期間は7〜14日間です。
投与量と投与期間が異なりますが,Kollef2012と最も注意すべき違いはChastre2008の方はオープンラベルのRCTであることだと思います。

"The primary efficacy analysis assessed the noninferiority of the clinical cure rate of intravenous doripenem to intravenous imipenem in the clinically evaluable and cMITT populations."

ということで,プライマリーエンドポイントは"clinical cure rate"をcMITT解析でドリペネムのイミペネムに対する非劣性を検証です。

"clinical cure rate"とは何かというと,

"Clinical responses were classified as cure, failure, or indeterminate by the investigator at the end of therapy and test of cure (TOC) visits."

ということで,investigatorが治療終了後に訪問して治ったかどうかを判断するということのようです。ただし,この「治ったかどうか」の判断基準が論文中には明確に示されていないようです。客観的ではない指標を評価指標に用いる時は,評価者がblindingされているかどうかが重要ですが,本文中には

"blinding of both the statisticians and the medical team supervising the study and determining the evaluability of each patient."

"To minimize bias, in- house handling and analysis of data (e.g., determination of patients’ evaluability) were blinded. Clinical investigators were responsible for the determination of clinical outcomes and safety assessments."

とあるものの,patients’ evaluabilityを評価する人はアウトカムを評価する人とは異なるように思いますし,評価者 (clinical investigotors)がblinidingされていたかどうかが書かれていないように思いました。

これと同じ時期に同じスポンサーでドリペネムとピペラシリン/タゾバクタムを比較したオープンラベルのRCTでは,やはり同様にinvestigatorによるclinical responseをプライマリーエンドポイントにしています。
Rea-Neto A, Niederman M, Lobo SM, et al. Efficacy and safety of doripenem versus piperacillin/tazobactam in nosocomial pneumonia: a randomized, open-label, multicenter study. Current medical research and opinion 2008; 24:2113–2126. 

"an external blinded expert evaluation comittee was convented to review the case report records of all treated patients. The comittee evaluated whether the diagnosis of pneumonia had been adequately established and whether they concurred with the clinical outcome determined by the unblinded investigator."

という記載があり,investigatorは盲検化されていないので,それを補うために盲検化された外部評価委員会により診断とアウトカム評価の妥当性をチェックしたようです。
外部評価委員会によるチェックは大事なことですので,もし行っていたら論文中に必ず書くと思いますが,書いていないということは,Chastre2008の方は外部評価委員会を設置していなかったのでしょうか?

客観的ではない指標を用いる場合,評価者が盲検化されていないとバイアスが入りやすいことは想像に難くないでしょう。スポンサーがついている臨床試験ですので,スポンサーに有利な判定をしてもおかしくありません。

仮に評価者が盲検化されていたとしても,非劣性試験の場合,盲検化はバイアスを十分に制御できません。非劣性試験では両群の治療効果の差が縮まれば「統計学的な非劣性を示しやすい」ので,評価者が意図的に「全て同じ治療効果」と判定すれば,非劣性を示すことができてしまいます。まあ,そんな露骨なことはしていないでしょうが,微妙な時はあまり差をつけないように判定すれば,理論的には両群の差が縮まりますので,非劣性を示しやすくなると思います。

このようなバイアスを克服するには,誰が評価しても変わりようがないアウトカム,例えば「死亡」を評価すればよいということになります。

2010年に発表されたIDSA,ACCP,ATS,SCCMによるポジションペーパーでは,HAPおよびVAPの臨床試験で非劣性を検証する場合には,プライマリーエンドポイントとして,30日間の総死亡を用いるように,とされています。

"Noninferiority trials using all-cause mortality as the primary efficacy end point at 30 days in the microbiological modified intention-to-treat (mMITT) population"

Infectious Diseases Society of America (IDSA), American College of Chest Physicians (ACCP), American Thoracic Society (ATS), Society of Critical Care Medicine (SCCM), Spellberg B, Talbot G. Recommended design features of future clinical trials of antibacterial agents for hospital-acquired bacterial pneumonia and ventilator-associated bacterial pneumonia. CLIN INFECT DIS 2010; 51 Suppl 1:S150–70. 

Chastre2008の死亡はセカンダリーエンドポイントとして評価されています。

"The all-cause mortality at day 28 in the cMITT population was 10.8% with doripenem and 9.5% with imipenem (difference 1.3%; 95% confidence interval -4.4% to 7.0%)."

ということで,ドリペネムの方がイミペネムよりも1.3%総死亡が多かったということでした。これでも非劣性マージンを10%にとれば,一応,統計学的な非劣性を示してはいます。

さて,信頼区間の下限が-4.4%です上限が7%です (どちらを基準にするかがごちゃ混ぜになっていました)。

Kollef2012では,
"All cause 28-day mortality in the MITT group was numerically greater for patients in the doripenem arm compared to the imipenem-cilastatin arm (21.5% versus 14.8%; 95% CI, -5.0 to 18.5)"
とのことで,28日間総死亡の絶対リスク差で6.7%です。(イミペネムを基準にするため-をとりました)

FDAが再解析したITT解析では28日間総死亡の絶対リスク差は6.3%でした。(こちらもイミペネムを基準にするため-をとりました)
"In the intent-to-treat population, the 28-day all-cause mortality was higher in the Doribax arm (23.0%; n=31/135) than in the imipenem and cilastatin arm (16.7%; n=22/132)."
http://www.fda.gov/Safety/MedWatch/SafetyInformation/SafetyAlertsforHumanMedicalProducts/ucm388328.htm

Kollef2012は試験が途中で中止になっていますが,仮に最初の方にエントリーした患者がドリペネムに不利なような偏りがあったとして,もし試験が最後まで行われていたとすれば,平均への回帰により,若干差が縮まり,最終的な死亡の絶対リスク差は4%か5%くらいに落ち着いたかもしれません(単なる想像です)。これはChastre2008の28日間総死亡の信頼区間下限と同じくらいですから,全くありえない数字ではないと思います。(こちらもイミペネムを基準に-をとりました。6.3%のままでもChastre2008の総死亡の信頼区間の上限7%の範囲内ですね)

2つの試験をまとめると,ドリペネムはイミペネムに総死亡で5%前後劣る最大7%上回る可能性があるというところが妥当な解釈ではないかと思います。

Kollef2012を受けてEMAはドリペネムの投与量は1回1gで十分量を使いなさいと推奨しています。が,個人的にはなんとなく釈然としないものを感じます。

2つの試験をみると投与量を増やした方が総死亡が増えています。
カルバペネムの薬理作用を考えると投与量を増やしたからといって死に至る副作用が増えるとは考えにくいですが,我々が認識できていない用量依存性の副作用があるとすれば納得がいく結果です。
「そんなもの存在するはずがない」という考えの人は,十分量使用すべきだとなるのでしょうか,RCTは「なぜ?」を教えてくれないので,結局のところ,本当に倍量使用した方がよいのか,倍量使用するとかえってよくないのか,これらの結果からは何とも言えないと思います。
よくわからないことがあり,他の選択肢があるのであれば,自分ならやっぱり使わないなと思います。




診断法を評価する (臨床家のための臨床研究デザイン塾テキスト)

著者の野口先生からご贈呈いただきました。


診断性能の評価,clinical prediction ruleの開発と検証,診断特性のメタアナリシスについて解説されています。日本語でこのテーマの入門書はあまりなかったように思いますので,大枠をつかむにはとてもよいように思いました。

診断性能の評価は思ったほど簡単ではありません。評価する対象患者によって感度や特異度はかなり変わることがあります。例えば,真菌感染症のマーカー(βナントカ)について,ケースを剖検症例から,コントロールを健常者から選んで評価している研究があります。当たり前ですが,診断性能は現実よりもよく見えます。というか,そういうマーカーを測らなくても剖検症例と健常者だったら見た目で判別できます。こういう疾患スペクトルによるバイアスがあって出てきた感度,特異度は現実世界で適用できるかどうかわからないですが,いったん数字として世の中に出ると独り歩きしていくので,厄介なことがあります。
本書では診断研究の結果を解釈する上で重要なバイアスが解説されています。

Clinical Prediction Ruleについては,自分の研究テーマもこれを扱っているので,それなりに勉強したつもりですが,日本語で入門書的なものがこれまであまりなかったように思います。これでまず大枠をつかんで適宜英語の教科書で補強していくのがよいのではないかと思いました。

自分が使っているのは,Steyerbergの"Clinical Prediction Models: A Practical Approach to Development, Validation, and Updating"です。

診断研究のメタアナリシスも治療のメタアナリシスとはちょっと違った部分があります。一応,Mindsのセミナーで解析方法だけは習ってできそうなので,自分でもやってみたいのですが,今は手一杯なので,落ち着いたらできるといいなぁ。


 
 

これであなたも免許皆伝! ドクターこばどんの感染症道場

著者の小林先生からご贈呈いただきました。実は,小林先生とは学生時代からの知り合いです。当時からデキる人でした。「こばどん」と呼ばれているとは全然知りませんでした。

当初は「そこが知りたい!感染症一刀両断!」の改訂版という話だったそうですが,蓋をあけてみれば別の本として生まれ変わったそうです。

学生や初期研修医の人が最初に感染症を勉強しようと思った時に何で勉強し始めるのがよいかと聞かれた時に,これまでは矢野晴美先生の「感染症まるごとこの一冊」を勧めていましたが,これからは矢野先生の本かこの小林先生の本かをオススメしたいと思います。網羅的に非常によくまとまっていると思います。

あと,非常に細かいことですが,読みながら以下の点が気になったので著者にご連絡しました。増刷時に修正をご検討してくださるそうです。

・ゲンタマイシンの保険適用量ですが,2013年に5mg/kgに改定されています(添付文書上は3〜4回に分割ですが)。
・ホスホマイシンについて,国内で承認されているのは,fosfomycin calciumですが,海外で用いられているのは主にfosfomycin trometamolです。薬物動態も異なり,fosfomycin trometamolのバイオアベイラビリティは42.3%ですが,fosfomycin calciumのそれは12%にすぎません(Infection. 1990;18 Suppl 2:S65-9.)。ですので,IDSAのガイドラインのように膀胱炎に1回3g投与というのは日本の製剤では適用できないと思います。
・A型肝炎ワクチンの接種回数が2回と記載されていましたが,日本のエイムゲンはアジュバントが入っていないせいか,長期間の抗体価を維持するためには3回接種が必要とされます。

 

ちゃんと知ろう!ドリペネムのこと:人工呼吸器関連肺炎にドリペネムを使うと死亡が多かった

最強の抗菌薬が何なのかわかりませんが,ドリペネムでないことは確かです。

2012年に発表された人工呼吸器関連肺炎(以下,VAP)を対象にした二重盲検ランダム化比較試験によると,ドリペネム(1回1gを8時間毎に4時間で点滴,7日間)はイミペネム/シラスタチン(1回1gを8時間毎に1時間で点滴)と比較して奏効率が低く,死亡も多かったということで,中間解析の時点で試験が中止されました。
Kollef MH, Chastre J, Clavel M, et al. A randomized trial of 7-day doripenem versus 10-day imipenem-cilastatin for ventilator-associated pneumonia. Crit Care 2012; 16:R218. 
http://ccforum.com/content/16/6/R218

論文の結論には,

"Among patients with microbiologically confirmed late-onset VAP, a fixed 7-day course of doripenem was found to have non-significant higher rates of clinical failure and mortality compared to a fixed 10-day course of imipenem-cilastatin."

とあり,「統計学的に有意ではないが」ドリペネムで治療不良と死亡が多かったとされていますが,中間解析で試験が途中で中止になっているので,サンプルサイズが足りずに有意差がつかなかっただけだと思います。試験が最後まで行われていれば,統計学的にも有意に死亡が多かったことが証明され,その分余計にドリペネムの投与により亡くなる人が多かったのではないかと推測します。統計学的に有意になるまでドリペネム群に割り付けられた患者を余計に殺し続けるのは倫理的ではないので,試験は途中で中止になったということです。

また,論文中の考察の中で,「7日間治療」という治療期間の短さが悪かったのでドリペネム自体が悪かったのではないという言い訳をしたいような記載がありますが,そもそも同じ治療期間で比べるのであればドリペネムの非劣性を示そうとする試験デザインがそぐわないと思います。

非劣性試験とは,標準治療薬がある疾患でプラセボとの比較試験が困難な場合に行われます。VAPに抗菌薬とプラセボで比較するわけにはいかないので,標準治療薬という実薬との比較になります。
感染症の治療薬で既に標準治療薬が存在する場合,優越性を示すのは比較的困難です。そこで同等性試験や非劣性試験というものがなされます。一般論としては,同等性試験よりも非劣性試験の方がサンプルサイズが少なくてすみますし,明らかな優越性を示さなくても劣っていなければいいだろうということで,近年感染症領域では非劣性試験を多く見ます。

プラセボとの比較ができないから非劣性試験を選ぶ場合に,何でも非劣性でよいわけではありません。
非劣性試験では「臨床的に意味のある差以上に劣らないマージン=非劣性マージン」を設定します。「臨床的に意味のある差」とは何かというと,医師によっても個々の患者によっても異なってしかるべきなので,客観的に決めることが難しいことが多く,なぜそそのマージンになっているのかがよくわからないことも少なくありません。抗菌薬の試験では慣習的に10〜20%に設定されることが多いようです(Biom J 2005; 47:12–27– discussion 99–107. )

JAMAの医学文献のユーザーズガイドでは,論文で示された非劣性マージンにこだわらず,それぞれの臨床セッティングに応じてどこまでの差なら許容できるかを自ら設定して研究結果を解釈するべきだと勧められています(それはそれでなかなか骨が折れますが)。
Mulla SM, Scott IA, Jackevicius CA, You JJ, Guyatt GH. How to use a noninferiority trial: users' guides to the medical literature. JAMA 2012; 308:2605–2611. 

話を元に戻すと,このドリペネムのVAPのRCTでは非劣性マージンはプライマリーエンドポイントのclinical cureについて15%と設定されていました。つまり,15%まで治療効果が劣っていても許容するということです。

さて,臨床試験で新薬は標準治療薬に非劣性を示したとして,皆さんはこれまでの標準治療薬よりも治療効果は15%劣るかもしれない薬を選択しますでしょうか?

非劣性試験で比較する場合には,新薬は非劣性マージンの分,劣ることを許容してもらう分,他に何らかのメリットがなければいけません。それがなければ,そもそも比較すること自体が非倫理的です。
主要な効果以外のメリットとして考えられるのは
・副作用が少ない
・侵襲性が少ない
・コストが安い
・投与方法が簡便である
などの理由が挙げられます。このような何らかの「他のメリット」がなければ,そもそも非劣性デザインで検証する意味がありません。非劣性試験は"me too drug"の承認を効率よくとるための試験ではないのです。

ドリペネムとイミペネム/シラスタチンを比較した場合,主要効果以外でドリペネムの方が明らかに優っていそうなことはあるでしょうか?
イミペネムの副作用では痙攣が有名なので,ドリペネムでそれが少なければメリットの1つにはなるかもしれません。
先行研究のVAPを対象としたオープンラベルのRCTでの痙攣の発生はドリペネム群が1.1%,イミペネム群が3.8%で,一応ドリペネムの方が痙攣のリスクは少ないようです。が,この差が主要な治療効果が15%劣ることと釣り合うかと言われるとちょっと微妙な気もします。
Chastre J, Wunderink R, Prokocimer P, Lee M, Kaniga K, Friedland I. Efficacy and safety of intravenous infusion of doripenem versus imipenem in ventilator-associated pneumonia: a multicenter, randomized study. Crit Care Med 2008; 36:1089–1096. 

Kollefらによる2012年の研究の方のSupplementのTable S2には,3%以上あった副作用について記述がありますが,痙攣は載っていないように見えますので,こちらの研究ではおそらく両群とも痙攣は3%未満だったのでしょう(オープンラベルの研究だと,イミペネムの方が痙攣が起きやすいという先入観があれば,微妙な所見を痙攣と報告しやすいというバイアスがあるかもしれません)。

投与方法はどちらも点滴ですし,この研究のプロトコールではドリペネムは1回あたり4時間で点滴というextended infusionを用いています。投与方法が簡便とは言えません。

コストについて,米国のことはわかりませんが,少なくとも日本の薬価はドリペネムの方がむしろ高いくらいです。以下のサイトで検索した結果(2014年3月3日現在),
・ドリペネム(フィニバックス)0.5g 1611円 
・イミペネム/シラスタチン(チエナム)0.5g 1505円
・メロペネム(メロペン)0.5g 1287円
でした。イミペネムやメロペネムはジェネリックを選べば更に安くなると思います。

このRCTでドリペネムの有効性を非劣性試験で検証することの妥当性は,イミペネムが10日間治療であることに対してドリペネムが7日間治療だということしかないように私には思えます。7日間という短期間治療で従来治療に劣らない効果が示せればそれは臨床上も有益だと思います。

確かに緑膿菌によるVAPで7日間治療はいろいろな先行研究の結果からは短すぎると思いますが,それならVAPの臨床試験で最初から治療期間を7日間で設定しなければよかったのに,と思います(最初から10日 vs 14日とかすればよかったのに)。

それなのに,7日間治療だったからダメだったんだと言われると,非劣性試験を行う前提をひっくり返すことになりかねません。きちんと同じ条件で優越性を検証する試験デザインにすればよかったのです。

とはいえ,SupplementのFigure S1. Kaplan-Meier curves for probability of survival for the intention-to-treat (ITT) population.をみると,治療7日目の時点でカプランマイヤー曲線にすでに差がついているように見えますので,やっぱり治療期間の問題でもないような気がします。

in vitroでは,緑膿菌に対してメロペネムやイミペネムよりも活性がすぐれるという報告はあるようですが,実験室内での結果と実際に臨床で使った結果が乖離することはよくあることです。実験室での結果よりも臨床試験の結果の方が生きている患者さんに使うのであれば優先されるべきだと思います。

多剤耐性緑膿菌による肺炎で他の抗緑膿菌作用のある抗菌薬が軒並み耐性の状況でドリペネムのMICが他の薬剤と比べて低めであれば,使用する可能性はありますが,幸い,今の日本では日常的に遭遇するような状況ではないので,そのような場面では専門家に相談した方がよいでしょう。

この研究結果を受けて,米国FDAではドリペネムには肺炎の承認を与えず,米国では複雑性腹腔内感染症と複雑性尿路感染症の適応しかありません。人工呼吸器関連肺炎での治療成績が悪かったからと言って,肺炎全般に適応を与えないのはおかしいと思われるかもしれませんが,市中肺炎にカルバペネムでなければいけない状況はかなり少ないと思いますので,使わなければならない状況であれば既に肺炎に承認を受けているカルバペネムで十分だと思います。結局,ドリペネムを肺炎に積極的に使うべき理由が思い浮かびません。

さて,最強の抗菌薬とは何なのでしょうか?


記事検索
Recent Comments
訪問者数
  • 今日:
  • 昨日:
  • 累計:

livedoor プロフィール
TagCloud
QRコード
QRコード
  • ライブドアブログ