DI Onlineのロゴ画像

DI BOX
薬の説明パンフレットの読み方
日経DI2013年7月号

2013/07/10

日経ドラッグインフォメーション 2013年7月号 No.189

 情報には通常、発信した人の意図が込められている。薬の製品説明パンフレットも、その薬を使わせようという動機で作られたものと認識すべきである。

 本稿では、薬の製品説明パンフレットで用いられている「お決まりの手法」を紹介し、基本的な読み方を解説する。

動物実験だけでは不十分
 まず、動物実験やin vitroで行われた研究の結果しかパンフレットに示されていない場合、それのみを診療現場でその薬を使用するか否かの判断に用いるのは危険である。基礎研究で証明された有効性をそのままヒトに当てはめるには、あまりにも論理の飛躍があり過ぎるからである。

 次に、「AはBのリスク因子である」という疫学研究の結果も要注意である。例えば「食後高血糖が心血管疾患のリスクになる」ことが証明されたとしても、「食後高血糖の是正が心血管疾患の発症予防につながる」かどうかは、改めて介入研究を行ってみなければ分からない。ところがパンフレットには、疫学研究の結果を示すのみで、介入の有効性を示唆する記述も多く認められる。

 従って、パンフレットに記載されている多くの項目のうち、本当に参考にすべきなのは、ヒトを対象とした臨床試験の結果のみである。さらに、結果を見る際のポイントは、(1)比較対象があるか、(2)アウトカムがどのように設定されているか、(3)グラフの縦軸がどうなっているか―の3点である。

比較対象をまず確認
 まず確認しておきたいのは、比較する対象があるかという点である。

 比較対象がない研究とは、例えばスタチン使用の前後でコレステロールの値がどれだけ下がったかといった、介入の前後で結果を比較した研究(前後比較研究)のことである。しかしこれは、「スタチンを使っ、コレステロールが下がっ、スタチンが効い」という、いわゆる「3た論法」であり、スタチンによる介入の効果を証明したことにはならない。

 その理由は簡単で、たとえスタチン使用後にコレステロールの値が低下したとしても、それは必ずしもスタチンが原因とは限らないからである。例えば、スタチンを服用すると同時に、脂っこい食事を制限していたとしたら、コレステロールの値が下がったのは、食事の影響であるという可能性が否定できない。前後比較研究には、このような、検討したい介入以外にどのような影響があったかについて、詳しく記載されていないことも少なくない。

 従って、比較対象がない研究の結果は、薬剤の効果の判断に用いてはならない。

患者にとって重要な「6D」
 次に、アウトカムがどのように設定されているかという点である。

 患者にとって大事なアウトカムは、死亡(Death)、疾患(Disease)、障害(Disability)、不快(Discomfort)、不満足(Dissatisfaction)、貧困(Destitution)の「6D」で示される1)。「死亡」や「脳卒中の発症」や「関節リウマチによるADLの低下」などは、患者にとって重要な「真のアウトカム」といえる。

 一方、「血圧値」や「血液検査値」などは、患者にとってさほど大事ではない「サロゲート(代用)アウトカム」である。しかし現実には、サロゲートアウトカムの方が測定しやすいため、研究のアウトカムとして設定されることが多い。

 注意すべきは、臨床試験の結果、仮にサロゲートアウトカムが改善したとしても、真のアウトカムも改善するとは限らない点である。例えば、経口血糖降下薬を服用するとHbA1c値(サロゲートアウトカム)は下がるが、脳卒中(真のアウトカム)を予防することはできない。

 従って、患者に薬を使うかどうかを考える際には、臨床試験で評価されているのが真のアウトカムであるかどうかを確認する必要がある。

「複合アウトカム」の問題点
 近年の臨床試験は、複数のアウトカムで評価することが一般的である。しかも、それら複数のアウトカムを合算した「複合アウトカム(composite endpoint)」を用いている研究も多い。複合アウトカムの評価には、特に注意が必要である。

 図1は、ある薬剤の有効性を検証した臨床試験の結果を示したものである。評価項目の欄を見ると、「心筋梗塞」「心臓死/突然死」「狭心症」「冠動脈血行再建術」という4つのアウトカムを合算して、「冠動脈疾患」という複合アウトカムとしている。

図1 複合アウトカムの見方

複合アウトカムは、それぞれのアウトカムを統合するため、イベント発症数が増え、有意差が出やすい。

画像のタップで拡大表示

 この試験では、冠動脈疾患が介入群で有意に少なく(ハザード比0.67、P=0.01)、それを基に、「心筋梗塞、心臓死/突然死、狭心症、冠動脈血行再建術を含む冠動脈疾患を有意に減らした」と記述されることが多い。図を見ずにこの文章だけを読むと、介入によってこれら4つのアウトカムの全てが有意に減ったと理解しがちである。

 だが、図1をよく見てほしい。対照群に比べて有意に減っているのは、心筋梗塞(ハザード比0.52、P=0.03)と冠動脈血行再建術(ハザード比0.60、P=0.01)だけである。復習のために言い添えると、統計学的に「有意」とは、P値が0.05未満の場合を指す。これは、ハザード比の95%信頼区間(の上限)が、「1.0」をまたがないということと同じ意味である。

 一方で、心臓死/突然死(ハザード比0.51、P=0.21)、狭心症(ハザード比0.83、P=0.35)は、統計学的に有意に減少したとはいえない。

 複合アウトカムでは、それぞれのアウトカムを統合するため、イベント発症数を水増しできる。そのため、有意差がより出やすいのである。

恣意的なアウトカムに注意
 さらにここで注意したいのは、アウトカムの一つに挙げられている「冠動脈血行再建術」は、介入者の意思が入り込む余地のあるアウトカムであるという点だ。

 冠動脈血行再建術は、冠動脈造影を行うことが前提となる。だが、胸痛があると訴えた患者に冠動脈造影を行うかどうかを決めるのは、患者と主治医である。そして、冠動脈造影を行って狭窄部位が見つかった場合、血行再建術を行うか否かを決めるのも、患者と主治医である。つまり、患者や主治医の裁量によって、冠動脈血行再建術を行うかどうか、言い換えればアウトカムとしてカウントされるかどうかが恣意的に決まってしまう可能性がある。

 しかも、図1では、冠動脈血行再建術は複合アウトカムの最も多くの例数(対照群66、介入群39)を占めている。恣意的に行われた可能性のある冠動脈血行再建術で有意な差を得ることによって、複合アウトカムにも有意な差が得られたことが推測できる。従って、複合アウトカムでは、構成する個々のアウトカムについて、個別に効果を評価する必要がある。

 さらに、研究前に設定されたアウトカムでは差が得られなかったにもかかわらず、研究を終えた後で有意な差が出るようなアウトカムの組み合わせを探して、もっともらしく有効性を訴える研究論文やパンフレットも存在する。言うまでもなく、全てのアウトカムは、研究開始前にあらかじめ設定されるべきものである。

グラフの縦軸で変わる印象
 3番目は、グラフの縦軸がどうなっているかという点である。研究結果の評価をする際には、グラフの縦軸に注目してほしい。

 図2は、カプランマイヤー曲線と呼ばれる生存曲線だ。この臨床試験では、食事療法に薬剤を併用すると、イベント発症が33%有意に抑制できるとしている。これだけを見ると、薬剤の効果が大きいと認識しやすい。

図2 カプランマイヤー曲線の視覚効果

リスク症例数が開始時点の半分以下になって以降の曲線は評価されるべきではない。

画像のタップで拡大表示

 このグラフの縦軸の目盛りは3.0%までだが、イベント発生率は最大で100%(全員にイベントが発生する)までの値を取り得る。仮にこのグラフの縦軸を100%に引き上げたとしたら、2群の生存曲線の差は縮小され(見た目にはほとんど重なるようになり)、“33%抑制”という印象も大きく変わるだろう。

 カプランマイヤー曲線に限らず、グラフの局所を拡大することにより、治療効果を実際より大きく印象付けることができる。

リスク症例数の意味
 このカプランマイヤー曲線では、グラフの下に示されているリスク症例数(No. at risk)が重要である。

 臨床試験では通常、イベントを発症した患者、研究期間終了に伴い追跡終了となった患者、中途で脱落した患者がいるために、追跡できた患者の数は経時的に減っていく。ランダム割り付けにより、研究開始時点で群間の背景因子が均質化されるが、それは経時的に崩れていくことになる。

 追跡途中であまりにも大幅に患者数が減少すると、群間のバランスが崩れ、それ以降の治療効果に介入以外の要因が影響することになってしまうため、介入そのものの効果が正しく評価できない。大ざっぱに言って、症例数が初めのおよそ半分以下となって以降の曲線は、評価されるべきではない。図2では、追跡6年時点のリスク症例数は、5年時点と比べて大きく減少していることが分かる。

 なお、このリスク症例数の数値は、時としてグラフから省かれていることがあるので、注意すべきである。

 図3は、結果が棒グラフで示されているが、やはり相対評価が用いられており、薬剤A高用量は薬剤Bと比較して、相対危険度減少率(Relative risk reduction:RRR)が35%と示されている。だがここでも、グラフの縦軸の目盛りは2.0%までに拡大されている。

図3 相対評価の視覚効果

比較結果が棒グラフで示されている場合は、必ずグラフの縦軸をチェックする。

 ここでRRRが35%とは、発症率が、薬剤Bの年率1.71%から薬剤A高用量の年率1.11%に減少したのを、薬剤Bを基準として、(1.71-1.11)/1.71=0.35と計算した結果のことである。しかし単純に差を求めると、年率にして1.71-1.11=0.60%分だけ減っているにすぎない。

 効果の大きさを示す別の指標があるので紹介しよう。イベント発症率が0.60%分減少するということは、1000人の患者を薬剤Bから薬剤A高用量に変更して1年間治療し、6人(6/1000=0.6%)のイベント発症を防げることを意味する。

 つまり、1人のイベント発症を防ぐには、1000÷6=167人の患者を、1年間薬剤A高用量に変更して治療する必要があるというわけである。この指標を治療必要数(Number needed to treat:NNT)と呼ぶ。残りの166人は、無駄に薬剤を変更したといえなくもない。

変化の幅にも要注意
 一方、スコアや検査値といった連続変数や順序変数がアウトカムとなっている場合、結果が絶対評価で示されることが多い。

 図4は、ある薬剤を高用量および低用量で投与した場合の症状スコアの変化量の推移を見たものである。プラセボ群と比較して、高用量群では24週後の症状スコア変化に4点という有意(P=0.0029)な差があり、この薬剤が有効であったとしている。

図4 絶対評価の視覚効果

グラフの縦軸が「スコア」や「検査値」といった連続変数や順序変数の場合、その上限と下限の値がどのように決められているかを把握する。

画像のタップで拡大表示

 ここでグラフの縦軸に注目してみると、症状スコアの変化量とある。この症状スコアとはどのようなものだろうか。仮に症状スコアが0~10点の10段階評価だとすれば、4点の差は極めて大きいといえる。しかし、症状スコアが1~100点の間の値を取り得るとしたら、4点の差など実感できるレベルですらないかもしれない。

 このように、連続変数や順序変数の場合、上限と下限の値がどのように決められているかを把握する必要がある。パンフレットの中にそれについての記載がない場合は、インターネットなどを用いて元の論文などを調べるひと手間をかけたい。

 以上が薬の製品説明パンフレットの簡単な読み方である。どのポイントもさほど難しいものではないが、知っていればパンフレットの印象もかなり変わるだろう。

 製薬会社も営利企業であり、利益がより上がるように宣伝をするのは当然である。しかし私たちは患者を守るために、より正確な情報を得るように努めなければならない。ぜひ、手元にある製品説明パンフレットを見直して、上記のポイントをチェックしていただきたい。

(東京北社会保険病院総合診療科・南郷栄秀)

参考文献
1)Fletcher RH, Fletcher SW, Wagner EH:Clinical Epidemiology:The Esentials. 3 rd ed. Williams & Wilkins 1996

  • 1
  • このエントリーをはてなブックマークに追加

この記事を読んでいる人におすすめ