<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
    <channel>
        <title>MRのためのエビデンス読解術</title>
        <link>https://www.mixonline.jp</link>
        <description>ミクスOnlineは、ヘルス・サイエンスの発展に欠かせない要素である医薬品業界の市場情報やヘルス・サイエンスに関わる人々の知識向上につながる情報・サービスを提供する医薬情報サイトです。</description>
        <language>ja-JP</language>
        <copyright>Copyright © 2009-26 株式会社ミクス</copyright>
        <image>
            <url>https://www.mixonline.jp/Portals/0/logo.gif</url>
            <link>https://www.mixonline.jp</link>
            <title>ミクスOnline</title>
        </image>
        <item>
            <title><![CDATA[“その研究は、誰のため？”─臨床倫理と利益相反─]]></title>
            <link>/tabid55.html?artid=39230</link>
            <description><![CDATA[独立行政法人国立病院機構東京医療センター臨床研究センター　臨床疫学研究室長　尾藤 誠司本シリーズは、現場の臨床医に医療情報を伝達するMRが、プロフェッショナルとして診療エビデンスを理解し、解釈し、実際の診療に役立てるような形で、医師と適切にコミュニケーションをとることを支援するための技術について解説してきました。今回はその最終回です。最終回にある意味ふさわしいかもしれませんが、臨床研究に関する倫理的な側面、さらに、最近よく取り上げられるようになってきた利益相反について説明したいと思います。◎臨床と臨床研究の違い臨床研究を行う主体となる人間にとって、避けることのできない重要な事項に、研究に関する倫理的な検討があります。通常、臨床研究を行う上では、一部の例外を除きすべからく施設の倫理審査委員会への申請を行い、研究実施の許可を得る必要があります。一方、延命治療の差し控えや、インフォームド・コンセントの問題、せん妄患者の身体抑制など、臨床においても倫理的な問題を大きく含む状況は毎日のようにありますが、臨床における医療行為においては、ほぼ現場の裁量に任されています。それはなぜなのでしょうか？一言でその理由をいうのであれば、日常の臨床においては、医療はその直接の受益者である目の前の患者の利益に基づいて行われている、という社会契約の上で成り立っているからです。すなわち、通常の臨床行為は、よほど挑戦的な内容を含んでいるのでいなければ、基本的には対象となる患者さん自身の利益に基づいて行われるとみなされるため、基本的には現場の判断に任せるということになります。一方、臨床研究そのものが生み出すものの目的は、目の前の患者さんの利益ではないというのが原則的な考え方です。臨床研究が原則的に生み出すものは情報です。たとえば、「Ａという薬を一定期間服用すると、服用しない場合に比較してＸというアウトカムの発生する度合いが半分になる。」というような情報であり、その情報を提示することが臨床研究の意義です。臨床研究に参加いただく患者の皆さんは、それによって直接利益を受けるわけではありません。しかしながら、被験者が臨床研究に参加したことによって直接害を受ける可能性は発生します。臨床研究で行われる行為は、日常の医療行為を患者にとっての最善行為であることを前提とした上で、その範囲を超えて行われるものとみなされるのです。だからこそ、そこで行われる行為によって、患者の権利が侵害されることがないか、患者が得る不利益が許容範囲にとどまるものであるのかについて、多数の視点から吟味される必要があるのです。同時に、臨床研究の目的は、今後の医療を良くしていくための情報を生み出すことにあるわけですから、はたしてその研究事業が今後の医療の発展に寄与する情報を生み出すことが出来るのか、ということについて審査がなされなければならないのです。臨床のエビデンスは、臨床研究に参加していただいた方々の負担によってつくられた成果物です。その意味では、臨床研究においてもっとも倫理的な行為は、その研究をしっかり完遂し世に出すことであり、医療サービスにおいて倫理的な行為とは、臨床研究によってつくられたエビデンスを適切に解釈し、日常臨床に適用することであるともいえるのです。◎情報によって利益を得る主体以上のことから考えると、臨床研究によって得られた情報によって利益を得るべき主体は、医療サービスを受ける患者であり、健康生活を保障されるべき国民である、ということは当然のようにおもわれます。また、研究成果であるエビデンスは、あらかじめ患者や国民の健康利益基づいて表現されるべきです。しかしながら、実際にはエビデンスによって利益や不利益を得るのは患者や国民ばかりではありません。エビデンスによってその利益が左右される典型的な主体は、皆さんが勤務している製薬企業です。莫大な資金をかけて開発した新薬が、プラセボや、もしくは既存の薬物に勝る効果を示さなかったり、重篤な副作用を起こしうることが根拠として提示されたりすれば、企業の運営上の利益としては大変な損失になります。医療サービスの直接提供者である病院も、臨床エビデンスに対して少なからず直接の影響を受けるでしょう。たとえば、脳梗塞が発症して３時間以内に再還流療法を受けることで予後が改善するというエビデンスが明らかになった後、救急車や病院は、如何に３時間以内に再還流療法を開始できるかという仕組みを考え、中には構造的にかなり無理をした勤務体制をとる必要が出てきます。患者の健康利益を高め、不利益を最小にするためにつくられる臨床エビデンスによって、患者や国民以外の集団に別の影響が起きうるとき、そのエビデンスが発信されるまでの過程の中で、何らかの作為が入る危険性があります。「風が吹けば桶屋が儲かる」の回で説明した通り、疫学においては、原因と結果の関連を説明する際にいくつもの交絡因子やバイアスの影響を考える必要があるのですが、実は、バイアスの中で最も懸念されるべきバイアスは、この「作為」に基づく情報バイアスです。なぜなら、あるひとつのデータについて、そのデータの品質が不正確であった場合、そこにはバイアスが生じることになりますが、そのバイアスは通常仮説の中で比較されるどの対象に対しても同じように不正確ですから、結果がその不正確性のために右に傾くか左に傾くかはイーブンということになります。しかしながら、作為というバイアスは、研究結果を患者ではない誰かの利益に基づき、常に一定の方向に結果を曲げようとします。そのため、臨床研究論文を読む際に重要視すべきは、その研究にかかわっている人間が、純粋に患者の利益以外の利益を追求しようとしていないか、という点なのです。最近、「利益相反」という言葉をよく耳にするようになってきました。利益相反の基本的な考え方は、通常ある対象の利益を目的に行為を行う人間もしくは集団が、構造上その対象者の利益以外の利益を追求しうるような状況にないかどうか、という、立場上の矛盾関係について言われる言葉です。臨床研究においては、たとえば、ある薬の効果を検証する研究班の誰かが、その薬を製造販売する企業の株主であったりした場合には、明確な利益相反関係にある、ということになります。このような場合は、研究結果が不正な利益を生む可能性が強く、研究者は当該研究へ関与を禁止されます。わが国でも、利益相反に関する倫理コードの必要性が議論され、平成２０年には厚生労働省からも臨床研究における利益相反管理のための指針が発出されています[1]。ただ、こうした立場としての利益相反関係以外にも、医療専門職のように国民との社会契約の中にある人間は、常に自分の職務上の行為が利益相反を生む可能性がないかどうかについて感受性を高く持つべきであると私は考えています。]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Tue, 29 Jun 2010 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[エビデンスと、エビデンスに基づく医療]]></title>
            <link>/tabid55.html?artid=39079</link>
            <description><![CDATA[独立行政法人国立病院機構東京医療センター臨床研究センター　臨床疫学研究室長　尾藤 誠司◎エビデンスのヒエラルキー本シリーズでは、ＥＢＭのステップの中でも、特に医学文献の批判的吟味を中心に解説してきました。以前の稿でもご紹介したように、臨床研究の根拠の質は研究のデザインによってヒエラルキー構造となっています（図１）。すなわち、ランダム化比較試験（ＲＣＴ）によって得られたエビデンスは最高であり、その次にランダム化のない比較介入研究、その次が前向きコホート研究、後ろ向きコホート研究・症例対照研究、比較群のないケースシリーズ研究という差別社会が医学文献にはあるのです。その格付けは、確かにおおむね正しいのですが、あまりにも短絡的に「ランダム化比較試験　＝　信じるべき」という図式がまかり通りすぎてしまっている状況をみると、へそ曲がりな私としてはいやいやそれは違うだろうと少し突っ込みを入れたくなってしまいます。今回は、「ＲＣＴだから信じられる。」「観察研究だから価値がない。」といった、短絡的な二元論に対して、あえて異議を唱える形で、患者のための医学情報とはどのようなものであるべきか、ということについて考えてみたいと思います。◎ＲＣＴにおける内的妥当性まず、以前にも提示した臨床エビデンスのヒエラルキーをもう一度ご紹介します。図１のように、ＲＣＴは医学文献において最も上位のクオリティとして位置づけられています。ＲＣＴがエビデンスとして信頼できる理由は、なんといっても内的妥当性の高さにあります。まずは、この内的妥当性というものについて検討したいと思います。内的妥当性とは、簡単に言うとその研究において立てた仮説を、その研究において得た結果そのものが妥当に反映しているかどうか、ということです。たとえば、「ある薬物Ａを内服した群と、同期間プラセボを内服した群においては、半年後の検査値Ｘの値に有意な差を認める。」という仮説は、薬物の臨床試験ではきわめて一般的な仮説です。そして、ＲＣＴはこの仮説に対して最も忠実な答えを導き出す方法であることは確かです。比較研究において、結果をゆがめる最も大きな要因は交絡因子です。原因を「薬物Ａを飲んだか、それともプラセボを飲んだか」とし、その結果を「半年後の検査値Ｘ」とした場合、原因と結果との関係に横槍を入れるいくつもの要因が懸念されます。ＲＣＴは、比較される2群なり3群なりが、「無作為に割り付けられる」ことによって、その偶然性をもって「薬を飲むかプラセボを飲むか以外の要因は、すべて同じ集団ですよ。」ということを論理的に宣言するわけです。この宣言はなかなか説得力があるもので、確かに実証的にも比較対象となる2群なり3群なりは、介入プログラムの違い以外は同じ背景を持つことになります。ＲＣＴのもうひとつの優位な点は、介入プログラムの内容が一定しているということです。現実の臨床においては、治療行為は臨床的な経過の変化に基づいて随時変化します。たとえば、効果がいまひとつであれば別の薬に変更してみたり、結果がよければ薬の減量や中止などが行われたりします。さらには、患者さんは必ずしも医療者が計画したとおりの医療行為に準じるとは限りません。薬を飲み忘れることや、数回受診をすっ飛ばしてしまうことなどもしばしばです。検査についても、予定された半年後に検査がなされるかどうかは日常臨床では不確実ですし、検査の内容も場当たり的なものになります。その結果、ただ日常の臨床から発生するデータというものは、その原因に関するデータについても、結果に関するデータについても不十分なものといわざるを得ません。一方、介入研究においては、研究にご参加いただける被験者の皆さんに対して治療プロトコルの十分な説明、及びその後もプロトコル遵守のためのフォローアップが厳格に実施されます。また、介入開始後のアウトカム評価の日程も厳密にスケジュールが組まれますので、そこから得られたデータは、高い品質を持ったものとして提示されるわけです。◎ＲＣＴにおける外的妥当性以上のように、現実の臨床というよりは、特定の治療介入プロトコルをなるべく理想的な環境にそろえた上で、原因と結果との関係を純粋に描き出した上でもたらされる結果を、「効能（efficacy）」と一般的には読んでいます。ＲＣＴは、特定の医療介入プログラムの効能を知るうえでは、現在最も理想的な研究デザインであることは間違いありません。では、日常臨床において医療専門職が行う行為によって、患者が得る利益は果たして「効能」と呼ぶべきものでしょうか？日常臨床では、ある特定の治療プロトコル以外の要素に満ち溢れています。薬の選択ひとつにしても、医師は患者の顔色を伺いながら、「この人は前向きに対処してくれそうだ」とか、「この人はずさんだから昼の内服は出来ないかも知れないな。」とか査定しつつ、その人やその場に応じた治療プログラムと、その後の評価を行っていきます。このように、不安定な現実の世界の中で、さらには原因以外のさまざまな要因が排除できない中で提示されるアウトカムの比較差は、「効果（Effectiveness）」と呼ばれています。特定の薬の承認プロセスなどにおいては、なるべく純粋な原因と結果との関連を提示する根拠が必要だと考えます。その意味において、治験のデザインがＲＣＴを基本としていることはきわめて全うなことであり、ＲＣＴの結果をもって「この薬を有効なものとして承認する」という結論を導き出すことに問題はありません。しかしながら、現実の臨床の世界における仮説は、実は「この薬は有効か？」ではなく、「この薬を今この患者さんに開始することは有効か？」ということなのです。その観点から考えると、ＲＣＴがもっている「強さ」というものと、臨床への「還元への度合い」というものが必ずしも一致するものではないということがなんとなく理解できるかと思います。臨床研究が提示した結果をどれだけ日常の臨床の世界に持ち込めるか、という視点から見た妥当性を「外的妥当性」と一般的に呼んでいます。ＲＣＴで得られる結果は、内的妥当性は非常に高いが、外的妥当性には批判されるべき部分を多く含む、ということです。では、ＲＣＴ論文を読んだときに、この論文結果は外的妥当性があるかどうかについてどのように批判的に読んでいけばよいでしょうか？ひとつは、いわゆる患者の選択基準・除外基準の部分です。実際に研究に参加した人たちがどのような人たちであったか？その人たちは日常的に臨床医がイメージする患者さんたちとどれくらい似ているか？ということについて臨床医自身とコミュニケーションをとりながら考える必要があります。糖尿病治療薬などにおいては、ＢＭＩや食生活、自己管理に関するイメージなどが必要でしょうし、精神疾患などに関する薬剤においては、担当医との診療歴などが、外的妥当性を決める重要な因子かもしれません。もうひとつは、行われた治療計画とその後の評価方法が、現実の臨床にどれほど即しているかという部分を吟味する必要があります。治療が一定して持続することが研究計画と同じ程度あるのかどうか、さらには、治療効果を判定する項目が、現実のスケジュールに即したものかどうかなどが重要になります。このあたりは、臨床医でないと分からない部分が多々ありますので、臨床医とのコミュニケーションが必須となるでしょう。◎ＲＣＴのデザイン上の弱点先ほど、ＲＣＴは内的妥当性においてきわめて優れていると書きましたが、実はその中でも注意しなければならないことがいくつかあります。これは、前向きにデータを収集していく研究デザインにどうしてもついて回る弱点です。まずは、ＲＣＴだとしても、盲検化がなされているか、という点はきわめて重要です。盲検化がなされていなければ、どうしても研究者が仮説を検証したい方向に研究プロセス自信を仕向けてしまうということが、意図的、もしくは意図せずとも起こってしまいます。そのため、治験などのプロセスには、介入の対象となる薬剤が患者にも処方する医師にも分からないようにする方法をとっており、これを二重盲検法と読んでいます。しかしながら、二重盲検であれば本当に十分でしょうか？おそらく、介入が薬物であれば2重盲検で十分であることが大半なのですが、実は、盲検すべき箇所は他にもあります。それは、評価者のレベルでの盲検化および、解析者レベルでの盲検化です。評価が検査値などのように客観的に査定されるものではなく、うつの度合いやＡＤＬの改善、じょくそうの治癒程度などのように、評価者の視点が加わるものに関して言えば、評価者が割付について盲検かされていなければ、その時点で色眼鏡が入ってしまうかもしれません。大切なことは「二重盲検ＲＣＴだからバイアスはない」と鵜呑みにせず、常にこの情報が臨床に役に立つかを考えることだと私は思います。◎研究に参加した患者さんと目の前の患者さん実際の臨床において研究の意図を持たずに蓄積されたデータは、データに意図がないという意味では、前向き研究のデータよりも良質であるということも一面ではあります。表１に、ＲＣＴと観察研究（特に後ろ向きデータの収集による観察研究）との利点と欠点に関する対比を示しました。例えば、記載項目がきちんとテンプレート化されているような電子カルテが日常的に使用されているような施設において、臨床を目的として記載され、その結果蓄積されていくデータを研究目的に二次利用することは、今後重要な臨床研究の手段となってくるでしょう。そして、それらのデータから解析された結果は、ＲＣＴのようによくデザインされた研究から生成された結果に比較してよい面もあれば悪い面もあるということです。どちらが優れているのかということではなく、臨床研究の結果を最も妥当な形で個々の患者さんに応用していくか、その上でこの結果をどのようにして解釈していくべきか、ということが、文献のユーザーにとってはなんといっても重要なことなのです。そのためにＭＲがすべきことは、論文をしっかり読み込むこととともに、医師がどのような状況において、どんな患者さんに対するどのような医療行為について疑問を持っているのか、ということを、医師としっかり共有することなのだと思います。]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Sun, 30 May 2010 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[エビデンスはどこにある？─患者中心の文献検索─]]></title>
            <link>/tabid55.html?artid=38797</link>
            <description><![CDATA[　今更こんなことを言うのは失礼かもしれませんが、正直なことを言いますと、私自身はＭＲさんに情報提供のお世話になることはめったにありません。その理由は３つです。ひとつは、情報にアクセスする方法を知っていること、ひとつは、確認したい文献のフルテキストを入手できる環境的な条件がそろっていること、そしてもうひとつは、立場上利益相反に対して通常の医師よりも意識をかなり高めにしていること、が理由です。本日は、いつもとは若干趣向が異なりますが、今一つ目の理由としてあげた情報リソースへのアクセスについてのお話をしたいと思います。◎インターネットと情報　世界におけるこの10年は、様々なものが変革しました。ただ、その中でも生活者における最も大きな変革のひとつは、インターネットの普及による情報のあり方の変化だと思います。インターネット上には信じがたいほどの情報量があるとともに、ある程度の検索技術があれば、その情報を整理された形で適切に引き抜いてくることが出来ます。たとえば、私は自分の過去の業績集などを作る際に、カレンダーとにらめっこするよりもGoogle検索のほうがはるかに短時間に、しかも漏れが少なく過去履歴を整理できると感じています。また、患者さんの診療中に分からないことがあると、患者さんと一緒に診察室でサイトの検索をしたりすることもしばしばあります。自宅のＰＣから無限ともいえる情報リソースにアクセスできる時代にあって、生活者の情報に対するスタンスは大きく変わりつつあります。端的に言えば、情報は上から降ってくるものではなく、自ら検索し取り出してくる、というスタンスへの変化です。そのように情報に対するスタンスが変化した時代においては、もはや｢よく知っている｣ということの価値は小さくなってきます。むしろ、いかに短時間に、妥当な情報にアクセスできるかということ、さらには、その情報をいかに自分の現場で活用するための技術を持っているかということが、インターネット時代の情報化社会には必要な技術であるといえます。　翻って、医師がそのような情報の検索技術、適切な情報リソースへのアクセス、効率的な情報マネジメントに長けているかといえば、むしろ下手な部類に入るでしょう。仕事についてからの医師は経験から学ぶという学習方式をあまりに標準的なものとしてしまっているため（この経験から学ぶ、というのは、実学としては最も重要な学習方法であることは確かなのですが）、体系的に新たな基礎技術を取り入れていくことを後回しにしがちです。自らの診療を支える適切な医療情報を迅速に入手するための基盤整備や技術を持っている医師は、まだ少数派であるといってもよいでしょう。たとえば、先月紹介したMindsは。医療情報リソースとしては極めて妥当かつ便利なものであるにもかかわらず、Mindsの存在すら知らない医師はゴマンといるわけです。多くの医師にとって、情報はまだまだ引き出してくるものではなく、上から降ってくるもののようです。◎どのリソースにあたればいいか？　医療を支援するための情報を効率的に入手するために必要なことは、情報リソースについて知ることと、各々の情報リソースの使い方について知ることです。まずは、情報リソースについてご紹介したいと思います。　医学文献リソースは、大きく分けると一次文献リソースと二次文献リソースに分かれます。一次文献は、いわゆる論文そのものです。論文そのものにアクセスし、読むことが出来れば、詳細な情報を入手できる可能性が高いですが、一方で臨床判断に必要な知識のみをかいつまんで入手することはある程度の技術が必要です。一次文献のリソースにおいて和文で有名なものは医学中央雑誌Web、海外文献であればPubMedになります。PubMedについては後ほど解説します。　二次文献リソースは、広大な一次文献リソースをセレクトしたり、アレンジしたりすることで、より臨床現場にとって利用価値が高く効率的なものにまとめられた情報リソースと考えればよいでしょう。二次文献リソースの多くは有料ですが、Mindsなどのように一部無料なものもあります。以下、多くのＥＢＭの実践者が利用している二次文献リソースをご紹介します。◆National Guideline Clearinghouse　http://www.guideline.gov/　Agency for Healthcare Research and Quality (AHRQ)が運営している、英語媒体での診療ガイドラインを集めた無料のライブラリー。ガイドラインの内容も吟味されており、ガイドライン中の推奨文に関して、推奨グレードの表記も行われています。Mindsは日本語なのでとてもよいのですが、対象となる疾患がまだ少ないので、診療ガイドラインを参照したいけれどもMindsに対象となるものがない場合には利用価値は高いです。◆東海大学医学メディアセンター　　http://www.mnc.toho-u.ac.jp/mmc/guideline/list1-4.htm#hana　ここは二次文献リソースというよりは、各種診療ガイドラインへのリンク集といった趣ですが、非常にまとまっていて使いやすい構造になっています。こちらも無料の公開情報のリンク集なので使い勝手がよいです。◆UpToDatehttp://www.uptodate.com　とてつもなく有名な電子教科書で、研修医もよく使用しています。UpToDateのよいところは、教科書の持つ体系的な知識のまとめ方がなされているのと同時に、最新のエビデンスに基づいて情報が定期的にアップデートされるところにあります。さらに、関連付けされるリンク機能や、特定の診療行為に関する推奨の根拠となった一次文献の抄録を１クリックで見ることが出来るので、臨床医にとっては極めて使い勝手のよい情報リソースとなっています。有料ですが、研修医であれば年間2万円程度の契約料ですので、個人契約している研修医は少なくありません。iPhoneの普及に伴い白衣のポケットに入れておくことが出来るので、エビデンスに基づいた確かな情報は、ベテランよりも研修医のほうがもっていることがしばしばあります。◆ＡＣＰ Journal Clubhttp://www.acpjc.org　EBMの実践者に非常に人気の高いリソースで、Annals of Internal Medicine の巻末付録としてついてくる、重要論文の要約集です。性質上内科領域が多いですが、内科領域以外の領域のレビューも載せています。基本的にひとつの論文を１ページにまとめ、その中に重要な研究結果を人目で理解できるようなアレンジがなされているとともに、専門科のコメントも記載されていますので、臨床への還元を目的に読む情報量としてはこの１ページだけで十分であることが多いです。◆Dynamed　http://www.ebscohost.com/dynamed/　UpToDateよりもよりアダルト向けのコンテンツで、iPhoneなどのＰＤＡで使用する上では非常に使い勝手のよい情報のまとめ方がなされています。教科書的な記載ではなく、ある問題に値して、診断とか治療のカテゴリの中で、気の利いた根拠を迅速に入手できるため、プライマリ・ケア系の医師に人気のあるコンテンツです。◆Cochrane Library　http://www.cochrane.org/　こちらは有名なメタ分析の情報リソースです。メタ分析とは、過去に行われた複数の臨床研究を集積して、データを統合させた上で分析しなおすような手法のことを言います。Cochrane Libraryでの情報は世界的にも非常に信頼性の高い情報として認知されており、この情報源は、網羅的かつ便利な情報というよりは、現時点で最も信頼に足る情報の入手という視点から有用であると考えるべきでしょう。]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Mon, 29 Mar 2010 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[法律？随筆？─診療ガイドラインの使いかた─]]></title>
            <link>/tabid55.html?artid=38635</link>
            <description><![CDATA[　最近、わが国でもいわゆる診療ガイドラインの作成過程、その位置づけ、活用のされ方に大きな変化がおとずれようとしています。一言で言うと、「権威に基づいた診療ガイドライン」から、「エビデンスに基づいた診療ガイドライン」への方向転換がおこっているということです。実はこの流れは、わが国の医療全体を変えていく大変重要な変化だと私は認識しています。そして、情報を取り扱うプロフェッショナルの皆様にも、是非この重要な点について理解していただきたいと思います。「ガイドライン」の意味するもの　よく「日本人の悪い癖」といったりしますが、多くの場合は日本人特有のものであるというよりも、ある一定の集団文化をさして、そういった揶揄をすることが多いように見えます。ただ、それでもおそらく日本人にありがちな傾向という行動パタンはいくつか存在します。そのひとつが、「明文化された法律っぽいものに弱い。」ということではないでしょうか？　日本は法治国家です。まあ、日本以外も多くの先進国は法治国家です。法治国家では、法律は守らないと罰せられます。法的規範は社会を生きる上でのルールですから、まず守る、ということが目的となるわけです。だから、政治の世界でも、ある政策がいいか悪いかということとは関係なく、「その政策が憲法違反かどうか」ということで世の中は盛り上がるわけです。それってどうなんだ？という疑問も確かにわきますが、まあ、法とはそういうものです。さらに言うのであれば、法を守ることがよいことなのではありません。法を守らないことが悪いことである、というのが法の特徴です。　一方、世の中には明文化された「法らしきもの」がいくつか存在します。たとえば、「心得」とかそんな感じですね。華道とかだと、心得などは、ときに法以上に人に精神的な拘束力を持たせるものになるかもしれません。　さて、いくつかある「法らしきもの」のなかで、医療に携わる人間がしばしば触れるものが、「指針」とよばれるものや、「ガイドライン」と呼ばれるものです。ガイドラインは、日本語で言うなら「指針」に相当するものです。意味合い上、ガイドラインや指針と、法律とは全然その拘束力が違います。法律は基本的に例外なく守らなければならないものであり、同時に守らないことで罰則が与えられるものです。一方、ガイドラインは、守らなければならないという前提すらありません。あくまでも、「スタンダードな方向性としてはこんな感じですよ。」というのがガイドラインの持つ本質的な意味です。　このあたりは、実は医師よりも薬学系の方の方がずっと知識があります。たとえば、治験と自主臨床研究の差を考えてみてください。治験は薬事法上のＧＣＰに則って行われるものであり、ＧＣＰに準拠していなければなりません。そこには強い拘束力が働くのです。一方、医師が行う自主臨床研究では、通常規範となるべき公文書は「疫学研究の倫理指針」だったり、「臨床研究の倫理指針」だったりします。これらは、あくまでも指針レベルのものであり、薬事法とは一線をかすことは薬学系のバックグランドを持つ方であれば普通に知っていることです。　拘束力は、一般的に、法律＞警告＞指令・注意＞勧告＞推奨＞指針＞参考　という順に強くなります。たとえば、図１に示すような薬剤添付文書上赤字になっている部分、および赤で囲われている部分については、赤ければ赤いほどその拘束力は強くなります。一般社会においては、「000をすべきである。」という言葉につく以上の枕詞によって、その文面の拘束力に配慮しながら現実的な自らの行動を考えていく必要がありますが、一般的に医師はこのあたりの言葉の解釈が苦手です。すなわち、非常に拘束力の強い文面であっても、自分の裁量がかなりあると信じている場合があると共に、指針レベルのもについても、あたかも法律であるかのような拘束力があると考えて、患者さんの利益を離れた行動をとることもしばしばあるわけです。ガイドラインの本質的な目的は、「守る」ことにあるのではなく、「うまく使う」ことにあるのです。　医師の多くは診療ガイドラインを誤用しています。その多くの理由は、医師が「ガイドライン」という意味をよく理解していないことですが、もうひとつの大きな理由は、ガイドラインそのものが、本当にガイドラインとしての体をなしているかが疑わしい、ということにあります。診療ガイドラインのピンとキリ　では、どのような診療ガイドラインが「使えない」ガイドラインで、どのようなものが「使える」ガイドラインなのでしょうか？それは、シンプルには２点、ひとつは、診療エビデンスに基づいて作成されたものであるか、ということ、もうひとつは、しっかりとした手順に則ってつくられたものであるか、という点で決まってきます。　実は、ごく最近までの診療ガイドラインは、大学のエライ先生の個人的な意見に基づいた、ある意味エッセイ的な文書であったことがきわめて多かったのです。どこかの出版社の「ＸＸＸＸ治療指針」の副題に“私はこう治療している”とバーンと書かれてあるのがそのわかりやすい例であるといえます。まあ、これはこれでよいところもあるのですが、このような権威的専門家の意見で指針が作られていく問題点も実は非常に多いのです。たとえば、どうしても権威的専門家の意見は先進的な部分に目が行ってしまい、最先端の診療技術についての記述にウェイトがたくさんかかってしまうことが常なのですが、日常診療においては、そのあたりはむしろ専門家に任せればよいマニアックな領域であることが多く、一般的な診療指針になりにくいということが指摘されています。そのほかにもいろいろな問題点はありますが、最も大きな問題点は、権威的専門家による推奨が何を根拠にされており、その推奨の強さがどの程度のものなのかよくわからない、という点です。そのような推奨を目の前にしたとき、現場の臨床医は、その推奨が参考程度のものなのか、それとも強い拘束力をもつものなのか、はたまた甚だ怪しいものなのかについて判断することができません。　最近よく言われる、「エビデンスに基づく診療ガイドライン」は、ＥＢＭ時代の流れを受けてそのあたりの問題点を解決するべく作成された診療ガイドラインです。すでに様々な疾患領域でエビデンスに基づく診療ガイドラインの作成と発表は行われており、診療行為の一つ一つにその根拠となる出典が付記されるようになりました。これは大変重要な変化だと思います。ちなみに、表１に推奨文の根拠の質を簡単に差別化するための記述を載せました。「専門家個人の意見」が最もレベルの低い根拠として位置付けられておるところが、複雑な気持ちではありますが革新的で重要な部分だと思います。表１　診療エビデンスレベルの差別化（診療ガイドライン作成の手順　Ver. 4.3 より）Level Iランダム化比較試験のメタ分析/システマティック・レビューLevel II１つ以上のランダム化比較試験による根拠Level III非ランダム化比較試験による根拠Level IVコホート研究、症例対照研究等比較分析疫学的研究Level Vケース・シリーズ研究や複数の症例報告など記述的実証根拠Level VI専門家個人の意見]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Thu, 25 Feb 2010 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[事の大きさ─その理解と伝え方─]]></title>
            <link>/tabid55.html?artid=38480</link>
            <description><![CDATA[　前回、前々回と、臨床研究の結果を理解する際に、比較されるものとの差をテーマに書かせていただきました。差があるということは、推論の考え方としては、どちらかの方法はもう一方の方法よりも有効である、という結論を導き出していると考えてよいでしょう。一方、Ａという方法よりもＢという方法があるひとつのアウトカムに対してより有効な方法である、という論証が出来ただけで、「ではＡはやめてＢにしましょう」と人は単純に意思を変えるでしょうか？医師は基本的に新しい物好きなので、あまり思慮なくさらっと変えてしまうひとも少なくないかもしれませんが、通常はそのほかにもいくつかの条件をクリアしないといけないでしょう。たとえば、いくらＢのほうが優れているといっても、Ｂの値段がＡの10倍するとしたらどうでしょうか？ちょっと躊躇するのが普通の考え方です。また、医療行為は通常たった一つのアウトカムに作用するわけではありません。好ましい作用について有意差があるとしても、好ましくない作用についても有意差があれば、やはりそこは悩ましいことになります。　しかしなんといっても重要なのは、「ＢのほうがＡよりも効く」ということではなく、「ＢのほうがＡよりもこのくらい効く」という、アウトカムに影響を与える度合いの大きさなのではないでしょうか？前回にも解説したように、「ほんのちょっとの差」を検証するために大規模臨床試験は躍起になることがありますが、患者から見れば、ほんのちょっとの差を獲得するために毎日薬を飲まないといけなかったり、好きな晩酌をあきらめたりすることはたまったものではありません。ＡとＢとの間に、納得できるほどの臨床的に意味のある差があって、はじめて実際の臨床で役に立つといえるのです。今回は、臨床研究論文に書かれている数字上の差を、実際の臨床に当てはめた場合にどう解釈するべきなのか、さらには、情報提供者としてどのように伝達するべきなのかについて考えたいと思います。そこにある差の解釈　まずは、表の「Table 3」を見てみてください。　これは、最近のAnnals of Internal Medicineに掲載されたランダム化比較試験で、出血性胃十二指腸潰瘍で入院した患者さんに対して、急性期のプロトンポンプインヒビター（ＰＰＩ）３日間の大量静脈投与が、その後の再出血予防に効果があるかどうかについて調べた研究の結果です。主要アウトカムは7日後まで、および30日後までの再出血の有無としており、375名がesomeprazole 80mg/日ボーラス＋8ｍｇ/時間持続静脈投与を72時間受け、389名はプラセボが投与されています。表の中身を見ていきましょう。主要アウトカムである7日後及び30日後までの再出血の割合は、3行目と４行目にありますね。中身を見ていきますと、esomeprazole投与群においては、7日目まで、及び30日目までの再出血の割合はそれぞれ7.2％と7.7％。プラセボ群においてはそれぞれ12.9%、13.6%だったようです。どちらもＰ値は0.01以下のようですので、有意な差があるようです。　さて、皆さんはこの差をどのように理解するでしょうか？この結果を見て、一番よくあるパタンが「有意なのですばらしい。これからは急性期のＰＰＩ大量投与だ。」という結論に単純にいってしまうパタンです。皆さんは、もう桃の誘惑（前々回参照）にも大規模臨床試験のワナ（前回参照）にも惑わされないはずですから、もう少し突っ込んでこの結果を解釈しようとするに違いありません。では、どのような解釈の方法があるでしょうか？次にあるパタンとしては、なんとなく感覚として「けっこうちがうなあ！やはりＰＰＩはよく効くんだなあ。」という認識の仕方です。それはないだろう、と思う人もいるかもしれませんが、我々の日常生活でやっている価値判断なんてだいたいそんなモンです。たとえば、冷蔵庫に牛乳がどれくらい余っているか、コンビニに買いに行かなくちゃ行けないかどうかを判断するとき、いちいち「まだ620ｍｌくらい残っている」とかやるでしょうか？手で持った重さとか、視覚的にまだ大丈夫そうとか、そのようなもので判断してませんか？実は、このような感覚的な判断は結構妥当なことが多いのです。体で覚えている感覚ですので。ただ、こと医学となると、対象にしているアウトカムの重さだとかも違いますし、毎日仕事として関わっているものの、自分が肌で感じている差と、研究結果では実はずいぶん感覚が違うことも多いのです（たとえば、今回の場合、プラゼボだったとしても9割がたは再出血しない、という感覚は、常に治療に軸足を置いている専門職には分かりにくい感覚です）。]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Thu, 28 Jan 2010 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[大規模臨床試験について理解する]]></title>
            <link>/tabid55.html?artid=38370</link>
            <description><![CDATA[　さて、ＥＢＭ時代、エビデンスの頂点に君臨するかのように「大規模臨床試験」という言葉が聞かれます。このシリーズにおいて、大規模臨床試験について避けるわけには行きません。ということで、今回は大規模臨床試験をどのように理解し、どのように臨床に応用するか、どのように臨床医に情報提供を行うかということについて考えてみたいと思います。例によって、ちょっと斜に構えながら考えて見ましょう。◆大規模臨床試験はなぜ必要か？　さて、みなさんは、大規模臨床試験のイメージをどのようにお持ちでしょうか？やはり、「グーの根も出ない説得力」「大規模臨床試験で有意差がある治療は強く勧められる」というようなイメージなのではないかと思います。確かに、大規模臨床試験のエビデンスレベルは、臨床試験のメタ分析と同等か、むしろさらに高いと認識されており、それはその通りかと思います。しかしながら、大規模臨床試験の中には、大規模でおこなわざるをえなかった試験というのも少なからず存在します。では、以下の臨床研究を見てみましょう。2009年New England Journal of Medicine に掲載された、最近の臨床研究の中ではかなり大規模な臨床試験であるＲＥ－ＬＹ研究の結果です。　簡単に研究の内容を説明します。心房細動患者に対する脳塞栓予防はいまだに臨床医を非常に悩ませるテーマであり、ワーファリンよりも安全で効果的な薬の誕生を多くの臨床家は心待ちにしています。直接トロンビンを阻害する効果を持つdabigatranは、その中でも非常に期待の高い薬剤であり、このＲＥ－ＬＹ試験はワーファリンと比較した際のdabigatranの有効性と副作用頻度について18,113名を対象に約２年間のフォローアップを行い比較した大規模臨床試験です。本試験の結果、ワーファリン内服群では、年間の脳梗塞もしくはその他の動脈塞栓の発生率は1.69％であったのに対し、dabigatran110ｍｇ/日の内服群では1.53％、同150ｍｇ/日内服群では1.11％であり、dabigatran150ｍｇ/日内服群はワーファリン内服群に比較して、統計学的に有意に脳梗塞もしくはその他の動脈塞栓の発生率が少なく、副作用の発現頻度は同等である、ということがわかりました。　では、なぜこの試験が大規模臨床試験である必要があったのかについてここで考えてみたいと思います。臨床試験のように、治療プロトコールそのものが研究を目的として行われるもので、さらにそれが新しい薬剤など、不明確な部分が多いものが対象であった場合、研究参加に関する説明や、有害事象についてのモニタリングなど、実に様々な業務が発生し、ひとつの試験に莫大な研究費がかかります。本試験などは、もう途方もない額の研究費が投入されていると思いますが、そうまでして大規模である必要があるのか、と問われれば、本試験については大規模である理由があるのです。　もう一度、図１に戻ってみましょう。右上の、生存曲線が3本、30度くらいの角度で描かれてあるところを見てください。これは、30か月のフォローアップ期間の中で、ワーファリン、dabigatran110ｍｇ/日、dabigatran150ｍｇ/日それぞれの群でどれくらい脳梗塞などが起きているかについての積算曲線です。パッと見た感じ、三本ともあまり大きな変化はなさそうですね。特に、ワーファリンの曲線とdabigatran110ｍｇ/日の曲線はほとんど同じカーブを描いています。すなわち、パッと見た感じでは、そんなに劇的な差はないわけです。前に紹介した、ＡＣＣＯＲＤ研究もそうですが、比較される２者もしくは３者というのは、劇的な差を持つことも中にはありますが、多くの場合この試験の結果にあるような微妙な差なわけです。◆大規模臨床試験が提示する、アウトカムの差　実はこの図にはもう一つ図が載っています。わかりますか？右上の図の枠の外に、もうひと周り大きい外枠がありますね。正確にいえば、これが本来の生存曲線になります。この外枠のグラフの下の方に、５度くらいの角度で、斜めの線が描かれていますね。これが、全対象患者について正確な率を記述している生存曲線です。右上の図は、このグラフの縦軸の、５％の量をタテにグーンと伸ばして虫眼鏡拡大している図なのですよ。外枠の図、すなわち、虫眼鏡拡大しない本来の生存曲線だけを提示されていたら、この結果を皆さんはどのように解釈するでしょうか？「えー、これっぽっちかおい！」という突っ込みを入れたくなってしまいますね。　そして、「これっぽっちの差」を、統計学的に有意な差として推定し提示するためには、相当な数のサンプルが必要になるのです。かくて、この差を有意にするべく、10000人以上の被験者がリクルートされ、結果それは大規模臨床試験となるわけです。いうなれば、大規模臨床試験は、「これっぽっちの差」を「有意差」として説明されたためにデザインされるとも理解できるわけです。その意味では、大規模臨床試験によって得られた結果を鵜呑みにしてしまい、「大規模臨床試験で結果が出ているのだから、新しい治療をするべきだ。」ということは必ずしも正当な意見ではないことがわかります。逆に、極端な例としては右図のものがあります。　ちょっとこれは卑怯なほど顕著な例ですが、十二指腸潰瘍患者の二次予防として除菌療法を行う群と行わない群でのランダム化比較試験の結果です。リクルートされた患者は２群合わせて100人ちょっとです。有意差は、検定するまでもありません。　先週も述べなしたが、大切なのは、有意差があるかどうかではなく、その差にどれほどの臨床的インパクトがあるのか、２つの治療法の差がどれほど患者の利益に寄与するのかについて、情報提供者は常に理解する努力をするべきだと思います。臨床試験が大規模になることによってより良くなることは、サンプルによって得られた差には必ず誤差があり、その誤差を前提として論文を読む側は解釈せざるをえないのですが、大規模になればこの誤差は確かに小さくなります。しかしながら、多くの大規模臨床試験が大規模である目的は、むしろわずかな臨床的インパクトに統計的な有意性を持たせることであることも常に念頭に入れる必要があるのです。◆アウトカムと研究の規模との関係　一方、大規模臨床試験はやはり非常に大切な情報をわれわれ臨床側の人間に提供してくれることも確かなのです。というのは、今回のＲＥ－LＹ研究もしかりなのですが、大規模臨床試験の多くは、「本当に大切なもの」で解説した、「真のアウトカム」を対象にしていることが多いのです。真のアウトカムは、検査値等の「代替えアウトカム」とは異なり、そうそう高い頻度で発生するものではないことが常です。さらには、真のアウトカムを把握するためには、数年単位のフォローアップのための観察期間が必要であり、このようなタイプの臨床試験を行うとなれば、なかなか個人で行う小規模な研究のレベルでは困難であることも事実です。大規模臨床試験が臨床医に提供する情報のもう一つの良い点は、大規模臨床試験にはサブグループ解析がなされていることが多い、という点です。サブグループとは、年齢がより高齢な群とそうでない群、併存症を持っている群とそうでない群、リスクがより高い群（ＲＥ－ＬＹ研究においては、CHADS2 スコアの高い群と低い群など）などのことを言います。それら、臨床判断の重要な要因となる群に分けたうえ、治療の有効性をそれぞれの群で解析することにより、「全体としてはこれくらいの差だけれども、この人はこのような要因があるから、より新しい治療の有効性が高い（もしくは低い）かもしれない」と解釈することが出来るのです。　ブランドを妄信せず、中身をしっかり吟味することは、どこの世界でも大切なことですね。参考文献Connolly SJ, Ezekowitz MD, Yusuf S,et.al. Dabigatran versus warfarin in patients with atrial fibrillation. N Engl J Med. 2009 Sep 17;361(12):1139-51.Hentschel E, Brandstätter G, Dragosics B, et.al. Effect of ranitidine and amoxicillin plus metronidazole on the eradication of Helicobacter pylori and the recurrence of duodenal ulcer. N Engl J Med. 1993 Feb 4;328(5):308-12.独立行政法人国立病院機構東京医療センター臨床研究センター　臨床疫学研究室長　尾藤 誠司]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Sun, 27 Dec 2009 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[桃の誘惑―p値の意味と価値について―]]></title>
            <link>/tabid55.html?artid=38246</link>
            <description><![CDATA[　さて、臨床研究論文において多くの人が「よくわからない」と困っているのが統計解析です。ですから今回からは数回にわたって統計解析の話をします。まず知っていただきたいのは、少なくとも論文情報のユーザーの立場から見れば、統計学に関するこまかな知識は必要ない、ということです。「ロジスティック回帰分析」とかややこしい統計手法の名前が論文には書かれていますが、このような難しい解析の手法の内容を理解できなくても、とりあえず論文のメッセージを理解する上で困ることはありません。一方、臨床研究論文において、統計解析によってあらわされている結果が何を意味しているのかについては理解しておく必要があります。臨床研究における統計解析の意味　まず、図１を見てください。テレビでよく見る街頭アンケートですね。端的にいうと、これが統計です。この結果によれば、今の若い女の子には草食系男子の方が人気があるようです。しかし、この統計結果は本当に真実を表しているでしょうか？ ちょっと疑ってかかってみましょう。　怪しい部分の一つは、街頭アンケートが行われた場所ですね。たとえば同じ東京でも、渋谷を歩いている20代の女性と、となり町の青山を歩いている20代の女性ではずいぶん違うわけです。はたして、渋谷を歩く20代女性、もしくは青山を歩く20代女性が、日本全国の20代女性を代表していると考えてよいでしょうか？さらには、あなたの周囲にいる20代女性の意識を表していると考えてよいでしょうか？また、アンケートを行った調査員についても疑ってかからなければいけませんね。「草食系」「肉食系」好みは、ファッションなどにも関係が深いでしょうから、調査員は結果を出すために、「草食系」と答えてくれそうな身なりをした女性を無意識に選んで声をかけているかも知れません。そう考えると、アンケート結果をうのみにするのは危険であることがわかります。　以上のような部分は、情報のエラーの中でも、以前に解説した「バイアス」に当たるエラーです。特に、対象となった一部の集団と、概念的に対象としている大きな集団との間にギャップが出てしまうようなバイアスのことを、「サンプリングバイアス」と呼びます。サンプリングバイアスをゼロにすることは困難ですが、ゼロに近づけていくことは努力によって可能です。すなわち、日本全国を練り歩いて北海道から沖縄までの20代の女性に答えてもらうとか、調査員が目隠しをして対象となる女性を選ぶとか、そんな努力をすることでサンプリングバイアスを最小限にしていくことが出来るかも知れませんが、相当大変な努力ですね？　ただ、どんなに実際の調査対象者と、概念的な対象集団との間にズレがなかったとしても、限られた対象集団から得られた結果には必ずエラーがあるのです。今回はその話を中心に行います。　第一回目で少し触れたサイコロの話をします。正確なサイコロがあったとして、さらにサイコロを振る人が目隠しをしているとして、そのサイコロで１の目が出る確率は数学的に1/6です。あたりまえですね。しかし実証の世界ではどうでしょうか？12回サイコロを振ったとき、１の目が出るのは常に２回でしょうか？もしそうだったらすべてのギャンブルは成立しませんね。一回も出ないこともあれば、偶然10回出てしまうこともあるかも知れません。偶然によるエラーは必ず生まれる。これが実証の世界なのです。　しかし、サイコロを12回ではなく120回振ったらどうでしょうか？おそらく1の目が一度も出ないということはないでしょうし、偶然1の目が100回出てしまうこともないでしょう。1200回降ったら、1の目が出る頻度はかなり1/6である200回に近くなっているはずです。本当の真実に近づけていくために、サイコロを振る回数を多くして、偶然が生む誤差を最小限にしていくわけですね。　一方、臨床研究において、数学的に「この結果は数値としてはXXになるはずである。」という数値を割り出すことはできません。“1/6”という数学的真実を設定した上、実証の世界と比較するということはできないわけです。臨床研究における統計を理解する上で重要なのはこの点です。すなわち、限られた対象集団から得られた結果をもとに、おそらくあるであろう真実を“推定”していくこと、これが臨床における統計解析が行っていることなのです。　では、そのような目でもう一度図１を見てみましょう。ここではサンプリングバイアスは無視して考えます。100名の女性のうち57名が「草食系が好き」、43名が「肉食系が好き」と答えています。この結果は100名の結果なのです。そして、我が国の20代の女性は何百万人もいるわけです。57：43という結果は、この何百万人の結果としてあるはずの「真の何対何」を推定するための、誤差をもった参考値なのです。しかしながら、調査は通常1回ですから、この57：43という結果を持って「真の何対何」を推定する必要がある。その推定プロセスのことをわれわれは統計解析と呼んでいるのです。実は「真の何対何」は、48：52で肉食系の勝ちなのかもしれませんし、逆に68：32くらいにもっと草食系よりの傾向なのかもしれません。「真の何対何」を調べることは、会社などある限られた組織の人間のみを本質的な対象としている場合には可能ですが、臨床研究のように一般的には無限大と考えられる集団を対象とする場合には不可能です。その意味では、臨床研究の結果は常に偶然のエラーと共にあり、そこに真実を提示することはできません。ただ、サイコロの例のように、なるべく大きな対象集団を持つことで、エラーの度合いを小さくしていくことは可能です。巨人と日ハムと帰無仮説とp値　さて、日本シリーズが終了しました。私はドラゴンズのファンですが、今年に関しては巨人に勝てる気がしませんでした。今年のジャイアンツは確かに強かったです。そして、日本ハムもいいチームでした。さて、巨人と日本ハムですが、試合の勝ち負けを持ってどちらが強いか知るためにはどうすればよいでしょうか？　先に示したように、真実にはおそらくいつまでたっても到達しません。しかしながら、「これだけ続けて勝てば巨人の方が強いとおおむね考えていいのではないか」という基準を設定し、真実に近づけていくことならできます。では、巨人と日ハムが試合をしたとして、巨人が何連勝すれば巨人の方が強いと言ってよさそうでしょうか？3連勝では偶然でもできそうです。5連勝すればさすがに巨人の方が強いと認めてあげてもよくないですか？もちろんこれでも偶然はあり得るわけですが。　おそらく頭のよい方なら以下のような計算をしたのではないかと思います。　巨人が３連勝する確率　1/2 X 1/2 X 1/2 ＝ 1/8巨人が５連勝する確率　1/2 X 1/2 X 1/2 X 1/2 X 1/2 ＝ 1/32　以上の計算は数学的には論理的ですね。ただ、この計算の問題点は、まず立っている立場が「巨人と日ハムは同じように強い」という立場ですね。同じ様に強いという仮説から出発するからこそ1/2の掛け算になるわけです。そして、本来同じ強さなら1/32しか起こらない現象が目の前で実証的に起こってしまった。であれば、こんなレアなことが起こるという最初の前提を放棄せざるをえないので、「巨人と日ハムは同じように強い」という前提を放棄して「巨人の方が日ハムより強い」という理屈を受け入れる、という考え方です。　まさにこれが臨床統計学における「帰無仮説」という考え方です。すなわち、「AとBには差がない」という設定から始まり、臨床研究によって得られた実証的な差がそこに存在した場合に、「AとBには差がないといった最初の設定は捨てて、AとBには差があるとする」とすることが統計解析によって行われる仮設の検定なのです。実は、巨人が５連勝したとしても、この結果から導き出されるのは「巨人の方が日ハムより強い」ということだけであって、「巨人の方が日ハムより圧倒的に強い」ということではない、という点が重要です。　さらに、５連勝したとしても「いやいや、これも偶然だろ」という人も出てくるかもしれません。偶然によるエラーは常について回りますから、100連勝しても偶然であることを完全に否定することはできないのです。では、どうするか？約束を作るのがよいと世の中は考えたのです。偶然によるエラーは常に起こり、その危険は0にはならない。では、どのくらいその危険が小さければ「差がある」と認めるのか？ここは決めるしかありません。５連勝のラインってなかなか妥当じゃないでしょうか？1/16ですと0.0625、1/32ですと0.03125。この間くらいの0.05より危険率が小さければ、目の前の実証的な差を持って「両者に差がある」と認めるのは、なかなか妥当なラインなのかという気がします。もうおわかりですね。これが　p＝0.05の意味なのです。p値が0.05より大きいとか小さいとか言っているのは、目の前の限られたサンプル集団から得られた実証的根拠で見られる差をもって、本来知ることができないAとBとの「真実の結果」に多少なりとも差が存在するのかどうか、ということを推定し、「真実の結果にも差がある」と判断してよいかという議論であり、p値を0.05を持って有意基準とする意味は、その判断が間違っている危険が1/20（0.05）以下であればその判断を妥当としましょう、という目安のラインなのです。“p＜0.05”、“p＞0.05”が意味するもの　世の臨床試験は、統計解析結果のp値が0.05未満になることに躍起になっているようにみえます。これは、臨床試験という名の通り、試験が持つ性のようなものかも知れません。試験には合格ラインが必要です。60点以下は落第、というルールを設定する必要があるのです。そのため、p＜0.05であることは、特に薬剤の市販承認などに関しては極めて大きな意味を持ってくるのです。　一方、一臨床として考えた場合、p＜0.05であるかないかについて、どこまで重要なことかについて考えてみる必要があります。図２-1をご覧ください。p＜0.05となっていますね。ここには、統計的に有意な差が存在するようです。一方、図2-2ではp＞0.05ですね。ここには統計学的な有意性がない、すなわち、「A群とB群で、LDLコレステロールの値が同じである、という帰無仮説を棄却できなかった。」ということを指します。でも、図2-1と図2-2にどれほど内容の差があるでしょうか？おそらく、図2-2の研究は、図2-1の研究に比べてサンプル数が若干少なかったのかと思います。そこが２つの研究結果を分けたようですが、巷の判断は、図2-1の結果は「劇的な効果を提示したエビデンス」として解釈され、図2-2については「エビデンスがない」として解釈されることが主なのです。しかしながら、先ほどお話ししたように、図2-1の結果をもって、「A群とB群のLDLコレステロール減少の効果に関する“真実の差”は約20である。」ということは実はできないのです。あくまでも、真実において、A群とB群のコレステロール減少効果に、（1/20未満の間違いは大目に見ていただくとして）何らかの差がある、ということを表記している、というのが正しいことなのです。　同時に、p＞0.05であった場合に、「エビデンスがない」というべきではありません。そこには「帰無仮説を棄却できなかった」というエビデンスが存在するのです。むしろ、「帰無仮説を棄却できなかった」というエビデンスはより注意して結果を解釈する必要があります。ひとつの解釈は、やはり帰無仮説に準じて、「AとBにおける真実の効果には差がない、と現時点では考えておくべきである。」という解釈です。もう一つは、「今回は帰無仮説を棄却できなかったが、より偶然誤差を少なくする（標本数を増やす）方法で実証的な提示を行った時には、AとBにおける真実の効果には差があると考えてもいいかもしれない。」という解釈です。そのためにも、結果の細かな内容、たとえば、生存曲線のカーブが時間にそってゆっくり離れて行っているのか、薬の量に比例して効果の量も大きくなっているのか、などについて評価した上で、p＞0.05の意味と、現時点で臨床にどう生かすかについて考える必要があるのです。桃の誘惑に惑わされない　P値は、臨床試験にとってはルールに基づいた基準になりますので、研究の主体者にとってはどうしても重要な意味を持ってしまいがちです。しかしながら、現場の臨床医、そして、現場の臨床医に情報を提供するものは、p値が0.05より上か下かなどはあまり大きな問題ではなく、目の前の患者さんの利益となる判断を行うために、“真実”としては偶然的な誤差を持っている実証研究の値をどう解釈していくかがより重要なことなのです。最近の傾向として、研究の成果を臨床現場により有用なものとするために、臨床雑誌の一部ではp値を用いずに結果を表記する傾向にもなっています。この薬が効くのか効かないのか、ではなく、この薬がこの患者さんのどのような健康に対してどの程度効くのか、より正確にいえば効く見込みがあるのか、という問いに論文と情報提供者は答える義務があるのです。この「どの程度」については、次回詳しく解説したいと思います。独立行政法人国立病院機構東京医療センター臨床研究センター　臨床疫学研究室長　尾藤 誠司]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Sun, 29 Nov 2009 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[人を測るものさし―臨床研究における変数と測定―]]></title>
            <link>/tabid55.html?artid=38104</link>
            <description><![CDATA[　臨床研究とは、基本的に数字を使って何らかの情報を提示する行いです。そのため、臨床研究の結果を解釈する上で、そこに記述されている数字や、それに準じたものについて考えてみたいと思います。臨床研究においては、“数字について考えること＝統計学”のイメージがあります。それは確かにその通りなのですが、“統計学＝統計解析”というのは間違いです。私はよく臨床研究に関するコンサルテーションを受けるのですが、その中で一番困ってしまうのは、「データを集めたので統計処理をして欲しい」という類の依頼です。臨床研究における数字の取り扱いの中で重要なのは、実は統計解析ではなく、統計解析をするために集められた数字一つ一つそのものの質なのです。収集された一つ一つのデータに根本的な問題がある場合、いかに研究デザインが優れていて、いかに大規模な研究事業で、いかに優れた解析をしても、そこから得られるエビデンスには大きな限界があるといわざるを得ません。では、どのような部分について批判的な目を我々は持つべきなのかについて解説したいと思います。評価と数字　さて、また医療と関係なさそうなところから始めてみましょう。会社には、業績評価なるものがあります。通常業績評価は、何らかの指標を設定して、その指標を用いて測定を行うことで、社員のパフォーマンスや努力を評価するシステムのことを言います。そして、その評価の基準は、会社の理念や経営方針などによっても変わってきます。たとえば、バリバリの利益追求型の会社の営業であれば、月間の契約数、もしくは契約金額の総額だったりしますし、昔の公務員であれば、なるべく波風が立たないことだったりするかもしれません。では、それらの指標がどれほどその社員のパフォーマンスや努力、もしくは会社理念の実現への寄与を正確に測定しているかについては、会社に勤務する人間であればしばしば疑問に感じることはありませんでしょうか？たとえば、現場を見る限りでは、どう考えてもたいした業績を上げている、もしくは自己研鑽を行っているとは到底思えない社員のほうが、リスクをとりながら会社のために粉骨している社員よりも表面上は優れた数字となっていることなどが少なからずあると思います。こんなときには、数字って皮肉だなあ、と社員は思ってしまいますね。そして、その評価方法に改善がなされない会社のモチベーションは下がり、そのような会社はだいたいは傾いていくものです。数字が意味するもの　もうひとつ、評価する尺度が持つ意味について、その意図するものと評価方法、そして得られた結果についての解釈について考えて見ましょう。厳しいプロフェッショナルの世界においては、評価尺度によって評価されたものが常に公開されていたりします。プロ野球の世界は、その際たるものといえましょう。ではここで、「現在もっとも優秀な日本人野手は誰か」ということについて、数字を根拠に考えてみましょう。あ、これはイチローですね。すいませんでした。じゃあ、「現在最も優秀な日本プロ野球界の野手はだれか」ということについて考えて見ますと、これは中々難しいですね。まず、攻守走と基準がありますから、ひとつの数字を根拠にするのは無理そうです。打者としてのパフォーマンスだけ見ても、本塁打の数、打率、打点などありますから、よって経つ根拠によって、「中村」と答える人、「森野」と答える人、「鉄平」と答える人様々かと思います。　臨床研究では、このような評価対象となる一つ一つの項目を「変数」と読んでいます。質的研究を除けば、変数が設定されない臨床研究はありません。そして、変数をどのように設定し、設定された変数の定義に従ってどのように変数が測定され、収集されたか非常に重要なのです。　誤解を恐れずに言えば、前回の「本当に大切なもの」でお話した、本当に知りたいアウトカムというのは、具体的な数字ではなくもっと概念的なものなのです。たとえば、糖尿病の慢性期管理において、臨床医が設定しているアウトカムは「糖尿病合併症の予防」であったり、「深刻な低血糖発作がなるべく起きないこと」であったりしますが、それらそれ自体は概念的なものです。これらの概念をなるべく客観的に可視化できるものとして、「追跡開始から5年以内に発生した眼合併症および腎合併症と発生までの期間」とか、「追跡から5年以内に発生した低血糖発作が関係した入院もしくは死亡の有無と頻度」といったものがそれら概念を具現化するものとして設定されるのです。知りたい概念、たとえば、「チャンスに強いこと」とか、「よく勉強している」などは、すべて限界はあるものの変数として定義することができますし、数値、もしくはそれに準じたものに変換することが可能です。　次に、設定された変数を具体的なデータとして収集し記録する際には、変数の測定方法についての定義が必要になります。たとえば、「追跡開始から5年以内に発生した眼合併症および腎合併症と発生までの期間」について測定することは、実は非常に骨の折れる作業なのです。臨床においては、眼の評価は内科ではなく、別の医療機関で評価されていることも少なくありません。また、ある状態にある網膜の所見についても、別の医師の診察によって眼合併症の有無、もしくはその程度の評価について差が出てくることも考えられます。臨床研究においては、研究の仮説において研究者が評価の対象とした概念上のアウトカムと、アウトカムを具現化するための変数、そして変数をどのような尺度の用いてどのように評価しているかという測定プロセスとが、その限界も含めてしっかりと計画されている必要があります。図１に、その３つの関係性について図示しました。研究論文を読む際には、まず、研究計画において設定されている「アウトカム変数」（臨床試験においては“エンド・ポイント”と呼びます）が、本当に概念上のアウトカムを具現化したものとして妥当なものかについて評価する必要があります。さらには、設定された変数は、ちゃんとその設定どおりに測定され、データとしてしっかりしたものになっているかについて評価される必要があるのです。変数の妥当性と信頼性　では、どのような基準をもって以上のようなことを評価すればよいのでしょうか？ここで、「妥当性」という言葉と「信頼性」という言葉を覚えてください。この２つの観点で定義された変数とその測定についての吟味を行います。図２に変数の妥当性と信頼性についてのイメージを記しました。妥当性とは、概念として位置づけられているものをどこまで正しく数字に置き換えられているか、すなわち、ちゃんと狙った的に矢が向かっているのかどうかについての評価です。一方、信頼性とは、測定を行ううえでの再現性の高さ、すなわち、的を狙ってはなった矢がばらつかないかどうかということを意味します。“血圧”という概念を“マンショット法で測定する血圧値”という方法で測定することを例に取れば、研究データとして妥当性を高めるためには、たとえば血圧測定を行う際に患者さんにリラックスしていただくとか、自動血圧計の品質を標準化するなどの工夫が必要ですし、信頼性を高めるためには、医師がコルトコフ音を聞いて記録する方法ではなく、すべて機械に任せるとか、３回測定してその中央値を測定値とする、とかの工夫が必要になってきます。ものの測り方をゆがめるもの　さらに、測定は様々な要因によってその精度がゆがめられてきます。たとえば、ある一箇所の角がかけたサイコロにおいて、4の目が出る確率は1/6ではなくなってきます。このように、偶然ではなく系統的な要因によって測定に誤差が生じてくるものを、臨床研究では“測定バイアス”とよんでいます。測定バイアスにもいろいろ種類はあるのですが、その多くは人の見方や報告、記録が生むものであるといってもよいでしょう。たとえば、「夫や恋人以外の人間との性行為の頻度」を調べる場合、対象者が直接報告する数字には、少なからずいろいろな“思い”によってゆがめられていることが考えられます。また、血圧の値を記録する際に、記録する人間が担当医であった場合、たとえ臨床研究に用いるデータであると分かっていたとしても、あまりにも高すぎる血圧を報告することに躊躇してしまうかもしれません。概念を数値に変換するときは、常にこのようなバイアスが含まれることから逃れることは非常に困難なのですが、いかに研究計画のなかでそれらの影響を最小限に抑えるための工夫がなされているかについて読み取っていく必要があります。　実際には、臨床研究で用いる変数とその測定すべてについて、厳しい精度を求めるのは困難です。しかしながら、研究者が最も知りたいと考えているアウトカムについては、可能な限り概念を忠実に反映した数字を得るための努力が必要となります。　オープンラベル試験という、介入群とコントロール群がどちらに振り分けられたかが分かってしまう試験において、PROBE法という研究デザインが用いられるのは、アウトカムになるべくバイアスをかけないための一つの方法です。研究者は、どうしても介入群のほうがコントロール群よりも優れているという結果を欲しがるものです。最初から研究に参加していただく被験者の方がどちらの群に割り当てられているかが判明している場合、無意識のうちに介入群に対して贔屓目を見てしまうのはいたし方がないことでしょう。では、その贔屓目を避けるために、アウトカムの測定は研究に関係のない人間が行う、というのがPROBE法の考え方です。このように、なるべく「結果を出したい」という研究者の思いから発生するバイアスを避けるための方法論的な努力というのはきわめて大切です。　最近、ようやくその重要性が認識されているデータセンターの意義は、そのようなところにもあります。研究責任者がデータを取りまとめる機能も持つことで、どうしても自分の研究にとって有利なようにデータを操作しがちになるのです。これは、改ざんというレベルのものではないのですが、無意識に結果を有利にするようにデータを集めたり、データの解釈を操作したりすることが現実的に起こってきます。そのため、データの収集や整理（クリーニングといいます）を、研究者から独立したデータセンターで行うことで、バイアスが入る余地を最小限にする効果があるのです。主観に基づく数字は信用できないか？　最後に、主観としてのアウトカム、すなわち痛みやＱＯＬなどをアウトカムの対象とした場合、それらを尺度化した数値は信用に値する精度なのかということについて考えてみたいと思います。前回も取り上げましたが、ＱＯＬや患者満足度のような患者の主観に基づくアウトカムは。多くの場合「真のアウトカム」であり、医療においてはある意味検査値よりも重要な意味を持ちます。しかしながら、痛みも含めて主観を数値に置き換えるということには抵抗も限界もあるでしょう。主観の数値化に対して、その精度に限界があることについてはその通りかと思います。また、主観の測定には言葉がつきものです。ところが、言葉であらわされたものはその性質上なかなか国境を越えて標準的な尺度となるのが難しいことが多いのです。そのため、安直に作られ使用された質問紙調査から得られた数値には、この数値が信用に足るものなのか、国際的な基準からも測定尺度として耐えうるものなのかについて疑いの目を持つ必要があります。一方で、すべての概念は数量化することは可能ですし、その際には大なり小なり数量化する上での限界は生じてきます。大切なのは、概念を正しく数量化するための努力が、一定の作法（妥当性と信頼性を高めるためにどのようなことを行ったか、また、その結果妥当性や信頼性がどのようなものだったか）に準じて行われていて、結果を解釈する際にも、数値の持つ限界を十分に理解した上で提示がされているというところです。最近では、健康関連QOLや痛みなどについて、多国間でも比較可能な評価尺度が開発され、その信頼性や妥当性がある程度のレベルで保証されつつあります。大切なアウトカムから目をそらさず、測定尺度の精度が持つ限界も理解した上で、なるべく信頼に足る結果が提示される臨床研究は価値の高いものだとおもいます。　数字の一人歩きがもつ危険性と、実体を捉えきれないものを数値化することによってより現実的なものにする利点との両者を踏まえながら、人は数字というものに対峙する必要があるのです。独立行政法人国立病院機構東京医療センター臨床研究センター　臨床疫学研究室長　尾藤 誠司]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Fri, 30 Oct 2009 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[本当に大切なもの ―にせのアウトカムと本当のアウトカム―]]></title>
            <link>/tabid55.html?artid=37976</link>
            <description><![CDATA[　本シリーズの第3回で、Evidence Based Medicineを実践する上で重要なのは、目の前の患者さんに対する具体的な医療行為に関する判断をイメージした上、臨床上の疑問を設定すること、そして、その疑問はＰＥＣＯという構造を用いて設定することであることをお話しました。本日は、そのＰＥＣＯの“Ｏ”、すなわち、アウトカムの話です。今回のお話は実に重要です。なぜなら、アウトカムを意識した医療というのは、我々医療者に実にラジカルなインパクトを与えるものだからです。早速、はじめましょう。ダメ上司がダメな理由　それではまずちょっと関係ない話からはじめてみます。以下のような場面、あなたの会社では見かけませんか？上司　「ちょっと、ＯＯくん、君の先月の業績は何だね。こんな体たらくで仕事を続けてもらっちゃあこっちは大変迷惑なんだよ。営業をなめとるのかね？」部下　「すいません・・　私もがんばっているんですが、先月はちょうどいろいろな事情が重なりまして・・・」上司　「私はね、言い訳を聞きにここの机に座っておるわけじゃないのだよ。いいわけなんぞいらんのだよ。いるのは結果だ。そもそもそうやってすぐ言い訳をするような人間だから業績も上がらないんだろ？」部下　「・・・申し訳ございません。」　さて、ここで質問です。この上司は、誰のどのような「アウトカム」を想定してこんな発言をしているのでしょうか？おそらく、この上司に直接このような質問をすると、この上司は、「もちろん、部下がやる気をまた出して、がんばって業績を上げてくれるために叱咤激励しているに決まっているじゃないか！」と答えるに違いありません。ダメ上司の典型例ですね。　本当に、この上司が自分の行動によって得ようとしているアウトカムを部下のモチベーションの上昇、さらには継続的な業績の向上と考えているのであれば、行動科学的な観点から見た場合、ひどく間違った行為をしているといわざるを得ません。一方、使えない部下を精神的に追い込み、退職させるもしくは自殺を促すことをアウトカムとしているのであれば、倫理的には許容できませんが科学的には正しい選択をしているかもしれません。しかしながら、おそらくこの上司はそのようなことも考えていないと思います。組織で働く人間のなかで、顧客の利益（＝アウトカム）に基づいて自分の行動を律している人間は優れた組織人といえます。その次が株主の利益、そして会社を構成する小組織の利益、となっていくのですが、この上司が考えているアウトカムはせいぜい自分のストレスが発散できる、というくらいでしょう。ＰＥＣＯで言いますと。表向きのＰＥＣＯP 先月業績の悪かった部下にE 正確否定も含めた厳しい言葉をあびせるC もうちょっとやわらかく行動変容を促すO 部下のモチベーションと継続的な業績の向上ですが、実際のＰＥＣＯP 先月業績の悪かった部下にE 正確否定も含めた厳しい言葉をあびせるC もうちょっとやわらかく行動変容を促すO 上司自身の鬱積したストレスが発散され、帰りの酒で悪酔いしなくてすむという感じですね。　前振りが長くなりました、何が言いたかったかというと、人間は、日常自分が正しいと思って行っている様々な行為は、目指すべきアウトカムを設定していたいことがしばしばあるということ、そして、いったん慣習となってしまった行為は、中々批判の目にさらされなくなってしまうということです。そして、これはまさに医療の中にも実に多く存在するのです。論文のアウトカムは、本当に患者に利益をもたらすものか？　2008年12月は、糖尿病を診療している医師にとって中々刺激的な月となりました。臨床雑誌としては最も権威ある雑誌であるNew England Journal of Medicine に大規模なＩＩ型糖尿病に関する臨床試験であるＡＣＣＯＲＤ試験とＡＤＶＡＮＣＥ試験の結果が同時に掲載されたのです。そして、その試験の結果は驚くべきものでした。本稿では、主にＡＣＣＯＲＤ試験の結果について説明したいと思います。　ＡＣＣＯＲＤ試験もＡＤＶＡＮＣＥ試験も基本的に研究仮説は同じです。すなわち、「ＩＩ型糖尿病の人たちにＨｂＡ1ｃ　6.0-6.5%を目指す治療をすることはよいことなのか？」というものです。この仮設を見て、「えー？」って思いませんか？だって、糖尿病専門医の人たちって、毎日外来でＡ1ｃの値に躍起になっているんですよ。そんなことは自明の理。いまさらそんなことを論じる必要があるのか？、と考えてもおかしくありません。しかしながら、実はそうでもないのです。早速結果を見てみましょう。　ＡＣＣＯＲＤ試験は、ＩＩ型糖尿病の患者さん約１万名を対象に、介入群の5000名はＨｂＡ1ｃ　6.0%を目指していろんな薬物治療を行い、別の標準治療群5000名はＡ1ｃ7.5%くらいを目指して行うというかなり大規模なランダム化比較試験です。まず図１を提示します。　このグラフは、縦軸がＨｂＡ1ｃ値、横軸が試験開始からの時間を表しています。標準治療群に比較して、介入群はしっかりＨｂＡ1ｃが低値でコントロールされているのが分かります。劇的な差であるといってよいかと思います。今までの主張は、この結果を持っていくつかの薬の効き目はとってもよい、ということをいっていたのです。ところが、ＡＣＣＯＲＤではFig.1は前振りに過ぎません。Ｆｉｇ．２の結果を見てみましょう。　ますＡの図からです。タイトルが「Primary Outcome」となっていますね。Primary Outcomeとは、研究計画を立てたときに、一番重要視したアウトカムのことをいいます。ＡＣＣＯＲＤ研究では、Primary Outcomeを死には至らない心筋梗塞もしくは脳血管障害の発症、もしくは心血管イベントによる死、と定義しています。こちらの図は、横軸はやはり時間なのですが、縦軸は、そのように定義した健康イベントの発生が登録された患者さんの中で起こった分だけ累積していく様子を表しています。このような図を生存曲線といいます。太いほうの生存曲線が甘めの血糖コントロール、細いほうの曲線がＡ1ｃ6.0を目標にした血糖コントロールのグループです。これを見ますと、観察開始から５年間については、どちらの群においてもPrimary Outcomeの発生具合にほとんど差がないことが分かります。研究者が設定した「最も重要なアウトカム」であるこれらについては、なんと厳しい血糖コントロールを行っても、より甘い血糖コントロールを行ってもあまり変わりはない、という結果になっているのです。　図Ｂは、縦軸、すなわちアウトカムを「すべての死亡」とした場合の生存曲線です。驚くべきことに、すべての死亡については、細い線、すなわち、血糖コントロールを厳格に行った群のほうがより甘い血糖コントロールの群に比較してその発生頻度が高いことが分かりますね。　このインパクトが実感できますでしょうか？Ｆｉｇ．１とＦｉｇ．２の距離感というのは、臨床において実に重大なことです。振り返ってみると、私も含めた臨床医は、毎日の診療の中でHbA1cの値を低くすることに今でも躍起になっています。いうなれば、Fig..1の結果を最終目的として粉骨していることになります。しかしながら、当たり前のことですがHbA1cを含めた全ての血液検査値は、ただの数字に過ぎないのです。数字が正常範囲内に収まることそれ自体は、患者の健康を直接あらわしているわけではありません。検査値は常に本質的な意味での患者の健康といえる「本当のアウトカム」を間接的に映し出しているアウトカムに過ぎないのです。その意味では、あえていうならば「にせのアウトカム」と言っても良いでしょう。　「本当のアウトカム」が設定されて始めて明らかになったエビデンスによって、かつて「にせのアウトカム」によるエビデンスを基準にして正しいと信じられていた治療が転覆するようなことは実はしばしばあります。中でも有名なのはＣＡＳＴ研究という研究です。これは、抗不整脈薬がもたらす効果についてプラセボと比較して行われた研究なのですが、実際に生存曲線を調べてみると、驚くべき結果が出てしまいました。確かに抗不整脈薬によって不整脈の頻度は減るのですが、その後経過を追跡していくと、抗不整脈薬の内服を続けている患者群は、プラセボを服用し続けている群に比較して、倍以上亡くなっていたのです！心電図の波形は良くなったが、死亡率は抗不整脈薬によってかえって増えてしまったのです。いうまでもなく、人間は心電図の波形を美しくするために生きているわけではありません。元気で長生きすることのほうが、不整脈が出ないことより比較にならないほど大切でしょう。　一方、多くの研究論文は、この「にせのアウトカム」の結果に有意な結果が存在することをもって、「この治療は効果がある。」という結論を導き出していることが少なくありません。腫瘍の直径や腫瘍マーカーの値なども、「にせのアウトカム」といってよいでしょう。「にせ」というのはちょっと聞こえが悪いです。通常これらのアウトカムは「本当のアウトカム」の代替として用いられたという意味で、「代替アウトカム」とよばれます。図３に、代替アウトカムと「本当のアウトカム」の対比を表記しました。　代替アウトカムの中には、臨床上の検査でも用いられないようなものが設定されているものも少なくありません。たとえば、腸管のじゅう毛運動機能などがそのひとつです。もちろん、このようなものをアウトカムとして設定し、研究成果を積み上げていくことは非常に重要なことですが、臨床上直接イメージらできない数値を用いた劇的な結果を直接臨床に利用することはあまりにも早合点ではないでしょうか？あえて言いますが、販促用の資料にはこの様なものが多い傾向にあります。なぜ早合点アウトカムを資料に利用するかというと、ひとつは「本当のアウトカム」、もしくは本当のアウトカムにより近い代替アウトカムに比較して、結果が劇的であることがあげられます。もうひとつは、なんだか細胞レベル、ミクロなレベルの方が科学っぽくて、医師のスケベ心をくすぐるのかもしれません。ただ、患者さんに対する誠意の観点から見れば、アウトカムがミクロレベル、検査レベルに近づけば近づくほど、患者さんのリアルな利益からはどんどん遠ざかっていくということです。そして、たまにACCORD研究のようなエビデンスが提示されると、その距離感が明確かつ劇的に提示されるのです。リアルなアウトカムと、アウトカムに基づいた医療　ＥＢＭがもたらした、特にわが国の医療スタイルに与えた最も大きな変化は、臨床研修の方法論や統計的な考え方よりも、実はこの「（主に患者の健康に関する）アウトカムを高めるために自分たちのするべきことを位置づける」という考え方なのかと私は個人的に考えています。本当に患者さんにとって大切なアウトカムは何か、そのアウトカムを高めることを最終目的として私たちの医療は存在しているのか、ということがEBMのもっとも大きなメッセージのひとつなのです。　では、最後に「本当のアウトカム」とはどんなものなのかについて考えてみたいと思います。ひとつは「長生き」ですね。質の高い臨床研究の多くが生存期間を最も重要なアウトカムとしているのは、長生きというアウトカムは誰から見てもわかりやすい本当のアウトカムだからです。しかしながら、長生きだけでは充分でない気もしますね。これから高齢化社会が本格的になります。「元気で長生き」という考え方もより重要かもしれませんし、倫理的な観点から考えた場合には、元気にこそ価値がある、長生きにこそ価値がある、というのも独善的な考え方かもしれません。そのような文脈から、臨床研究に用いられるようになってきたのが、Quality of Life（QOL）というアウトカムです。QOLはあくまでも患者さん自身の主観ですので、アンケート調査のような形でデータが収集されます。これを「科学的でない」と馬鹿にする人たちもいますが、そのあたりのことはまた別の回で解説します。いずれにしても、QOLは「本当のアウトカム」の観点から見れば、代替でない本当のアウトカムだということができるでしょう。　もうひとつ、医療において軽視されている本当のアウトカムは「苦痛」です。本当に長い間、医療は患者の痛みについて無頓着すぎました。ようやくここ数年で痛みが科学的にも哲学的にもきわめて重要かつ医療によって効力を発することが可能な「本当のアウトカム」であるという認識がなされるようになってきました。これはエビデンス読解とは直接関係無いかもしれませんが、情報がもつメッセージを読み取る本質的な部分だと考えます。　あなたが日ごろ行っている行動、たとえば仕事帰りにのみに行くこと、子供をしかることなどが、それぞれ何を目指しているのかについてアウトカムに基づいて考えてみてください。参考文献１）Effects of Intensive Glucose Lowering in Type 2 Diabetes: The Action to Control Cardiovascular Risk in Diabetes Study Group, The new england journal of medicine. established in 1812; june 12, 2008 vol. 358 no. 24.独立行政法人国立病院機構東京医療センター臨床研究センター　臨床疫学研究室長　尾藤 誠司]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Tue, 29 Sep 2009 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[風が吹けば桶屋が儲かる？―原因と結果、治療と効果の関係―]]></title>
            <link>/tabid55.html?artid=37824</link>
            <description><![CDATA[　今回からは、実際に論文に書かれている研究の成果を、どのように読み解くかについて論じます。臨床研究の論文には、検査に関する論文、危険因子に関する論文、治療に関する論文など様々な種類がありますが、大雑把に言ってしまえば、「原因と結果との関係」について書かれていると考えてください。たとえば、危険因子に関する論文では、「タバコをすう（原因）と肺がんになりやすい（結果）。」ということになりますし、治療に関する論文では、「スタチンの内服（原因）によってＬＤＬコレステロール値が低下する（結果）。」ということについての根拠を論文結果は提示しています。この、原因と結果との関係を妥当な形で提示できている論文は優れた論文であるといえます。そして、原因と結果との関係を妥当な形で提示するということは、それほど簡単なことではありません。今回は、提示された原因と結果との関係を読み取る上でのポイントについて話していきたいと思います。比較されるものはなにか？　では、まず以下の結果について考えて見ましょう。研究結果Ａ：S大学病院外科では、5年前より大腸がん切除前の照射療法を導入し、今回同治療を受けた250名の患者成績について学会で発表を行った。それによれば、術後の転移・再発率は3％であり、この結果は今後の大腸がん治療に大きな影響を与える研究結果であると考えられる。　以上のような研究発表があったとしましょう。おそらく、「原因と結果」という観点から本結果を解釈すると、「大腸がん切除前の照射療法」が原因であり、「術後の転移・再発率」が結果であるように見えます。学会で一通りの抄録を見るとよく分かりますが、「うちの施設でこのような治療をＸＸ名の患者に行ってよい成績だった。」というタイプの研究発表は極めて多いのです。しかしながら、「研究結果Ａ」も含め、これらのタイプの研究発表では、原因と結果との関係を妥当な形で提示しているとはいえません。その最も大きな理由は、比較されるものが具体的に提示されていない、ということです。　「うちの施設でこのような治療をＸＸ名の患者に行ってよい成績だった。」という研究において、比較されるものとは何でしょうか？しばしばそれは、「うちの施設」と「他の施設」との比較だったりします。そうであれば、それは自慢話にはなりますが、研究結果といえるものではありません。もうひとつ考えられる比較は、「このような治療」と「その他の治療」との比較になります。研究結果Aにおいては、「照射を加えた手術治療」と「一般的な手術治療」との比較です。お気づきのようにこれは前回で説明したPECOのE（Exposure）とC(Comparison)の部分に当たるわけです。特に治療に関する臨床研究においては、テーマとしている治療の有効性を示すためには、その治療に関する結果と共に代案として比較される治療の結果が提示されていないと、結果が本当にその治療によってもたらされる恩恵なのかどうかについてはわからないわけです。論文がPECOの構造を持っているということは、文献の結果を批判的に理解する際にも大いに役立ちます。　比較されるものが研究事業の中に設定されており、原因として位置づけられること、たとえば、喫煙者と非喫煙者、女性と男性、手術治療と薬物治療、というような設定が行われ、それぞれの設定群における結果が提示されていることは、臨床研究の基本である一方、巷に溢れる何らかの効果に関する情報はその体裁が整っていません。あまたの健康食品やダイエット商品等の売り込みを見れば、そのことがよくわかると思います。たいていは、原因があって（この場合は、健康食品などを使用した人たち）、さらに効果が出た人たちのみについての情報しか書かれていません。原因の有無と効果の有無の情報が、単純にいえば２X２の表（図１）にあらわされる結果を持っているかどうかについてまずチェックが必要です。どちらが原因でどちらが結果か　原因と結果についての研究結果を読み解くとき、次に注意することは、原因は本当に原因で、結果は本当に結果であるかということです。以下を見てみましょう。研究結果B：N大学が行った最近の調査によれば、一日に平均して２合以上の飲酒習慣がある人はそれ以下の人、あるいは飲酒しない人に比較して心の健康度が有意に低いことが明らかになった。うつ秒などの自殺リスクを減らすためには、過度の飲酒を控えるような対策が必要である。　これは因果関係としては、研究結果Aよりももっともそうですが、なんとなく腑に落ちない部分があります。それは、どこでしょうか？おそらくこの調査は、横断研究、すなわち、ある時点の飲酒習慣と現在のメンタルヘルスを同時に調べたものと思われます。そうであれば、いろいろな疑念がわいてきます。たとえば、この研究結果を受けて、「飲酒習慣＝原因」「低いメンタルヘルス＝結果」と位置づけていますがはたしてそうでしょうか？逆に、メンタルヘルスの低下が原因で深酒をするようになったかもしれません。もしくは、この調査では触れられていない、メンタルヘルスを低下させるような要因　--たとえば、離婚や職を失うなど人生の大きなイベント—　が別にあり、それが原因となってメンタルヘルスと飲酒習慣の両方に影響を与えた可能性もあります。　原因として仮定されている因子Ａと結果として仮定されている因子Ｂに研究結果が有意な関連を表しているとき、そこに存在する因果関係トリックのパタンについて図２に示しました。この図を見ながら飲酒習慣とメンタルヘルスとの関係についてもう一度考えてみてください。さらに、ここでは一足飛びに飲酒→自殺リスクにまで言及していますが、このような理論が「風が吹けば桶屋が儲かる」的な理論になっていないかということにも注意が必要ですね。　関連を持っているＡとＢが本当に因果関係として理解することが出来るかについてのチェックポイントを表１に示しました。臨床研究においては、特に原因Ａが時間軸においてＢの発生よりも昔の事象であることを確実にするために研究計画を工夫します。これらのポイントを念頭に入れつつ、原因と結果の信憑性について読んでいくことが肝要です。交絡因子の存在　因果関係のトリックにはいろいろなパタンがありますが、原因と結果の関係が妥当であるかどうかを読み解く際に、最も大切となるものが、図２の最後の図にあたる「結果Bに影響を与え、原因と考えられるＡと相互関連を持つ他の原因の存在」です。これを交絡因子と呼びます。ここでまたひとつ研究結果を提示します。研究結果C：抗インフルエンザ薬タミフルは、インフルエンザの罹病期間を短縮することで知られているが、タミフルの副作用として、内服をした小児に異常行動があらわれる可能性があることが懸念されていた。この度行った大規模調査で、インフルエンザに罹患しタミフルを服用した7歳以上15歳以下の小児には、タミフルを服用しなかった小児に比較して1.5倍異常行動が発生することが明らかになった。　以上の研究において、原因は「タミフルの内服」であり、結果は「異常行動の発生」ということになります。一時期新聞等でもこの情報の信憑性がどうなのかについて話題になりました。因果関連の妥当性に関するひとつの論点は、比較されるものの存在、すなわち「インフルエンザに罹患して、タミフルを服用していない小児も同じように異常行動は出る。」というものでした。もうひとつ大きな論点が、「タミフルを内服している小児は、タミフルを内服していない小児に比較してより重症である。そして、より重症のインフルエンザ症状を持つ患者はより異常行動の症状が発生する。したがって、『タミフルの内服＝原因、異常行動＝結果』は見せかけの因果関係で、本当は『より重症な症状＝原因、異常行動＝結果』が真の因果関係である。」というものです。この議論における「インフルエンザ症状の重症加減」が交絡因子に当たります。　交絡因子が研究結果に影響を与えることはきわめてしばしばあります。特に、性別や年齢層、喫煙習慣などの患者が固有にもつ基本特性は、病気への罹患や慢性疾患における死亡などをアウトカム（結果）とした場合に無視できない大きな交絡因子となりうるものです。よくデザインされた研究では、この交絡因子の影響を最小限にすることに多くの努力が行われています。　論文はもちろん、原因と結果に関する情報は日常的にどこでも見かけるものです。それらを目にしたとき、常にそこにある原因と結果の関係が妥当であるかどうかについていちいち注意を払い、心の中で突っ込みを入れてみてください。そのようなところからエビデンスを読み取る力は養われると思います。独立行政法人国立病院機構東京医療センター臨床研究センター　臨床疫学研究室長　尾藤 誠司]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Mon, 31 Aug 2009 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[臨床上の個別の疑問に文献は答えられるか？]]></title>
            <link>/tabid55.html?artid=37710</link>
            <description><![CDATA[独立行政法人国立病院機構東京医療センター臨床研究センター　臨床疫学研究室長　尾藤 誠司　このシリーズで、私はまだ文献の中身のお話について取り上げていませんが、今回まで文献の中身に入る前の段階の話となります。文献を読み解き、医療情報として臨床医に情報として提供する際には、この段階についての理解が非常に大切であるというのがその理由です。今回は、EBMの5つのステップにおいて最も重要といわれている、「臨床上の疑問の明確化」について解説します。エビデンスとEBM（エビデンスに基づいた医療）との違い　よく、「OOO疾患のEBM」というような総説や本が出ていますが、その多くは誤った使われ方がされています。多くの場合、この内容は「OOO疾患のEBM」についてではなく、「OOO疾患のエビデンス」について書かれています。さて、EBMとエビデンスとの違いは何でしょうか？それについてまず考えてみましょう。エビデンスとは、前回説明した情報のことを言います。情報は固定されているものですから、エビデンス自体が状況や時代によって変化することはありません。一方、EBMは情報ではありません。EBMは医療専門職が患者に対して行う一連の行動のことを意味しています。すなわち、患者を前にして、この患者に対して自分が何を行うべきかについて考えること、行いの根拠について考えること、その上で判断を行い、患者に対して行為すること、この一連の行動の流れがEBMなのです。ちょっと混乱しますね。では、この部分はまず教科書的に説明します。EBMは、５つのステップから成り立っているとされています。“臨床上の疑問を定式化する（STEP1）”、“適切なエビデンスを探す（STEP2）”、“エビデンスの批判的吟味を行う（STEP3）”、“エビデンスを目の前の患者に適用する（STEP4）”、そして“自分が患者に対して行った行動を振り返る（STEP5）”、のステップです。この行動の中で、エビデンスは重要な情報として位置づけられる意思決定のためのリソースではありますが、EBMは根拠に基づく“医療”ですので、医療者が行う医療そのものを指しているのです。この考え方は実に重要です。なぜなら、医療者は通常ある状況における特定の患者についてよいことをしたいと考えており、そのための根拠として文献が必要と考えているからです。すなわち、EBMにおいて利用される診療エビデンスは、医療者が行う現実上の医療判断を支援する情報であることが想定される必要があるのです。臨床上の疑問とはどのようなものか？　さて、医療現場における具体的な医療判断の支援として診療エビデンスを位置づけた場合、まず設定されるべきなのが疑問です。現場における疑問とはどんなものでしょうか？言い換えるのであれば、現場における疑問と、学校や研究所における疑問にはどんな差があるのでしょうか？たとえば、医学生が持つ疑問は、「最新のII型糖尿病の治療はどのようなものか？」とか、「クローン病の診断基準は何か？」というような疑問です。一方で、現場の臨床医が持つ疑問は、「A1ｃがだんだん高くなってきている斉藤さんにもう一種類薬を追加するべきか？追加するとしたらどのような薬がよいか？」とか「菱山さんの大腸内視鏡所見はこうだったけれど、それを持ってクローン病と言い切ってしまってよいか？もう少し検査などの評価が必要なのではないか？」というような疑問となります。前者のような疑問と、後者のような疑問との本質的な差、それは、後者の疑問は具体的な臨床判断についての疑問であるということです。Aの方法がよいかBの方法がよいか、というような、直接の臨床判断に関する疑問に対して、教科書はなかなか答えてくれません。そして、このような疑問に対する有用な情報となるのが、いわゆる診療エビデンスなのです。ただ、実はこのような疑問は、EBMに慣れてしまうと自然に設定できるのですが、毎日の臨床の中で悪戦苦闘している臨床医にとっては、それほど自然な行いでないことでもあるのです。日々の臨床では、自分がある選択肢について迷っているのが何のためであるのかについて、通常の臨床ではあまり細かく考えていないことが多いので、判断の根拠となるような情報を探していくためのとっかかりがつかめないままとなっていることはしばしばあります。そこで必要となるのが、EBMのステップ１である「疑問の定式化」という作業です。疑問の定式化は、EBMではP-E-C-Oというひな型に当てはめて行います。PECOって、どこかで見たことありませんか？不二家はPEKOちゃんですのでちょっと違いますね。この連載の第一回から本シリーズタイトルの背景にうっすらと描かれてある文字、“PECO”と書いてありますね。はい、第三回目でようやくPECOにたどり着きました。図１にPECOがもつ基本構造について記しました。Pは、PatientのP、EはExposureのE、CはComparisonのC、そしてOはOutcomeのOです。 たとえば、先ほどの「A1ｃがだんだん高くなってきている斉藤さんにもう一種類薬を追加するべきか？追加するとしたらどのような薬がよいか？」という疑問を見てみましょう。このままではどんなエビデンスがこの医師の疑問を助けることができそうかよくわかりません。では、PECOに合わせて定式化してみましょう。そうなると、P　A1ｃがだんだん高くなってきている斎藤さんE　新たに薬を開始する。C　もう少し様子を見る。O　糖尿病が悪化、もしくは改善する。という感じになります。なんとなくはっきりしてきました。ただ、斎藤さんに関する論文はないと思いますし、糖尿病の悪化、というのも漠然としていてよくわかりません。もう少し、一般化すると同時に、具体化する必要があります。より洗練されたPECOとして、P　A1c7.5以上で推移している50歳以上の合併症を持たない2型糖尿病患者E　薬物をさらに使用してA1c＜6.5を目指した治療を行う。C　薬物の追加をより控え、A1c＜7.5程度を目指した治療を行う。O　10年以内の合併症の発生、もしくは心血管イベントの発生などとしてみました。この変化によって、２つのことが進歩したと思います。ひとつは、具体的に斎藤さんに対する判断根拠の一つとなりそうな文献をよりイメージできるようになりました。もう一つは、この医師が、斎藤さんへの医療判断に対する迷いが明確になり、斎藤さんに対する自らの姿勢について臨床医として整理できました。臨床医に情報を提供する場合、このように、臨床医がその臨床現場で誰に対するどんなことに困っているのか、が明確であればある程、有用な情報を提供することが出来るのです。臨床のPECOと臨床研究のPECO　EBMのプロセスにおいて、全くの個別事象のなかで起きる疑問をPECOに変換することは確かに技術を要する能力ではありますが、それによって得られるメリットは非常に大きいです。重要なことは、PECOの構造は、そのまま臨床研究の“方法”部分の構造、すなわち、研究デザイン、対象サンプル、介入/暴露の方法、観察項目に当てはめることが出来るということです。特に、最近の臨床研究論文の抄録は「構造化抄録」と呼ばれ、その方法部分が構造化されて書かれていますから、頭の整理が出来ていれば、目の前の患者さんから、より一般化した“P”、そして、論文における対象サンプルとなった患者さんの関係を一つなぎにすることができます。図２にその関係について表記しました。診療エビデンスとしての研究論文に書かれている患者（P）、治療/暴露（EとC）、そしてアウトカム（O）が、最終的に臨床判断の対象者となる個別の患者さんにおける、個別のアウトカムのための個別の診療行為に関する診療判断に最大限役立つためには、まず、個別の患者さんから想定した臨床のPECOが、その患者さんを概念としてうまくあらわしていることが大切であり、その上で臨床のPECOと、入手した臨床研究論文中のPECOとが似ていれば似ているほどよいということになります。図３に、EBMのそれぞれのステップの流れと、PECOとの関係を記します。以前の情報提供は、前提となる個別の患者や臨床医の悩みと分断された形でいきなり文献があって、文献に医療を合わせていく、とう様なスタイルが多かったように思います。EBMがもたらした大きな変化の一つは、文献を目の前の患者さんに対する個別の問題を解決するための道具の一つとして位置付けたことなのです。目の前の患者さんに役に立つ情報を提供するためには、具体的な臨床現場を常にイメージし、現場の医療者とのコミュニケーションをとることが重要となります。MRから医師に対して、「具体的に困ってらっしゃるのはどんな患者さんなのでしょうか？」「その患者さんにとって医療が出来る一番大切なことはどんなことなのでしょうか？」というような質問が出るようになればずいぶん頼もしいです。今回は、“製品の利益のためのエビデンス”から、“患者の利益のためのエビデンス”を意識しましょう、というお話でした。]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Fri, 31 Jul 2009 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[データと情報と知識と知恵]]></title>
            <link>/tabid55.html?artid=12732</link>
            <description><![CDATA[独立行政法人国立病院機構東京医療センター臨床研究センター　臨床疫学研究室長　尾藤 誠司　先月は、ＭＲが医学に関する情報を取り扱う際に、そもそも医学論文はどのような要素から成り立っているのか、ＭＲが臨床論文に代表される医学情報を読むとき、どのような視点を持つべきなのかについてお話ししました。今回は、情報の入力と出力についてのお話です。情報とはなにか？　情報を提供するＭＲは、臨床にとって有用な情報を入手し、情報を欲しがっている人、すなわち臨床医に知らせることのプロである必要があります。そのためには、情報というものが持っている性質について知る必要があります。医学論文に書かれてあるデータは、それが情報として利用されることを前提に書かれています。こんなこと当たり前だと思われるでしょうが、そのあたり前について少し立ち止まって考えてみたいと思います。　まず、下の図を見てみましょう。　これはある医学雑誌に掲載された論文の結果の一部です。上記に表記されているものは、データであることはほぼ間違いないでしょう。そして、これは同時に情報であるとも言えるわけですが、多くの人から見て、この表はある程度の翻訳と解説がないと情報にはなりえません。データと情報の違いを端的に言えば、データ（報）が何らかの意志（情）を持っているかどうか、ということになります。情＋報で情報です。日本語ってうまく作られていますね。　実証的な観察に基づいて現れた数値はデータであると読んで差し支えないでしょう。データにはもちろん質の差があり、その差は「正確なデータ」と「不正確なデータ」の差として理解されます。一方、情報は、「正確な情報」と「不確かな情報」とともに、「正しい情報」と「誤った情報」という考え方も持つ必要があります。情報には「情」が入っていますから、その情の入れ方によって表記されたデータは正しく伝えられるか、誤って伝えられるかが決まります。論文において、データは如何にして情報となるか？　ここで、データが論文の中で情報として成立していくさまについて紐解いて見ましょう。先ほどの表で、私は表に書かれてある数値をデータであるといいましたが、実はこのデータも加工されたデータです。このデータには、加工する前の「素のデータ」というべきものが存在します。通常、論文に表記されるデータというのは、たくさんの被験者一人ひとりのデータを集計したまとめのデータなのです。この表についても、本当は202名の患者さんのデータが集計されてこのようなシンプルな形になっているのです。具体的にはこのデータの「素のデータ」は下のようなものになります。　このような素のデータセットを作成したした上、まず右の「３年以内の死亡・生存」が不明な人たちを削除し、その上で割付上「介入」のグループに入った人たちと、「コントロール」のグループに入った人たちの中で、「死亡」の数と、「生存」の数を数えて、まとめの表にしたものが最初にお見せした表なのです。皆さんが論文結果のデータを眺めるときに、もともとはこのような素のデータ集があることを常にイメージしていただくことで、最初のデータの正確さについて批判的な目を持つことが出来ます。たとえば、上の素のデータ集において、より正確なデータとより不正確なデータがあることに気づくと思います。年齢や性別はおそらく正確であると思いますが、喫煙状況を「喫煙者」「非喫煙者」「喫煙既往」にきれいに分けることは実際上なかなか難しいかもしれませんし、データ取得そのものが困難であることもあるでしょう。そのような目で、このデータ上最も重要な「3年以内の死亡・生存」を見たときに、加工される前の素のデータがどれほど正確なものであるか、加工されたデータを情報として捉える際にどんな注意が必要か、についてイメージすることが可能になってきます。　さて、先ほどの「素のデータ」ですが、これは情報でしょうか？このデータをみて、データの発する「情」を感じる人は、相当高い分析能力を持った人です。少なくとも私はこのデータを情報として理解することは不可能です。一方、まとまった集計データは、それ自体がある程度のメッセージを発しています。たとえば、最初の表の「相対リスク＝0.7」という部分は、臨床医にとっては分かりやすいメッセージです。ただ、このメッセージは、このメッセージを提供する側、受け取る側の取り方によって「正しい情報」「誤った情報」になってきます。しばしば商業雑誌などで見かける、「ＯＯＯＯに有意差！」という情報は、多くの場合誤った情報の要素を含んでいます。有意差の意味についてはまた詳しく取り上げたいと思いますが、いかに正しくまとめられたデータでも、その切り出し方、表現の仕方で情報は正確さとともに正しさを欠いていくのです。　では、データを正しい情報にするにはどうすればよいのでしょうか？実は、その答えが書かれてあるのが論文の「背景」「方法」「考察」の部分なのです。ピアレビュー論文の持つ構造は、データを正しい情報として見せる上で大きな意味を持っています。まず「背景」には、当該研究データを提示する上で、どんな文脈がそもそもあり、その文脈においてどのような事実が知識として分かっているのか、その知識の裏づけとなった根拠は何か、さらには、どのようなことが分かっていないのかについて解説されています。すなわち、研究者がなぜこの「データ」を「情報」として発信しようと考えているのか、誰に向けて発信しようと考えているのか、ということです。次に記述される「方法」部分では、先ほどの「素のデータ」の正確さに加え、発信されるデータがどのような人々を対象にしているのかについて記載がなされています。さらに、「考察」部分では、「私たちが提示したこのデータは、このように理解してください」という、データを「情報」に転換するためのメッセージが解説されています。　データは意志を持ちません。データに意志を持たせるのは、論文そのものと、必要としている人にデータを伝達する人（すなわちMR）なのです。すなわち、MRに必要な態度と技術は、そこにあるデータが臨床家にとってどのような情報になるのか、なるべきなのかを洞察することです。「ＯＯＯＯに有意差！」という文字をどこかで見つけたとき、もしくは、臨床家にそれを伝えようとするとき、自分はその事実を正しい情報として受け取っているのか、正しい情報として伝えようとしているのかについて自問してみてください。そこから、情報の批判的吟味は始まります。伝達された情報は、どのように臨床家の知恵となるか？データと情報と知識と知恵の関係　論文の結果も含め、情報は論文などの形で発出された時点で固定されます。情報は固定化されたものですから、それ自体は変化しませんし、情報自体が患者さんに利益を直接もたらすわけでもありません。医学情報は、臨床家の脳にインプットされ、より良いケアとして活用されることによってはじめて患者への利益となるものです。臨床家の脳の中にインプットされた時点で情報は知識となります。さらに、知識は蓄積され、蓄積されるたびに臨床家の脳の中、もしくは社会のコンセンサスの中で変化していきます。たとえば、その昔、ACE阻害剤は腎不全の患者に対して禁忌薬でした。過去の文献情報を根拠に、「腎不全患者に対しACE阻害薬を用いることで高カリウム血症の危険が高まる。」「腎不全患者に対しACE阻害薬を用いることでクレアチニン上昇の危険が高まる。」という知識を臨床家は持っていましたが、その後「腎不全患者に対しACE阻害薬を用いることで人工透析までの期間が延長する」という知識が蓄積されたため、臨床家の標準的な行為は大きく変化しました。振り返ってみれば、15年前までの情報によって蓄積された知識は、今から考えれば不完全な知識であったわけです。さらに、今の知識はおそらく15年後から見れば不完全です。それ単体として固定している情報は、日進月歩で変化していく知識を支える断片なのです。臨床家に情報を伝達するものは、そのような情報の性質を知っておく必要があります。　では、知恵とは何でしょうか？知恵は、おそらく知識の蓄積によって生まれる臨床家にとっての「行為の基盤」のようなものです。腎不全の例では、今まで蓄積された知識をもとに、「この患者さんのクレアチニン値とカリウム値は現在このくらいだから、ACE阻害剤を開始しよう。その際には、開始してからしばらくはクレアチニン値とカリウム値の変動をチェックしておこう」という思考が臨床医としての知恵であり、優れた知恵によって行われる診療行為こそが患者さんにとっての利益につながるわけです。　論文が示すエビデンスは情報です。ただ、有用な情報も認識の仕方によってはデータ以上の意味を持たなくなることもありますし、正しい情報として伝わらないこともあります。また、一つのエビデンスは、知恵の体系を支え、臨床判断を支える一つの情報の断片であり、一つのエビデンスが臨床医の行為を決定的に決めることはむしろ少ないでしょう。臨床エビデンスを情報として提供するプロフェッショナルは、素のデータ、表記されたデータ、情報、知識、知恵、そして臨床行為の関係をイメージしたうえ論文を読み、情報を提供することができれば、その情報提供は非常に質の高いものとなるでしょう。]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Tue, 30 Jun 2009 00:00:00 +0900</pubDate>
        </item>
        <item>
            <title><![CDATA[MRのための診療エビデンス読解術]]></title>
            <link>/tabid55.html?artid=43</link>
            <description><![CDATA[今月から、シリーズ「MRのための 診療エビデンス読解術」を担当することになりました、国立病院機構 東京医療センターの尾藤です。皆さんよろしくお願いします。まず、私がこの企画を素晴らしいものだと思い引き受けさせていただいた理由についてお話しさせてください。本シリーズの目的　現在、ＭＲの方からの情報提供は、明らかに我が国の医師の行動を左右しています。その意味においては、ＭＲの行動は、我が国の医療の質、そしてコストについて大きな影響を与えているということができます。もちろん、ＭＲから医師を中心とした医療機関の専門職にもたらされる情報は様々です。最新であり、かつ臨床上非常に重要な文献であることもあれば、純粋な販促物であることもあります。その情報にある程度のばらつきがあるのは仕方がないことだと思います。　一方で、受け取る側である医療専門職が、そのことについて十分に批判できる能力を有しているかというと、決してそうではありません。医師も含め、多くの医療専門職は、与えられた情報を批判的に読解し、自分と自分の患者さんにとって有用なものとそうでないものに分類し、効果的にその情報を活用する、というようなトレーニングを受けていません。ＥＢＭ（根拠に基づく医療）が隆盛した後、独学や、あるいは何らかの講習会等を通じて、情報の批判的吟味について学習している人間はいるとは思いますが、まだまだ少数です。その意味では、彼らはみなさんが提供していく情報に対して脆弱な存在なのです。　まずＭＲのみなさんに自覚していただきたいところはそこなのです。自分が提供する医療情報は確実に患者さんに影響を及ぼします。であれば、情報提供者である自分自身が、その情報の価値や益、もしくは害について十分に理解する能力を持つことが、プロフェッショナルの責務です。　本シリーズでは、いわゆる臨床試験やその他の臨床研究から得られた結果を中心とした「診療エビデンス」を、ＭＲがどのように理解し、適切な態度と方法で情報提供を行うことができるかについて、なるべく事例を踏まえて解説していきたいと思います。小難しい統計手法や研究手法の知識に関しては、統計や疫学の清書を読んでください。私はむしろ、このシリーズで、医薬情報にMRとして対峙するマインドのようなものを伝えることができればと考えています。診療エビデンスとはなにか？　さて、ＥＢＭという言葉が我が国に輸入されてもう10数年がたち、ＥＢＭという言葉を知らない医師は皆無であるといってもいいでしょう。しかし、診療エビデンスと日常現場での臨床行為との関係についてしっかりと理解した上、医薬情報を「根拠（エビデンス）」と呼んでいるかどうかについては、十分であるとは言えません。　たとえば、あなたは友人と登山中に、道に迷ってしまったとします。おなかが減って困っていた時にあなたたちの目の前にキノコが生えていました。友人は「おお、ラッキー！」とキノコを摘んで早速食べてしまったのですが、その直後に呼吸困難に襲われて死んでしまいました。さあ、あなたはそのキノコを食べるでしょうか？食べませんよね。これが「根拠」に基づく「判断」です。すなわち、根拠とは、具体的な行動を想定した情報である必要があるのです。「私はこの状況においては、△△ではなく、○○という選択をします。なぜなら×××という根拠があるからです。」というのが、医療という科学的な側面の強い行動において重要な判断のひな型になります。この宣言の“×××”に当たる部分が、「エビデンス」です。　ただ、これは「根拠」ではありますが、「科学的根拠」とは言い難い気がしますね。実際に、友人に起こった出来事はこの段階では科学的根拠とは言い難いです。科学とはなにか？　では、「科学的根拠」とはどんなものなのでしょうか？まず一つは、感情や感想ではなく、現象であるということは条件でしょうね。先ほどのひな型に当てはめた時、「私は今度のクリスマスに、エリちゃんをデートに誘います。なぜなら、私はエリちゃんのことが大好きだから。」といった時の「大好き」という根拠がなぜ科学的ではないかというと、それは現象ではなく感情だからです。では、現象の中で、どんなものが科学的根拠と言えるでしょうか？試験管の中で起きる現象や、塩基配列の変化で起きたことは、科学的事実としてよいでしょうか？　哲学者カール・ポパーによれば、科学を条件づけるものは「反証性」であるといわれています。反証性とは、同じ手続きを踏むことによって、同じような結果が生まれる、ということです。偶然によって生まれた産物は、その時点では科学が生み出したものではありません。偶然を紐解いて、一定の手続きを確認し、ある仮説を立て、その仮説を検証するために同じような手続きを踏み、同じ結論を見出していくプロセスが科学であり、そこで得られた産物を我々は「科学的根拠」と呼んでいます。科学的であるということは、すなわち「同じ計画に基づいて、同じことをやったら、同じ結果が出るような様子」のことをいいます。　では、先ほどお話した、「僕の友達が、このキノコを食べて死んじゃった」という「根拠」に基づいた、「このキノコを食べると死んじゃうから、食べない方がいいよ」という「理論」もしくは「推奨」を、「科学的根拠」に基づいた推奨たらしめるには何が必要でしょうか？今の時点では、友だちが急に死んでしまった原因をキノコの毒のせいにするには、科学的根拠としては不十分でしょう。友だちは、そのとき偶然心筋梗塞や脳卒中になったかもしれません。仮にきのこが直接のきっかけだったとしても、それは毒のせいではなく、友だちがたまたまそのキノコにアレルギーを持っていて、アナフィラキシー反応で死んでしまった可能性もあります。「キノコの毒によって人が死ぬ」ということを信頼に足る情報とするには、おそらく3つのこと、すなわち、「このキノコには人間にとって毒となるようなものが含まれている」ということ、「このキノコと同じ種類の違うキノコにも同じものが含まれている」ということ、さらに、「別の人がこのキノコを食べたら、やはり死んじゃった」ということが必要になります。　私たちが扱っている情報には、科学的根拠に見えて科学的根拠でないことがたくさんあります。その代表は、その道の偉い先生がいう「私はこう思う」という個人的な意見なのかもしれません。医学という科学に関する根拠を取り扱う際には、まず、この情報は何らかの臨床判断の根拠たり得るものか、この情報は科学的なプロセスに基づいて生まれたものか、について考えてみる必要があります。論文には何が書かれているのか？　みなさんが扱う医薬情報には、学術論文のほかにも医薬品添付文書や販促用パンフレットなど様々なものがあります。その中で、科学的根拠の体をなしているのは、いわゆる学術的な原著論文であるといえます。ただ、論文の質も様々ですし、質の高い論文が臨床の判断を強く支える根拠となり得るかどうかについても一概には言えません。次回からはその部分について各論的に解説をしていきたいと考えています。　ただ、論文の質も様々ですし、質の高い論文が臨床の判断を強く支える根拠となり得るかどうかについても一概には言えません。次回からはその部分について各論的に解説をしていきたいと考えています。　さて、診療エビデンスとしての学術論文を批判的に読んでいくとき、知っておくべき重要な前提があります。学術論文の結果に書かれてあることは、以下のことで成り立っているということです。すなわち、真実、作為的なウソ、作為的でないウソです。　この中で、作為的なウソはもっとも見抜くことが難しいですし、倫理的な観点からあってはならない悪質なものですので、本シリーズでは取り上げないことにします。根拠を作り出した研究者にウソをつく意図はないのに、どうしても情報に誤差というのは出てしまう。その結果生まれてしまうウソについて、我々情報を扱う人間は敏感になる必要があります。　では、意図しないウソにはどんなものがあるでしょうか？一つには、偶然がもたらすウソです。たとえば、「サイコロを12回振ったら4の目が4回出た。サイコロで4の目が出る確率は4／12、すなわち1／3である。」というのは偶然によるウソ、ということになります。私たちは、このことをしばしば統計と呼んでいます。　二つ目は、情報の歪みがもたらすウソですね。伝言ゲームで最初の人の言葉と最後の人の言葉が全然違う言葉になっていたりするのも情報の歪みがもたらすものです。この情報の歪みは、目の前に表象される現象を情報として取り扱う場合必ず起こってくるものです。そして、実は医学研究のように、いろいろなものが数字や画像で表象される世界においては、結構歪みを認識しないまま物事をとらえてしまうことがむしろ多いのです。　三つ目のウソは、先ほどのキノコの例にあるように、「目の前でキノコを食べた友人が死んでしまった→キノコを食べると毒で死ぬ。」という論理を導き出す際に、隠れてしまっている他の要因に気づかずに結論を出す、ということです。疫学用語ではこれを「交絡」と呼ぶのですが、臨床研究論文では、実はこの３つめのウソがもっとも批判の対象となり、また、論文を読む際に注意が必要なものとなります。本シリーズでは、これらのウソの読み取り方についても解説していこうかと思います。医薬情報担当者は、医薬情報取り扱いのプロであれさて、ここまで書いてお気づきかと思いますが、薬剤の構造式のように理論的な情報ではなく、実証的な医薬情報には必ず何らかのウソが含まれています。医薬情報担当者は、まずそのことを自覚してください。そして大切なことは、情報に含まれている真実とウソが、実際に医療を受ける患者さんの健康や生活にどのような影響を及ぼすかについて皆さんが常にイメージすることなのかと思います。医療情報のプロである皆さんが、そのイメージに立脚するかどうかで、情報はどのようにも認識されるものになるし、それは天使にも悪魔にも姿を変え得るのです。]]></description>
            <category>MRのためのエビデンス読解術</category>
            <pubDate>Sun, 31 May 2009 00:00:00 +0900</pubDate>
        </item>
    </channel>
</rss>