避免带有偏倚的对照

治疗结局评价方式的差异

利用盲法来减少治疗效果评估的偏倚

Commission Royale 1784对于用来评估治疗的某些结局——例如存活——不太可能使用带偏倚的评价,因为几乎没有提出意见的空间。18世纪一些外科手术方法的试验就是如此,在这种情况下存活是手术成功与否的主要衡量方式( Faure 1759 )。不过,其它大多数结局的评估要么始终涉及主观性(如病人的症状),要么可能涉及主观性。导致这些错误知觉的偏倚被称为观察者偏倚。当人们相信他们已经“知道”某种治疗的效果时,或者当他们由于特殊原因偏好被比较的治疗措施中的某一种时,就会带来某种问题。如果没有采取措施来减少治疗措施的比较中带有偏倚的结局评估,治疗效果往往会被高估(Schulz等 1995)。在评估结局时,主观性的成分占得越大,就越需要减少相应的观察者偏倚,以确保治疗措施试验的公平性。

在这些常见的情形中,针对患者和医生的“盲法”是进行公平试验的理想方法。对于某种疗法的最早的盲法(蒙面)评估是由路易十六所委任的一个调查委员会来实施的,目的是调查安东·梅斯梅尔(Anton Mesmer)声称的“动物磁力说”( 皇家委员会 1784 )。该委员会负责评估这种新的治疗方法传说中的疗效,到底是由于任何“真正”的力量,还是由于“精神幻觉”。被蒙住眼睛的人会被告知他们正在接受或没有接受磁力,但有些时候事实上发生的情况却恰恰相反。受试者只有当得知他们正在接受治疗时才会感觉到“动物磁力”,而不是其他情形(Kaptchuk 1998;Schulz等 2002)。

使用安慰剂实现盲法

Metallic Tractors by James Gillray在进行动物磁力效果试验后数年,约翰·海加斯(John Haygarth)利用一种假冒装置(一种安慰剂)进行了一次实现盲法的实验( Haygarth 1800 )。本段所配的漫画显示了一名医生用一种由艾莉莎·珀金斯(Elisha Perkins)申请专利并销售的装置来治疗一名有钱的患者。珀金斯声称他的“ 牵引器 ”——小金属杆——通过“电物理作用力”治愈了各种疾病。在一本题为《导致身体不适和作为治疗方法的想象力:以假牵引器为例》的小册子中,约翰·海加斯报告了他如何对珀金斯的一些说法进行公平试验。在不知道其评估细节的众多患者身上,他采用一种交叉研究方法,比较了已获得专利的金属牵引器(这意味着通过“电物理作用力”起作用)和看起来完全相同的木制“牵引器”(“安慰物牵引器”)。他没有发现金属牵引器有任何益处( Haygarth 1800 )。

约翰·海加斯关于珀金斯牵引器的公平试验是使用安慰剂实现盲法,以减少治疗结局评估中发生偏倚的一个早期实例。在关于顺势疗法的辩论中,安慰剂成为一种研究工具,该疗法是19世纪非传统疗法的另一个主要形式。顺势疗法常常用盲法评估和安慰剂对照来进行“检验”,在健康的志愿者中间试验其疗法的效果( Löhner 1835 ;Kaptchuk 1998)。一个最复杂的安慰剂对照试验,于1879-1880年在密尔沃基医学院(Milwaukee Academy of Medicine)进行。该试验采用了“双盲”法:患者和实验人员都不知道所做的治疗是真正的顺势疗法,还是服用了一种糖丸( Storke等 1880 )。

Adolf Bingel直到此后很久,主流医学界才持有更加怀疑的态度,使得人们承认有必要采用盲法评估和安慰剂来评估自我说法的真实性。德国的研究人员主要受到药理学家的启发,逐渐采用了盲法评估。例如,1918年,阿道夫·宾格(Adolf Bingel)报告说,他在比较白喉的两种不同疗法时努力做到“尽可能客观”( Bingel 1918 )。他对自己或同事是否能够猜到哪些病人接受了哪种治疗进行了评估:“我没有仅仅依靠自己的判断,而是在没有告知试验血清本质的情况下,征求了白喉病室助理医师的意见。因此他们的判断完全不带任何偏见。我渴望看到我的观察结论能够得到独立审查,因此最热烈地推荐使用这种‘盲’法。”( Bingel 1918 )。事实上,在两种疗法之间没有检测到任何差异。德国确立了强有力的盲法评估传统,并由临床药理学家保罗·马提尼(Paul Martini)进行了编纂( Martini 1932 )。

在现代英语国家,药理学家在德国传统以及本地采用盲法评估的“惩治庸医(quackbuster)”运动影响下,首次开始采用盲法评估(Kaptchuk 1998)。到20世纪30年代,他们在临床试验中使用安慰剂对照方面已经处于领先地位。例如,英国医学研究理事会两例最早的公平试验是针对普通感冒的治疗方法。要是没有用“双盲”法来避免患者和医生知道哪些患者得到的是新药以及哪些患者得到的是安慰剂,那么就很难解释他们的结果( MRC 1944MRC 1950 )。哈里·古尔德(Harry Gold)对于盲法评估的奋力宣传似乎对美国带来了特别重要的影响( 疗法会议 1954 )。

如果不能对患者和临床医师设盲,可对观察者设盲

在比较治疗措施时,就疗法的本体对患者和医生进行盲法处理是不可能的,例如,当对手术治疗与药物治疗或不治疗作比较时就是如此。不过,即使在这种情况下,也能采取步骤来减少治疗效果的偏倚评价。可不使独立的观察员了解患者采用了哪种疗法。例如,在20世纪40年代初,曾有一项试验,对接受了当时的标准疗法(卧床休息)的肺结核患者和另外还接受了链霉素药物注射的患者进行比较。研究者认为,向仅仅卧床休息的分组患者注射无活性安慰剂,达到对患者和诊疗医生设盲的目的是不道德的( MRC 1948 ),但是他们采取了替代预防措施,减少对结果带来的偏倚评价。尽管主要结果(存活)几乎没有发生偏倚评价的危险,但主观性可能导致对胸部X光检查的评价产生偏倚。因此,评阅X光片的医生一直不知道他们评估的结果归属于使用链霉素治疗的患者,还是归属于仅采取卧床休息治疗的患者。

与随机化做法结合在一起,在可能情况下使用安慰剂的盲法评估,如今已成为于验证治疗措施公平试验的关键方法之一。

References

Bingel A (1918). Über Behandlung der Diphtherie mit gewöhnlichem Pferdeserum. Deutsches Archiv für Klinische Medizin 125:284-332.

Commission Royale (1784). Rapport des commissaires chargés par le roi du magnétisme animal. Paris : Imprimerie royale.

Conference on Therapy (1954). How to evaluate a new drug. American Journal of Medicine 17:722-727.

Faure (1759). Recueil des pièces qui ont concouru pour le prix de L’Académie Royale de Chirurgie. Vol 8. Paris, P.Al Le Prieur.

Haygarth J (1800). Of the imagination, as a cause and as a cure of disorders of the body: exemplified by fictitious tractors, and epidemical convulsions. Bath : R. Crutwell.

Kaptchuk TJ (1998). Intentional ignorance: a history of blind assessment and placebo controls in medicine. Bulletin of the History of Medicine 72:389-433.

Löhner G (1835), on behalf of a Society of truth-loving men. Die Homoöopathischen Kochsalzversuche zu Nürnberg [The 主页opathic salt trials in Nuremberg].

Martini P (1932). Methodenlehre der Therapeutischen Untersuchung. Berlin :Springer.

Medical Research Council (1944). Clinical trial of patulin in the common cold. Lancet 2:373-375.

Medical Research Council (1948). Streptomycin treatment of pulmonary tuberculosis: a Medical Research Council investigation. BMJ 2:769-782.

Medical Research Council (1950). Clinical trials of antihistaminic drugs in the prevention and treatment of the common cold. BMJ 2:425-431.

Schulz KF, Chalmers I, Hayes RJ, Altman DG (1995). Empirical evidence of bias: dimensions of methodological quality associated with estimates of treatment effects in controlled trials. JAMA 273:408-412.

Schulz KF, Chalmers I, Altman D (2002). The landscape and lexicon of blinding. Annals of Internal Medicine 136:254-259.

Storke EF, Martin R, Rosenkrans EM, Ford J, Schloemilch A, McDermott GC, Carlson OW (1880). Final report of the Milwaukee test of the thirtieth dilution. 主页opathic Times: A Monthly Journal of Medicine, Surgery and the Collateral Sciences 7:280-281.

JLL Book of EssaysHave you read the James Lind Library's Introduction to Fair Tests of Treatments?

We have edited, updated and abridged all of the Essays from the Library for 2019, and lavishly illustrated them with examples from the history of fair tests of treatments.  Share and enjoy!

Download the PDF