比较提供给不同患者组群的不同疗法
疗法比较通常需要对照接受了不同治疗方法的患者组群的经历。要使对照做到公平,不同组群的患者构成必须类似——因而,同类患者可以与同类患者进行比较。如果接受某种治疗的患者很可能无论如何都要比接受另一种治疗的患者做得好(或坏),这就带来了分配偏倚,使我们无法确信疾病的结局反映了治疗措施的不同疗效,而不是由于自然和时间流逝带来的效果。
18世纪的医生威廉·切塞尔登(William Cheselden)认识到了“不相似组群”问题,当时医生们正在分别比较摘除膀胱结石术后的患者死亡率。切塞尔登指出,考虑不同医生治疗的病人的年龄很重要。他注意到,事实上死亡率随着患者的年龄不同而发生变化( Cheselden 1740 )——年老的患者比年轻的患者更可能死亡。这意味着,如果人们希望比较进行不同类手术的患者组群之间的死亡率,就必须考虑对照组群中患者的年龄差异。
对过去无意中接受过不同治疗措施的患者的经历和结局进行比较,今天仍然被用作一种尝试评估疗效的方法。面临的挑战是要了解清楚用于对照的组群在接受治疗前是否十分相似。通过比较采用激素替代疗法(HRT)的妇女和未采用该疗法的妇女之间的患病经历,设法评估激素替代疗法产生的效果就是一个例证。正如随后对激素替代治疗措施的公平试验所作的分析所显示的那样,试图以这种方式回顾评价治疗措施的效果,有时可能带有危险的误导性(McPherson 2004)。
几乎不太可能完全相信,从过去接受过某种疗法的人群中选出的对照组与最近接受过另一种疗法的群组在所有重要方面都可以类比。即使我们能够获取接受过不同治疗方法的患者的某些信息(例如他们的年龄,或者他们以往的病史),结果也是如此。其它具有重要意义的信息(例如自愈可能性)可能根本无法获取。
较好的做法是在开始治疗之前就筹划疗法的对照。例如,詹姆斯·林德1747年在皇家海军军舰“索尔兹伯里”号开始比较治疗坏血病的六种方法之前,他注意选择的病人都处于这种往往致命的疾病的类似阶段。他还确保他们相同的基本饮食,并被安置在相似的居住环境中。这些都是治疗方法之外有可能影响他们康复可能性的因素( Lind 1753 )。必须付出同等努力,设法确保治疗对照组由类似的人员构成。
使用交替或随机的方法确定无偏倚治疗对比群组
尽管林德注意保证他的六个对照组的水手具有相似性,但是他们并没有叙述他如何决定哪些水手应接受六种疗法中的哪一种。只有一种方式能够确保治疗对照组的设置方式在已知和未知的各个重要方面都相似。这就是通过利用某种形式的随机程序来组织治疗对照组,从而避免了在开始治疗之前针对不同疗法的偏倚选择。
在林德时代过去一百年之后,一名军医格雷厄姆·鲍尔弗(Graham Balfour)在一次试验中示范了如何做到这一点,该试验的目的是观察颠茄制剂是否能预防儿童患猩红热。在他负责的部队福利院里,他用交替的方法——“以避免选择的问题”——来决定哪些男孩得到颠茄制剂,哪些不给( Balfour 1854 )。交替是在提供被比较的治疗方法之前组织相似的治疗对照组所用的集中无偏方法之一。在20世纪上半叶,有许多利用交替或轮换方法(例如 Hamilton 1816 ; MRC 1944 )或抽签( Colebrook 1929 )来组织治疗对照组的例子——例如,掷骰子( Doull et al. 1931 )、彩色珠子( Theobald 1937 )或随机抽取号码( Bell 1941 ; MRC 1948 ; MRC 1950 ; MRC 1951 )。这种“随机分配”是这类被称为“随机化”的公平试验唯一的但极为重要的特征。一个随机(有别于随意)分配意味着,已知发生某些事件的可能性,但任何特定情况下的结果都无法预料。所以举例来说,如果用一枚硬币进行随机选择,头朝上的可能性是50%,但不可能知道某次抛硬币的结果如何。
正如点击 这里 可以阅读到的文章所述,掷签或抽签是做出公平决定的一个确立已久的办法。这些方法有助于确保各个对照组不会由不同类型的人组成。可以检查已知并已测量的重要因素,如年龄。然而,可以预计一些可能影响康复的未测量因素,例如饮食、职业和焦虑,平均来说可以相抵。如果你想观察随机分配如何产生相似的人员分组( 请点击此处查看示范 )。
随着使用交替和随机分配方法对患者群体进行无偏分组,以比较不同疗法的进一步普及,人们清楚地认识到,必须严格遵守分配计划,以避免设立有偏倚的治疗对照组( MRC 1934 )。如果不让那些决定谁参加治疗对照的人看到治疗分配计划,就可以避免分配偏倚带来的风险——简言之,防止他们作弊从而使比较产生偏倚( MRC 1944 ; MRC 1948 ; MRC 1950 ; MRC 1951 )。
避免治疗对照组的偏倚损失
在想方设法使治疗对照组的设立方式实现了同类比较之后,很重要的一点是避免由于患者选择性退出对照组而导致的偏倚。应当尽可能保持分组的相似性,使分配到治疗对照组的所有人员都得到随访并纳入到试验结果的主要分析之内,这就是所谓的“意向治疗”分析( Bell 1941 )。
不这么做就有可能导致验证治疗措施的试验不公平。举例来说,对于脑部血管部分堵塞而导致晕眩的病人,具有两种截然不同的治疗方法。对这种病况的治疗非常重要,因为由于这种原因出现短暂晕眩的病人患中风的风险有所增大,中风有可能导致残疾,甚至死亡。针对晕眩的一种疗法,包括服用阿司匹林来阻止阻塞恶化;另一种疗法包括一种外科手术,以清除血管中的血栓。
对这两种治疗晕眩的方法进行公平比较,将包括利用某种无偏倚的分配方法(如随机选择)设立两个患者组群。那么比较可以从两组相似的患者开始,接着继续比较他们各自随后发生中风的发生率。但如果通过手术治疗组的中风发生率只记录术后存活的病人,那么就会忽视手术本身会导致中风和死亡这一重要事实。这将导致对两种治疗措施的不公平比较,由此导致对手术效果的一种带有偏倚的盲目乐观描述。这就说,没有进行相似者之间的比较。
随机试验的比较重点,必须尽可能建立在指派的所有人都接受了要比较的各自治疗措施,不能有例外,而且这些人要属于他们原先被指派的组。如果不遵循这一原则,人们就可能得到总体疗效的偏倚信息。