Procéder en aveugle pour réduire le biais dans l’évaluation des résultats des traitements
Pour certains résultats utilisés en vue d’évaluer le traitement – la survie, par exemple – il est très improbable que l’évaluation soit biaisée car cela ne donne pas vraiment lieu à une interprétation subjective. C’était le cas pour certains essais réalisés au 18e siècle sur les procédures chirurgicales, où la survie était la principale mesure de la réussite ou de l’échec du traitement (Faure 1759). L’évaluation de la plupart des autres résultats, toutefois, est toujours subjective (comme pour les symptômes des patients), ou peut l’être. Les biais qui débouchent sur ces perceptions erronées sont appelés biais liés à l’observateur. Ils occasionnent un problème particulier lorsque des personnes croient qu’elles « connaissent » déjà l’effet du traitement, ou lorsqu’elles ont des raisons particulières de préférer l’un des traitements qui fait l’objet de la comparaison. Lorsque des mesures ne sont pas prises pour réduire les évaluations de résultats biaisées dans les comparaisons de traitements, les effets du traitement sont généralement surestimés (Schulz et al. 1995). Plus l’élément de subjectivité dans l’évaluation des résultats est important, plus il sera nécessaire de réduire ces biais liés à l’observateur afin d’assurer des essais fiables sur les traitements.
Dans ces circonstances courantes, il est souhaitable dans le cadre des essais contrôlés que les patients et les médecins procèdent à l’aveugle. L’évaluation en aveugle (masquée) la plus ancienne d’un traitement semble avoir été réalisée par une commission d’enquête nommée par Louis XVI en 1784 pour vérifier les allégations d’Anton Mesmer sur les effets du ‘magnétisme animal’ (Commission Royale 1784). La commission a été chargée d’évaluer si les effets prétendus de cette nouvelle méthode de guérison étaient dus à une force ‘réelle’ ou à des ‘illusions de l’esprit’. Des personnes portant un bandeau sur les yeux ont été informées qu’elles recevaient ou non du magnétisme alors qu’en fait c’était parfois l’inverse. Les personnes étudiées n’ont ressenti les effets du ‘magnétisme animal’ que lorsqu’on leur avait dit qu’elles recevaient ce traitement (Kaptchuk 1998 ; Schulz et al. 2002).
Utilisation de placebos pour procéder en aveugle
Quelques années après les tests sur les effets du magnétisme animal, John Haygarth a réalisé une expérience au moyen d’un faux dispositif (un placebo) pour obtenir un résultat en aveugle (Haygarth 1800). Le petit dessin qui accompagne ce paragraphe montre un médecin qui traite un client fortuné avec un instrument breveté et commercialisé par Elisha Perkins. Perkins prétendait que ses ‘ tracteurs ‘ – de petites tiges en métal – guérissaient toute une série de maladies grâce à la ‘force électrophysique’. Dans un pamphlet intitulé ‘Of the imagination as a cause and as a cure of disorders of the body: exemplified by fictitious tractors‘ (De l’imagination comme cause et remède aux désordres du corps: illustré par des tracteurs fictifs), John Haygarth explique comment il a soumis les allégations de Perkins à un essai contrôlé. Parmi une série de patients qui n’étaient pas informés des détails de son évaluation, il a eu recours à une étude croisée pour comparer les tracteurs métalliques brevetés (qui étaient censés opérer grâce à la « force electrophysique ») avec des « tracteurs » en bois qui semblaient identiques (‘tracteurs placebo’). Il lui a été impossible de détecter le moindre effet positif des tracteurs métalliques (Haygarth 1800).
Les essais contrôlés réalisés par John Haygarth sur les tracteurs de Perkins constituent un exemple ancien de l’utilisation de placebos afin de procéder en aveugle pour réduire les biais dans l’évaluation du résultat des traitements. Les placebos sont devenus un outil de recherche dans le cadre des débats sur l’homéopathie, l’autre grande méthode de soins non conventionnels du 19e siècle. Les homéopathes ont souvent utilisé des essais en aveugle et des contrôles par placebo pour des “démonstrations”, qui testaient les effets de leurs remèdes sur des volontaires en bonne santé (Löhner 1835 ; Kaptchuk 1998). L’un des essais les plus sophistiqués contrôlé par placebo s’est déroulé sous l’égide de l’Académie de médecine de Milwaukee en 1879-1880. Il s’agissait d’un essai en double aveugle au cours duquel ni les patients ni le personnel chargé de l’expérience ne savaient quels étaient les patients qui recevaient un véritable traitement homéopathique et quels étaient ceux qui recevaient un comprimé de sucre (Storke et al. 1880).
Ce n’est que beaucoup plus tard qu’une attitude plus sceptique au sein de la médecine traditionnelle a amené à reconnaître qu’il était nécessaire d’adopter des évaluations en aveugle et des placebos pour évaluer la validité de ses propres assertions. Inspirés principalement par des pharmacologues, les chercheurs allemands ont peu à peu adopté une évaluation masquée. Par exemple, en 1918, Adolf Bingel a indiqué qu’il s’était efforcé d’être “aussi objectif que possible” pour la comparaison de deux traitements différents contre la diphtérie Bingel 1918). Il s’est efforcé de déterminer si lui-même ou ses collègues pouvaient deviner quels patients avaient reçu quel traitement: “Je ne m’en suis pas tenu à mon seul jugement mais j’ai demandé l’avis des médecins adjoints du service de la diphtérie, sans les informer de la nature du sérum testé. Ainsi, leur jugement n’était teinté d’aucun préjugé. Je serais ravi de voir mes observations vérifiées sur une base indépendante et je recommande vivement cette méthode ‘en aveugle’ à cette fin “. (Bingel 1918). En fait, aucune différence n’a été détectée entre les deux traitements. Une solide tradition d’évaluation en aveugle s’est développée en Allemagne, et cela a été codifié par le pharmacologue clinique Paul Martini (Martini 1932).
Les évaluations en aveugle dans le monde anglophone moderne ont démarré alors que les pharmacologues étaient influencés par la tradition allemande, ainsi que par un mouvement autochtone de ‘chasse aux charlatans’ qui avait recours à des évaluations masquées (Kaptchuk 1998). Dans les années 30, ils étaient à la pointe de l’utilisation de contrôles par placebo dans le cadre des expériences cliniques. Par exemple, deux des premiers essais contrôlés du Medical Research Council du Royaume-Uni portaient sur des traitements pour le rhume. Il aurait été très difficile d’en interpréter les résultats si la technique ‘en double aveugle’ n’avait pas été utilisée pour éviter que les patients et les médecins sachent quels étaient les patients qui avaient reçu les nouveaux médicaments et lesquels avaient reçu des placebos (MRC 1944 ; MRC 1950). Les arguments rigoureux de Harry Gold sur l’importance des évaluations en aveugle semblent avoir eu une influence particulièrement considérable aux États-Unis (Conférence sur la Thérapie 1954).
Des observateurs en aveugle lorsqu’il est impossible de procéder avec les patients et les médecins en aveugle
Parfois il est tout simplement impossible de tenir les patients et les docteurs dans l’ignorance de l’identité des traitements comparés, par exemple, lorsque des traitements chirurgicaux sont comparés à des traitements médicamenteux ou à l’absence de traitement. Même dans ces circonstances, des mesures peuvent toutefois être prises afin de réduire les risques d’évaluation biaisée des résultats des traitements. Des observateurs indépendants peuvent être tenus dans l’ignorance des traitements qui sont administrés aux patients. Par exemple, au début des années 40, un test comparait les patients atteints de tuberculose pulmonaire recevant ce qui était alors le traitement habituel – l’alitement – avec d’autres patients à qui l’on administrait en outre des injections du médicament streptomycine. Les chercheurs ont estimé qu’il ne serait pas éthique d’injecter des placebos inactifs aux patients alités simplement pour que les essais soient menés en aveugle sous l’angle des patients et des médecins qui les traitaient (MRC 1948), mais ils ont pris d’autres précautions pour réduire le biais de l’évaluation des résultats. Bien qu’il y ait eu peu de risque d’évaluation biaisée du résultat principal (la survie), la subjectivité aurait pu biaisé l’évaluation des radios des poumons. C’est pourquoi ces radios ont été évaluées par des médecins qui ignoraient s’ils évaluaient le résultat chez un patient ayant reçu de la streptomycine ou chez un patient auquel seul l’alitement avait été prescrit.
De pair avec la randomisation, l’évaluation masquée, si possible avec des placebos, est aujourd’hui devenue l’une des composantes méthodologiques cruciales des essais contrôlés de traitements.