Почему при проведении сравнений необходимо учитывать внутренние неопределенности

Различия между сравниваемыми людьми
Email to someoneTweet about this on TwitterShare on FacebookPin on PinterestShare on LinkedIn

Сравнение различных курсов лечения, назначаемых группам лиц

Сравнение лечения обычно предполагает сопоставление опыта группы лиц, которым были назначены различные курсы лечения.  Для того чтобы эти сопоставления были объективными, состав групп должен быть одинаковым – в результате похожее сопоставляется с похожим.  Если те, кому назначается один курс лечения, в любом случае обнаруживают бóльшую восприимчивости к тому, что они будут чувствовать себя хорошо (или плохо) по сравнению с теми, кому назначается альтернативный курс лечения, то эта ошибка в назначении не дает возможности утверждать, что полученные результаты отражают скорее разницу в последствиях лечения, нежели воздействие естественных факторов и прошедшего времени.

William CheseldenХирургу Уильяму Чеселдену, который жил в XVIII веке, была известна проблема “непохожих групп”, когда хирурги сопоставляли показатели смертности после проведенных ими операций по удалению камней из мочевого пузыря.  Чеселден отмечал, что в этом случае важно было принимать во внимание возраст людей, которые оперировались различными хирургами.  Он обратил внимание на тот факт, что показатели смертности варьировались в зависимости от возраста пациентов (Cheselden 1740) – вероятность смерти пациентов более старшего возраста была выше по сравнению с пациентами младшего возраста.  Это означало, что для сопоставления частотности случаев смерти в группах пациентов, которые подвергались различным видам операций, необходимо было принимать во внимание разницу в возрасте пациентов, которые входили в состав сравниваемых групп.

Метод сопоставления опыта и результатов лечения пациентов, которым приходилось назначать различные курсы лечения в прошлом, используется и сегодня в качестве одного из средств оценки последствий лечения.  Проблема в данном случае заключается в выяснении того, были ли сопоставимые группы достаточно похожими до прохождения данного курса лечения.  Это можно проиллюстрировать, попытавшись оценить воздействие гормонозаместительной терапии (ГЗТ) путем сопоставления истории болезни женщин, которые воспользовались ГЗТ, с историями болезни других женщин, которые ее не использовали.  Как показал последующий анализ тестов ГЗТ, попытка оценить воздействие лечения задним числом таким методом может зачастую приводить к опасным ошибкам (McPherson 2004).

В редких случаях можно быть полностью уверенным в том, что группы для сравнения, формируемые из лиц, которым в прошлом назначалось одно лечение, сопоставимы по всем аспектам, применимым в данном случае, с людьми, которые не так давно прошли альтернативный курс лечения.  Это справедливо и в том случае, даже если есть определенная информация о пациентах, которые проходили различные курсы лечения (например, их возраст или прошлая история болезни). Другой информации, которая может иметь большое значение (например, вероятность внезапного выздоровления), может просто не быть.

Treatise of the Scurvy Лучший подход заключается в планировании соответствующих методов лечения до начала лечения.  Например, прежде чем начинать сравнение шести курсов лечения цинги на борту корабля ВМС Великобритании “Солсбери” в 1747 г., Джеймс Линд все сделал для того, чтобы отобрать тех пациентов, которые находились на одинаковой стадии этой зачастую смертельной болезни.  Он также убедился в том, что у них был одинаковый рацион и режим питания и одинаковые условия размещения.  Это как раз были те факторы, помимо фактора лечения, которые, возможно, повлияли на вероятность их выздоровления (Lind 1753).  Для того чтобы убедиться, что группы, используемые для сравнения лечения, состоят из похожих лиц, необходимо провести такую же работу.

Объективное формирование групп, используемых для сравнения лечения, методом чередования или случайной выборки

Хотя Линд принял меры с целью обеспечить схожесть моряков в составе шести групп, использованных для сравнения, он, тем не менее, не указал, каким образом он определил моряков, которые подвергались одному из шести методов лечения. Для того чтобы убедиться в том, что группы, используемые для сравнения методов лечения, составлены таким образом, что они похожи во всех аспектах, известных и неизвестных, которые применимы в данном случае, существует только один способ.  Он состоит в использовании определенной формы случайного процесса формирования групп, используемых для сравнения методов лечения, что позволяет избежать субъективного выбора различных видов лечения до начала лечения.

van Helmont, JB (1662) Приблизительно через сто лет после Линда военный врач Грейм Балфур показал, как это можно сделать в ходе проверки профилактического действия белладонны на скарлатину у детей.  В военном приюте для сирот, который находился в его ведении, он использовал метод чередования – “в целях предотвращения искажения выборки” – для определения того, какие мальчики будут принимать белладонну и какие не будут (Balfour 1854).  Чередование является одним из нескольких лишенных субъективности методов формирования похожих групп, используемых для сравнения лечения, до проведения работы по такому сравнению.  В течение первой половины XX века было много примеров формирования групп, используемых для сравнения методов лечения, методом чередования или ротации (например, Hamilton 1816MCR 1944), или по жребию (Colebrook 1929) – например, с помощью игральной кости (Doull et al. 1931), цветных бусин (Theobald 1937) или произвольно выбранных чисел (Bell 1941MRC 1948MRC 1950MRC 1951).  Это “произвольное распределение” является единственным, но исключительно важным свойством категории объективных тестов, именуемых “произвольными”.  Произвольное распределение (в противовес бессистемному) означает, что вероятность наступления какого-либо события известна, однако результаты в любом конкретном случае прогнозированию не поддаются.  Так, например, если для произвольной выборки использовать монету, то вероятность того, что выпадет орел, составляет 50%, однако узнать результат конкретной жеребьевки предсказать невозможно.

Как показано в настоящем эссе (щелкнуть здесь мышкой), бросание или вытягивание жребия – это освященный веками способ принятия объективных решений.  Эти методы позволяют обеспечить формирование групп, используемых для сопоставления, таким образом, чтобы в их состав входили различные типы людей.  Известные и измеримые факторы, которые имеют значение в каждом случае, например возраст, можно проверить.  Однако неизмеримые факторы, которые могут воздействовать на выздоровление после болезни, например рацион и режим питания, работа или тревога, могут, как ожидается, подвинуть средний результат в ту или иную сторону.  Если вы хотите увидеть, каким образом метод произвольного распределения позволяет формировать похожие группы людей, щелкните здесь мышкой для показа .

BMJ По мере накопления опыта, связанного с использованием методов чередования и произвольного распределения для лишенного субъективности формирования групп пациентов в целях сравнения различных курсов лечения, получал все более широкое распространение, стало выясняться, что в целях исключения фактора субъективности при формировании групп, используемых для сравнения лечения, необходимо строго соблюдать схему распределения (MRC 1934).  Риск субъективного распределения можно устранить, если схему назначения курса лечения не доводить до сведения тех, кто принимает решения по поводу участия в сопоставлении курсов лечения, – иными словами, предотвратить возможность подтасовки фактов и таким образом внести ошибку в результаты сопоставления (MRC 1944MRC 1948MRC 1950MRC 1951).

Недопущение субъективного исключения лиц из состава групп, используемых для сравнения курсов лечения

При решении задач формирования групп, используемых для сравнения курсов лечения, таким образом, что это обеспечивает сравнение похожих вещей, важно предотвратить привнесение элемента субъективности в результате выборочного исключения пациентов из групп, используемых для сравнения.  По возможности, схожесть групп необходимо сохранить с целью обеспечить сохранение всех людей, включенных в группы, используемые для сравнения курсов лечения, и включить их в основной анализ результатов испытания – так называемый анализ “преднамеренного лечения” (Bell 1941).

Если это не будет сделано, то это может привести к необъективным тестам лечения.  Возьмем, например, два различных способа лечения людей, страдающих приступами головокружения по причине частичной закупорки кровеносных сосудов, питающих головной мозг.  Лечение этого состояния может иметь важное значение, поскольку люди, которые страдают приступами головокружения по этой причине, подвергаются повышенному риску инсульта, который может их сделать инвалидами или даже привести к смерти.  Один из методов лечения приступов головокружения заключается в приеме аспирина, который останавливает процесс дальнейшей закупорки;  второй метод включает хирургическую операцию с целью удалить место закупорки в кровеносном сосуде.

Объективное сопоставление этих двух подходов к лечению приступов головокружения предполагает создание двух групп людей с помощью лишенного субъективности метода отбора (например, методом произвольной выборки).  Сопоставление в этом случае следует начинать путем сравнения двух групп пациентов, которые похожи друг на друга, и продолжить сравнение соответствующих показателей частотности последующих инсультов.  Однако если частотность инсультов в группе людей, которые подвергались хирургической операции, была зарегистрирована только в случае пациентов, которые смогли успешно перенести прямые последствия операции, то в этом случае будет не учтен тот важный факт, что инсульт и смерть может быть вызвана самой операцией.  Это приведет к необъективному сопоставлению двух курсов лечения, что создаст субъективную и неоправданно оптимистичную картину, подтверждающую положительные последствия операции.  В этом случае сравниваются вещи, которые не похожи друг на друга.

References

Balfour TG (1854). Quoted in West C. Lectures on the Diseases of Infancy and Childhood. London, Longman, Brown, Green and Longmans, p 600.

Bell JA (1941). Pertussis prophylaxis with two doses of alum-precipitated vaccine. Public Health Reports 56:1535-1546.

Cheselden W (1740). The anatomy of the human body. 5th edition. London: William Bowyer.

Colebrook D (1929). Irradiation and health. Medical Research Council Special Report Series No.131.

Doull JA, Hardy M, Clark JH, Herman NB (1931). The effect of irradiation with ultra-violet light on the frequency of attacks of upper respiratory disease (common colds). American Journal of Hygiene 13:460-77.

Hamilton AL (1816). Dissertatio Medica Inauguralis De Synocho Castrensi (Inaugural medical dissertation on camp fever). Edinburgh: J Ballantyne.

Lind J (1753). A treatise of the scurvy. In three parts. Containing an inquiry into the nature, causes and cure, of that disease. Together with a critical and chronological view of what has been published on the subject. Edinburgh: Printed by Sands, Murray and Cochran for A Kincaid and A Donaldson.

McPherson K (2004). Where are we now with hormone replacement therapy? BMJ 328:357-358.

Medical Research Council Therapeutic Trials Committee (1934). The serum treatment of lobar pneumonia. BMJ 1:241-245.

Medical Research Council (1944). Clinical trial of patulin in the common cold. Lancet 2:373-5.

Medical Research Council (1948). Streptomycin treatment of pulmonary tuberculosis: a Medical Research Council investigation. BMJ 2:769-782.

Medical Research Council (1950). Clinical trials of antihistaminic drugs in the prevention and treatment of the common cold. BMJ 2:425-431.

Medical Research Council (1951). The prevention of whooping-cough by vaccination. BMJ 1:1463-1471

Parry CH (1786). Experiments relative to the medical effects of Turkey Rhubarb, and of the English Rhubarbs, No. I and No. II made on patients of the Pauper Charity. Letters and Papers of the Bath Society III:407-422.

Silverman WA, Chalmers I. Casting and drawing lots. The James Lind Library (www.jameslindlibrary.org).

Theobald GW (1937). Effect of calcium and vitamin A and D on incidence of pregnancy toxaemia. Lancet 2:1397-1399.