истории

«Если ошиблись, не переживайте: вы в хорошей компании» Фрагмент книги Дэвида Роберта Граймса о паре задач на статистику с возмутительно неожиданными ответами

17:51, 8 мая 2021

Источник: Meduza

В этом году в издательстве Corpus при поддержке фонда «Траектория» выходит книга «Неразумная обезьяна: Почему мы верим в дезинформацию, теории заговора и пропаганду» Дэвида Роберта Граймса. В ней ирландский физик, публицист и колумнист The Guardian и The Irish Times весело, но дотошно препарирует свойственные человеку ментальные ловушки и рассказывает о самых типичных ошибках рассуждения — всех тех вещах, которые мешают нам делать правильные выводы из имеющейся информации. «Медуза» публикует фрагмент, посвященный статистике — даже относительно простые ее заключения могут вступать в самое резкое противоречие с тем, как склонен думать о мире наш мозг.

Писательница, журналист и драматург Мэрилин вос Савант — женщина с поразительно красноречивой фамилией — прославилась своим интеллектом; с 1986 по 1989 год, согласно книге рекордов Гиннесса, вос Савант удерживала титул человека с самым высоким в мире IQ. В конце концов эта категория рекордов была из книги изъята, поскольку стало ясно, что используемые для определения уровня интеллекта психометрические тесты абсолютно ненадежны, но никто и так никогда не сомневался в высоких умственных способностях вос Савант. Ее слава позволила ей вести еженедельную колонку в журнале Parade, где читатели предлагали ей решать логические задачи и отвечать на сложные вопросы. В 1990 году Крейг Уайтекер из Мэриленда задал Мэрилин следующий вопрос:

Предположим, что вы участвуете в телевизионной игре, по ходу которой вам предоставляется выбор — открыть одну из трех дверей. За одной дверью находится автомобиль, а за другими двумя — козы. Предположим, что вы выбрали дверь № 1, но ведущий, который знает, где стоит автомобиль, просит вас не спешить и открывает дверь № 3, за которой находится коза. Ведущий говорит вам: «Вы не хотите открыть дверь № 2?» Выгодно ли вам сменить выбранную дверь?

Этот странный вопрос был несколько видоизмененным заданием, которое получали участники телевизионного шоу Letʼs Make a Deal, когда ведущий Монти Холл ставил их перед подобным выбором — сменить решение или остаться при своем мнении. Действительно, если остаются две двери, то шансы угадать дверь с автомобилем составляют 50 на 50, и разве это важно — изменит свое мнение участник или нет? Но Савант дала иной ответ. Она ответила, что самая выгодная тактика — сменить дверь. Редакцию захлестнул поток яростных писем, авторы которых уличали Мэрилин в невежестве. Из более чем 10 тысяч писем приблизительно 1000 были написаны людьми с докторской степенью, в том числе математиками и другими учеными. В этих письмах Мэрилин сурово укоряли за пропаганду математического невежества.

Но вос Савант была права: смена двери после того, как ведущий открыл одну из них, действительно повышает шанс участника на выигрыш до ⅔; если же участник останется при своем первоначальном мнении, то шансы выиграть уменьшатся до ⅓. Дай себе критики вос Савант труд разобраться в вопросе глубже, они узнали бы, что эту «проблему Монти Холла» поставил и решил в 1975 году статистик Стив Селвин. Но каким образом может быть верным такой странный ответ? Представим себе, что автомобиль находится за дверью A. Если вы первоначально выбрали эту дверь, то Монти обнаружил бы козу за дверью B или C. Если вы измените свое решение, то проиграете. Но представим себе, что вы сначала выбрали дверь B: Монти откроет дверь C, и если вы измените свое решение, то выиграете. Точно так же, если вы выберете дверь C, то открыта будет дверь B, и изменение решения снова принесет вам выигрыш. То есть в двух третях случаев изменение стратегии становится выигрышным.

Выбор A

Выбор B

Выбор C

Автомобиль в A

Прежний выбор выигрывает

Изменение выигрывает

Автомобиль в B

Изменение выигрывает

Прежний выбор выигрывает

Изменение выигрывает

Автомобиль в C

Изменение выигрывает

Прежний выбор выигрывает

В представленной матрице выигрышей представлены все возможные случаи, и в двух третях их изменение первоначального выбора приводит к выигрышу. Это выглядит абсурдным, потому что интуитивно мы чувствуем, что изменение выбора не играет в вероятности выигрыша никакой роли. Если вы считаете результат озадачивающим, то не переживайте: вы оказались в хорошей компании. Как и авторы гневных писем в журнал Parade, известный математик Пал Эрдёш тоже долго сомневался в истинности решения вос Савант — до тех пор, пока его не убедила компьютерная имитация решения проблемы Холла. Сегодня проблема Монти Холла приводится как хрестоматийная в учебниках по теории вероятностей, но тем не менее, как мы видим, продолжает сбивать с толку в том числе и специалистов. Поразительно, но эксперименты с голубями показывают, что даже эти птицы быстро усваивают стратегию изменения выбора, находя ее оптимальной. Поведение птиц являет собой разительный контраст с поведением людей, по поводу чего экспериментаторы сухо отметили: «Повторение процедуры с участием людей показало, что люди не принимают оптимальной стратегии даже при интенсивном обучении».

Наша врожденная способность искать и находить закономерности во всем, с чем мы сталкиваемся, является одной из важнейших для выживания вида способностей. Стремление придать смысл окружающему нас миру и ненасытное любопытство привели нас к созданию цивилизации, великим открытиям и покорению физического мира. Но этот тонкий инстинкт может полностью отказать нам в помощи, когда в повседневной жизни мы сталкиваемся с шумными и хаотичными нагромождениями разнородных элементов. В мире неопределенностей теория вероятностей и статистика, если ими мудро пользоваться, позволяют, подобно острому лезвию, отсекать реальность от иллюзий. Случайные события можно понимать как вероятности, как область, фундаментально важную для всех видов деятельности, — начиная с планирования городов и квантовой механики и заканчивая медицинскими и экономическими исследованиями. Несмотря на использование статистики в таких сложных областях, зарождение этих методов имело место из‑за весьма приземленной мотивации, а именно — из‑за стремления выигрывать в азартные игры. Человечество увлекается ими тысячи лет, но вплоть до семнадцатого века капризы игры в кости считались выходящими за рамки человеческого понимания; неисповедимые пути удачи целиком зависели от воли богов. Сама идея о том, что исход можно предсказать с определенной степенью точности, казалась безумной и даже святотатственной.

Возможно, так бы оно все и осталось, если бы вопрос, заданный в 1664 году эксцентричным французским писателем шевалье де Мере, не заинтриговал величайших интеллектуалов Франции семнадцатого века — Блеза Паскаля и Пьера де Ферма. Паскаль в конечном счете разрешил проблему де Мере, доказав, что выпадение одной шестерки при четырех бросках одной кости немного более вероятно (51,77 процента), чем выпадение по крайней мере одной пары шестерок при 24 бросках двух костей (49,14 процента). Великие умы предреволюционной Франции тратили свои недюжинные способности на подсчет шансов обогащения, которого так жаждали завзятые игроки. Исследование игры в кости привело к рождению теории вероятностей, возникшей, таким образом, благодаря непритязательной салонной игре. Но, как мы уже видели, наше восприятие настроено на поиск закономерностей, а следовательно, мы склонны неверно трактовать стохастические, или случайные, события. По-настоящему случайные события не обладают «памятью» о предыдущих исходах, однако человеческая склонность к экстраполяции результатов наблюдений часто приводит нас к ошибочным выводам.

Возьмем для примера лотерею. Если она проводится честно, то выпадение чисел 1, 2, 3, 4, 5 и 6 настолько же вероятно, как и выпадение любой другой комбинации. Тем не менее интуитивно мы считаем такую последовательность маловероятной и избегаем ее. Точно так же, если при честном бросании монеты двадцать раз подряд выпадает решка, то мы надеемся, что уж на двадцать первый раз «точно» выпадет орел, несмотря на то, что вероятность все равно остается равной 50 процентам. Это убеждение называют ошибкой игрока, и она часто доводила людей до разорения. Но, слава всевышнему, мы не полностью отдаем себя на милость инстинкта — полезного, но порой и вводящего в заблуждение: человеческая любознательность за прошедшие века привела нас к созданию инструментов, позволяющих отличать шум от полезного сигнала.

В двадцать первом веке статистическая и вероятностная информация пропитала все поры общественной жизни — от маркетинга и медицины до результатов спортивных состязаний и прогнозов погоды. Статистика сохраняет свою привлекательность благодаря своей кажущейся интуитивности. Но этот флер простоты часто оказывается обманчивым, скрывающим тонкости, которые могут опровергнуть все наши выводы и расстроить наши планы. Непрозрачность статистики и широко распространенная математическая безграмотность позволяют многим несведущим людям неверно интерпретировать статистические тренды. Хуже того: эти же два обстоятельства предоставляют мошенникам и темным дельцам возможность манипулировать нами, используя статистику для подтверждения ложных аргументов. Подобные манипуляции вредят нам как сообществу, и циничное отношение к статистике вызывает у нас вполне объяснимую симпатию; недаром такой популярностью пользуется саркастическое замечание о трех степенях нечестности: «ложь, наглая ложь и статистика», которое приписывают множеству великих остроумцев — от Оскара Уайльда до Марка Твена.

Хотя этот цинизм понятен и объясним, все же отношение к статистике как к троянскому коню, внутри которого скрывается ложь, равносильно выплескиванию вместе с водой ребенка; статистик Фредерик Мостеллер заметил по этому поводу: «Конечно, очень легко лгать с помощью статистики, но еще легче лгать без нее». Это, несомненно, так — при правильном применении статистические инструменты трудно переоценить; статистика обнажает скрытые тренды, которые могут ускользать от внимания самых проницательных людей. Эта мощь статистических методов сделала их незаменимыми во всех сферах — от медицины до политики. Но если мы хотим получать пользу от статистики, то должны знать и о ловушках, в которые мы можем попасть при работе со статистическими данными. Особенно часто числовой информацией злоупотребляют в спорах. Нам стоит совершенствовать собственное понимание статистики, если мы не хотим пасть жертвами невежества или мошенничества.

Самое большое достижение статистики — это представление жизненных явлений в числовой, количественной форме (что, безусловно, является отличным подспорьем в нашем зыбком и неопределенном мире). Однако, к сожалению, в отсутствие адекватного контекста и понимания сути метода результаты статистических исследований могут дезориентировать и вводить в заблуждение. Для того чтобы проиллюстрировать любопытную природу статистики и вероятности, мы возьмем противоречащий интуиции пример, иллюстрирующий оба аспекта ошибок.

Представьте себе, что вы сдаете анализ на ВИЧ-инфекцию, который, как вам сказали, обладает точностью 99,99 процента. Результат анализа оказывается положительным. Какова вероятность того, что вы — носитель инфекции? Инстинкт подскажет большинству из нас, что мы почти наверняка больны, но это неверно. Правильный ответ: шанс, что у вас СПИД, равен в большинстве случаев 50 процентам. Если вас смущает этот вывод, то утешьтесь тем, что вы не одиноки. Большинство людей, в том числе профессиональные медики, приходит от такого странного утверждения в замешательство. Этот любопытный результат находит объяснение в теореме Байеса — математическом обосновании комбинации условных вероятностей. Теорема показывает, как ветвятся вероятности, и, в частности, сообщает нам, что вероятность заболевания ВИЧ при получении положительного результата анализа зависит не только от этого результата, но и от того, насколько в целом велика вероятность заболеть ВИЧ. Несмотря на то, что сам анализ почти совершенен, его точность зависит от другого условия, а именно — от априорной вероятности того, что у пациента вообще есть вирус. Мы не станем углубляться в формальное доказательство теоремы Байеса, так как это выходит за рамки настоящей книги и лишь напугает тех, кто незнаком с математическими символами. Однако логику теоремы понять легко, как легко и ее проиллюстрировать, несмотря на то, что истина прячется за парадоксально выглядящими статистическими выкладками.

Вернемся, однако, к нашему примеру. Каким образом тест с чувствительностью 99,99 процента может показать, что у человека с положительным результатом вероятность заболевания равна всего 50 процентам? Для человека из группы низкого риска вероятность заболеть СПИДом равна приблизительно 1:10 000. Теперь представьте себе, что 10 000 человек из этой группы низкого риска приходят сдавать анализ на ВИЧ. Один из них носитель ВИЧ, и результат его анализа практически наверняка окажется положительным. Но среди оставшихся, в связи с малой неточностью теста, один результат окажется ложноположительным. Таким образом, мы получим два положительных результата, лишь один из которых будет истинно положительным, — а это означает, что у пациента с положительным результатом вероятность заболевания равна именно 50 процентам.

Важно понимать, что такой удивительный результат не говорит о неадекватности самого анализа: в нашем примере тест отличается невероятной точностью. Главное заключается в том, что вследствие малой заболеваемости условная вероятность намного ниже той, какую мы ожидаем. На самом деле априорная вероятность того, что данный конкретный пациент инфицирован, неразрывно связана с достоверностью результата. Предположим, что тот же анализ делают людям из когорты высокого риска, например наркоманам, вводящим себе внутривенно героин. Частота инфицированности в этой группе равна приблизительно 1,5 процента. Снова представим себе, что анализ сдают 10 000 таких пациентов. В этой когорте у 150 человек тест окажется положительным ввиду истинной инфицированности. Из оставшихся 9 850 пациентов приблизительно у одного результат будет ложноположительным. Вероятность заражения при положительном результате в этой группе уже не равна 50/50 — в данном случае вероятность будет равна 150/151 или 99,34 процента, то есть намного больше, чем у пациента из когорты низкого риска.

Сценарии для случаев низкого и высокого риска можно для наглядности представить в виде частотного дерева, изображенного на рисунке. Разница между этими сценариями весьма велика, и на ней надо остановиться подробнее.

Мы имеем полное право спросить: зачем нужна такая стратификация? Почему в одной группе тест дает вероятность, разительно отличающуюся от вероятности в результате того же теста в другой группе? Инстинктивно мы чувствуем, что здесь что‑то не так, но мы ошибаемся: тест одинаков в обоих случаях, и его точность не может избирательно улучшаться или ухудшаться в зависимости от принадлежности пациента к той или иной группе. Реактивы не обладают ясновидением, и чувствительность теста остается равной 99,99 процента для любого пациента. Главное заключается в следующем: теорема Байеса показывает, что одной голой информации о результате недостаточно для правильного вывода — последний всегда зависит от других вероятностей. Вероятности часто оказываются условными, и голые численные данные, лишенные контекста, подлежат тщательному анализу.

Все это служит иллюстрацией того факта, что, несмотря на кажущуюся интуитивную природу вероятности и статистики, их мнимая простота скрывает многослойную сложность, которую легко упустить из виду. В итоге мы можем сделать абсолютно ошибочные выводы, а сомнительные выводы и неверная интерпретация статистических данных часто имеют катастрофические последствия. Рассуждения, приводящие к неверным заключениям, любопытны не только своей бессодержательностью с точки зрения науки или тем, что демонстрируют «математическую ловкость рук»: мы живем в эпоху, когда статистическая информация служит основой принятия решений во всех вообразимых сферах деятельности — от науки до политики, экономики и всего, что располагается между ними. Такое повсеместное проникновение статистики и вероятности в нашу действительность означает, что они часто причастны к вопросам жизни и смерти, будь то лечение болезней или работа правительства.

Следовательно, само наше существование может зависеть от вывода верных заключений из вероятностной информации. Если при этом люди — особенно те, кто должен разбираться в этих вопросах, — делают ошибки, то цена их может оказаться очень высокой. В первые месяцы кризиса, связанного со СПИДом, до изобретения антиретровирусных лекарств, положительный результат анализа на носительство ВИЧ считался равнозначным смертному приговору. Безоглядная вера в достоверность анализов на ВИЧ вызывала у многих врачей чувство ложной уверенности, и едва ли не всем пациентам говорили, что они наверняка больны, хотя это было неправдой. Немудрено, что многие впадали из‑за этого в депрессию или пускались во все тяжкие — из‑за ложноположительного результата, вероятность которого была достаточно высока!