Одураченные случайностью — страница 28 из 41

― применить то, что называется парадоксом дня рождения, хотя считать настоящим парадоксом нельзя, ведь это просто причуда восприятия. Если Вы встречаете кого-то случайно, есть один шанс из 365,25, что Ваши с ним дни рождения совпадают, и значительно меньший шанс совпадения с ним года рождения. Итак, тот же самый день рождения был бы совпадением, которое Вы бы обсуждали за обеденным столом. Теперь посмотрим на ситуацию, в которой в комнате находятся 23 человека. Каковы шансы, что там окажутся два человека с одинаковым днем рождения? Приблизительно 50 %. Поскольку мы не определяем, у каких людей должны совпадать дни рождения, подходят любые пары.

Мир тесен!

Подобное неправильное представление о вероятности возникает в результате случайных столкновений, которые могут произойти с родственниками или друзьями в самых неожиданных местах. «Мир тесен» произносится часто и с удивлением. Но такие события не невероятны, хотя мир намного больше, чем мы думаем.

Только мы не проверяем шансы встретить определенного человека, в определенном месте и в определенное время. Скорее, мы просто прикидываем шансы любой встречи, с любым человеком, которого мы когда-либо встречали в прошлом, в любом месте, которое мы посетим в течение интересующего периода. Вероятность последнего значительно выше, возможно, в несколько тысяч раз.

Когда статистик смотрит на выборку данных , чтобы проверить заданное соотношение, скажем, разведать корреляцию между возникновением данного события, типа политического заявления, и волатильностью рынка акций, шансы таковы, что результаты можно принимать всерьез. Но когда в компьютер забрасывают данные в поисках любого соотношения, можно сказать с уверенностью, что проявится ложная связь, типа зависимость рынка акций от длины женских юбок. И точно так же, как совпадения дней рождений, это поразит людей.

Раскапывание данных, статистика и шарлатанство

Какова вероятность для Вас выиграть дважды в нью-джерсийской лотерее? Один шанс из 17 триллионов. И все же это случилось с Эвелин Адамс, кого читатель мог бы считать избранницей судьбы. Используя метод, который мы развивали выше, Перси Диаконис и Фредерик Мостеллер из Гарварда, оценили шансы как 30 к 1, что кто-либо где-нибудь полностью неоднозначным способом станет настолько удачливым!

Некоторые люди переносят свою деятельность по выкапыванию данных в богословие. В конце концов, в древнем Средиземноморье практиковалось чтение потенциальных сообщений по внутренностям птиц. Интересное расширение выкапывания данных на библейские толкования представлено в Коде Библии неким Майклом Дроснином. Дроснин, бывший журналист (по-видимому, не замешанный в любом обучении статистике), при содействии «математика» помог «предсказать» убийство премьер-министра Израиля Рабина, расшифровывая код Библии. Он информировал Рабина, который, очевидно, не принял предупреждение слишком серьезно. Код Библии находит статистические нерегулярности в Библии, что помогает предсказывать некоторые подобные события. Само собой разумеется, что книга имела хороший сбыт.

Лучшая книга, какую я когда-либо читал!

Мое любимое времяпрепровождение ― походы в книжные магазины, где я бесцельно двигаюсь от книги к книге, пытаясь принять решение, стоит ли тратить время на ее чтение. Мои покупки часто основаны на импульсах, базирующихся на поверхностных, но наводящих на размышления ключах. Часто лишь только суперобложка помогает мне принять решение. Ведь обычно она содержат похвалу кого-то, известного или не очень, или выдержки из книжного обзора. Хорошая похвала известного и уважаемого человека или известного журнала могла бы подвигнуть меня на покупку книги.

В чем проблема? Я имею тенденцию путать книжный обзор, который, как предполагается, является оценкой качества книги, с обзорами лучших книг, испорченными теми же самыми пристрастиями выживания. Я путаю распределение максимума переменной с распределением самой переменной. Издатель никогда не будет печатать на суперобложке что-либо, кроме лучших похвал. Некоторые авторы идут даже на шаг дальше, публикуя прохладный или даже неблагоприятный книжный обзор, но выбирая в нем слова, которые кажутся хвалебными для книги. Один такой пример ― некий Пауль Вилмотт ― английский финансовый математик, человек редкого блеска и непочтительности. Он объявил, что я дал ему «первый плохой обзор», и все же он использовал выдержки из этого обзора в качестве похвалы на суперобложке (позже мы стали друзьями, что позволило мне получить подтверждение и от него).

Первый раз меня одурачило такое пристрастие при покупках в возрасте 16 лет. Это была книга Манхэттэнское перемещение Джона Дос Пассеса, американского автора. Я основывался на похвале со суперобложки философа Жан-Поля Сартра, из которой следовало, что Дос Пассес считался самым ярким писателем нашего времени. Эта простая ремарка, которую выпаливают, возможно, в состоянии опьянения или чрезвычайного энтузиазма, вызвала потребность прочтения книги Дос Пассеса представителями европейских интеллектуальных кругов, поскольку ремарка Сартра была ошибочно принята за оценку качества работы Дос Пассеса, вместо того, чем она являлась на самом деле ― просто лучшей ремаркой. (Несмотря на получение Нобелевской премии по литературе, Дос Пассес так и остался в эабвении.)

Тестер исторических данных

Программист помог мне построить тестировщик исторических данных или бэктестер ―программу, связанную с базой данных исторических цен, которая позволяет мне проверять гипотетическую прошлую результативность любого правила для торговли средней сложности. Я могу просто применять механическое правило торговли, подобное покупке акции, если она закрывается более чем на 1,83 % выше ее средней цены предыдущей недели, и немедленно получаю отчет относительно прошлой результативности такого правила. Экран высветит мой гипотетический отчет о сделках, связанных с этим правилом торговли. Если мне не нравятся результаты, я могу изменять процент, выбрав, скажем, 1,2 %. Также я могу усложнить правило. Я буду продолжать пробовать, пока не найду устраивающий меня набор правил.

Что я делаю? Точно так же ищу оставшихся в живых в пределах набора правил, которые, возможно, могут работать. Я приспосабливаю правило к данным. Такая деятельность называется выискиванием данных. Чем больше я пробую, тем больше вероятность простой удачной находки правила, которое работало на прошлых данных. Случайный ряд всегда будет представлять некоторую обнаружимую модель. Я убежден, что существует торгуемая на Западе ценная бумага, которая на 100 % коррелированна с изменениями температуры в Улан-Баторе, столице Монголии.

Говоря техническим языком, есть даже худшие расширения. Так, из недавней выдающейся статье Салливана, Тиммермана и Уайта [30] следует, что правила, которые могут успешно использоваться сегодня, могут быть результатом пристрастия выживания.

Предположим, какое-то время инвесторы экспериментировали с чисто техническими правилами торговли, которые были собраны из тысячи параметризаций разнообразных типов правил. С течением времени правила, которые исторически подтвердили свою результативность, заслуживают большего внимания инвестиционного сообщества, в то время как неудачные правила торговли, более вероятно, будут забыты …. Если рассматривается достаточное число правил торговли в течение времени, то некоторые правила, благодаря чистой удаче, даже в очень большой выборке, дают превосходный результат, даже если совсем не обладают прогнозирующей властью над доходностью актива. Безусловно, вывод, основанный исключительно на подмножестве выживших правил торговли, может вводить в заблуждение в этом контексте, так как он не учитывает полный набор начальных правил торговли, большинство из которых вряд ли будет иметь меньшую результативность.

Я вынужден порицать некоторую чрезмерность в тестировании исторических данных, свидетелем которой я был. Есть превосходный продукт, предназначенный только для этого, называемый Omega TradeStation, который предлагается в настоящее время на рынке и используется десятками тысяч трейдеров. Он даже предлагает свой собственный компьютерный язык. Борясь с бессонницей, компьютеризированные трейдеры стали тестировщиками, пропахивающими массивы данных в поисках некоторых их свойств. Они бросают своих обезьянок на пишущие машинки, без того чтобы определить, что за книгу они хотят, чтобы писала их обезьянка, и жаждут натолкнуться где-нибудь на гипотетическое золото. Многие из них слепо верят в это.

Один из моих коллег, человек с престижными степенями, так уверовал в виртуальный мир, что дошел до потери всякого здравого смысла и ощущения реальности. Наблюдая за ним, я понял, что его естественный скептицизм, возможно, исчез под весом обработанных данных, хотя ранее он и был чрезвычайно скептичным, но в других областях. Ах, Юм!

Более тревожное расширение

Исторически так сложилось, что в медицине работали методом проб и ошибок, другими словами, накапливая статистику. К настоящему времени мы знаем о том, что могут быть полностью случайными связи между симптомами и лечением, а некоторые лекарства успешно проходят медицинские испытания в силу простой случайности. Я не могу претендовать на роль эксперта в лекарствах, но читал достаточно много медицинской литературы в течение прошедших пяти лет. Достаточно долго, чтобы беспокоиться о стандартах, как мы увидим в следующей главе. Медицинские исследователи редко бывают статистиками, а статистики ― медицинскими исследователями. Многие медики даже отдаленно не знают про это пристрастие. По правде, оно может играть несущественную роль, но оно, безусловно, существует. Одно недавнее медицинское исследование связывает курение сигарет с сокращением риска заболевания раком легких, таким образом конфликтуя со всеми предыдущими исследованиями. Логика подсказывает, что результат подозрителен и является простым совпадением.

Сезон отчетов: одураченные результатами