Кстати, если верить статье, опубликованной на сайте The Telegraph в воскресенье, 21 февраля 2016 г., то женщины все же водят лучше мужчин, по крайней мере в Великобритании. Там говорится, что «женщины превзошли мужчин не только на тестах по вождению, но и по итогам анонимного наблюдения, проведенного в одном из самых загруженных участков Лондона – Гайд-парк-корнер».
А вот пример игры с данными в графических презентациях. Предположим, цена акций некой компании поднялась за период с января 2015 г. по январь 2016 г. с $27 до $28. В нашу эпоху господства компьютеров люди любят демонстрировать такие явления на графиках и презентациях. И как сделать это хорошо? Это зависит от вашей аудитории.
Если презентация делается для налоговой компании, рекомендованным будет первый же график, представленный ниже.
Как видите, здесь все не так радужно. График скорее похож на пульс покойника. Он может разбить сердце даже самых закаленных агентов Налогового управления.
Если бы ту же информацию требовалось представить руководству компании, я бы слегка изменил график и сделал его вот таким.
Видите, какая стрела? Она показывает не только то, что цена акций взлетела до небес, но и то, что эта цена продолжает подниматься!
Эти две презентации различаются шкалой – той измерительной линейкой, которую мы выбираем. Толика воображения и усилий – и все можно представить наилучшим образом для нас.
Как-то в телерекламе я увидел вот такую графическую презентацию: она представляла «уровень довольства» клиентов – то, насколько те удовлетворены работой трех обслуживающих компаний. Само собой, компания, которая спонсировала рекламный ролик, получила высшую оценку – 7,5 из 10, в то время как ее конкуренты – 7,3 и 7,2 соответственно. На графике не показали, сколько клиентов составили выборку, и мы не можем узнать, реальна ли разница между тремя компаниями.
Колонки создают впечатление того, что спонсор ролика на голову превосходит конкурентов. Интересно, кто-нибудь раскусил это?
Бенджамин Дизраэли (1804–1881), вероятно, был прав, когда сказал, что есть три вида лжи: ложь, гнусная ложь и статистика. Впрочем, если по правде, то эта история, скорее всего, тоже ложь. Эту ремарку приписывал британскому премьер-министру Марк Твен (1835–1910), но никто и никогда не слышал того, чтобы Дизраэли произносил это знаменитое высказывание, и ни в одном из его сочинений такой фразы не нашли.
В 1973 г. исследователи, решившие изучить жалобы на гендерные предрассудки в Калифорнийском университете в Беркли, выяснили, что, после того как примерно 8000 мужчин и 4000 женщин подали документы в аспирантуру, доля мужчин, которых туда принимали, оказалась намного выше доли женщин. На университет подали в суд за предвзятость. Но была ли здесь дискриминация женщин на самом деле? Исследователи проверили данные приемных комиссий по отдельным факультетам и выяснили вот что: если и была причина для обращения в суд, то по поводу совершенно иной дискриминации! Все факультеты отдавали предпочтение женщинам – и, если судить в процентном отношении, принимали их чаще, чем мужчин.
Если вам не знакома статистика (или законы исчисления дробей), это может показаться невозможным. Если бы все факультеты проявили предвзятость и оказывали благосклонность женщинам, тогда и весь университет проявил бы такие же гендерные предрассудки – а все обстояло совершенно иначе.
Английский статистик Эдвард Симпсон (1922–2019) описал этот феномен в своей статье, вышедшей в 1951 г. и озаглавленной «Интерпретация взаимодействия в таблицах сопряженности»[22]. Сегодня мы называем это явление парадоксом Симпсона, или эффектом Юла – Симпсона (Удни Юл, статистик из Великобритании, уже упоминал о похожем эффекте в 1901 г.). Я объясню это без практических данных Беркли – с помощью простой гипотетической версии.
Предположим, у нас есть университет, в котором только два факультета – математический и юридический. Пусть 100 женщин и 100 мужчин подают документы на факультет математики, куда проходят 60 женщин (или 60 %) и 58 мужчин (58 %). Кажется, на математическом женщины в фаворе. На юридический подают документы 100 женщин, совершенно других, из них проходят 40 (40 %); что же касается мужчин, то юриспруденцию хотят изучать всего трое, а проходит только один. Один из трех – это меньше чем 40 %, и создается впечатление, что оба факультета предпочитают брать к себе женщин. Но если мы посмотрим на общие цифры по университету, то окажется, что из 200 женщин, подавших документы, принято 100, то есть 50 %, а из 103 мужчин, подавших документы, принято 59, то есть больше 50 %.
И как все это объяснить?
Вместо того чтобы переходить к техническим сложностям, позвольте привести интуитивно понятное объяснение. На основании имеющихся данных видно, что юридический факультет относится к поступающим намного суровее. И когда много женщин (100) подают документы на юридический факультет, отношение поступивших к общему числу, выраженное как 60 %, становится гораздо менее ценным. Поскольку равное количество женщин подает документы на каждый факультет, общее процентное отношение женщин, принятых в университет, к женщинам, подавшим документы, – это среднее арифметическое от 60 и 40, то есть 50. Но по причине того, что все знают, сколь суров и жесток юридический факультет, документы туда подают только трое мужчин, а поступает только один (и ничего бы не изменилось, если бы не поступил никто) – и это почти никак не влияет на процентное соотношение мужчин, принятых на математический факультет, к мужчинам, подавшим туда документы.
Вывод: да, оба факультета отдавали предпочтение женщинам. Но именно потому, что на юридический факультет, где процент зачисленных ниже, пытались поступить в большинстве своем женщины, а мужчины почти не шли, при объединении процентных соотношений доля мужчин действительно оказывается больше.
Сказать по правде, парадокс Симпсона сообщает нам кое-что очень простое о законах дробей. Приведенные ниже строки – это не более чем та же самая история, только в виде дробей:
60/100 > 58/100
и также
40/100 > 1/3,
но
(60 + 40) / (100 + 100) < (58 + 1) / (100 + 3)
Один мудрый человек как-то сказал, что статистика напоминает ему женщин в бикини: все, что открыто, очень мило и греет душу, но самое важное остается скрытым.
Примеров масса. Можно представить двух баскетболистов, Стефа и Майка. Пусть Стеф, по статистике, два года подряд делает больше точных бросков, чем Майк (в процентном отношении ко всем совершенным броскам), но общая статистика за два года все равно показывает, что Майк превосходит Стефа в меткости. Взгляните на таблицу.
Я сделал этот пример очень похожим на предыдущий: так ясна суть самого явления. Согласно таблице, в процентном отношении Стеф делал больше точных бросков и в 2000 г., и в 2001-м, но, если взять данные в общем за два года, окажется, что в меткости Майк его превосходит.
Можно еще представить двух консультантов по инвестициям, один из которых превосходит другого (в процентном отношении доходных портфолио) в первом полугодии, да и во втором полугодии, если взглянуть на процентное отношение, его результаты тоже лучше; но стоит подсчитать процентное отношение выгодных портфолио за весь год – и окажется, что оно выше у другого.
Когда я впервые узнал об этом парадоксе, мне привели в пример две больницы вот с такими данными. Было известно, что мужчины чаще предпочитали проходить осмотр в больнице А и избегать больницы Б, поскольку показатели мужской смертности в больнице А были ниже. Да и женщины, поступавшие в больницу А, тоже жили дольше, нежели в больнице Б. Но, как только сравнили данные в общем по мужчинам и женщинам, оказалось, что в больнице Б показатели смертности меньше, чем в больнице А. С радостью приглашаю моих умных читателей вписать числа в таблицу, представленную ниже, и посмотреть, как все это работает.
Одна из проблем интерпретации численного анализа – это тот факт, что мы склонны думать о процентах как об абсолютных величинах. Например, мы чувствуем, что 80 % больше, чем 1 %. И тем не менее, если бы кто-нибудь предложил нам выбрать 80 % акций крошечной компании или 1 % акций такого гиганта, как Microsoft, мы бы очень скоро поняли, что процентные выражения – это не то же самое, что доллары.
Что мы пытаемся сказать такой фразой: «Он смазал стопроцентный выстрел!»?
В чем смысл слов: «Этот препарат на 17 % снижает вероятность сердечного приступа у 30 % курильщиков»?
Как выгоднее приобретать товары: со скидкой 25 % или со скидкой 50 % за каждый второй купленный товар? Почему?
Там, где дело касается процентных отношений, решение нужно принимать очень осторожно.
Примеры процентных отношений могут довести нас очень далеко – и даже до фондовой биржи. Когда мы слышим, что та или иная акция возросла на 10 % или упала на 10 %, нельзя считать, что цена акции вернулась туда же, где и была вначале. Если наша акция стоила $100 и возросла на 10 %, то теперь она стоит $110. Если на этом этапе она падает на 10 %, то на самом деле она начинает стоить на $11 меньше, то есть $99 (что любопытно, то же самое получится, если акция сперва упадет в цене на 10 %, а потом на них же возрастет). Этот разрыв будет еще ярче, если та же акция сперва возрастет, а потом упадет на 50 % (тогда она будет стоить $150 и $75), а драматическая кульминация – это возрастание и падение на 100 %. В последнем сценарии цена акции сперва удвоится, а потом перестанет существовать.
Многие не понимают, что если их акция возросла в цене на 90 %, а потом упала на 50 %, то они на самом деле потеряли в деньгах. В это сложно поверить? Давайте разберемся. Представьте, что ваша акция стоит $100 и потом возрастает на 90 %: теперь она стоит $190, так? Потом она падает в цене на 50 %, то есть теперь она стоит только $95. Если финансовый менеджер расхваливает рекомендованную им акцию, рассказывая о том, что она поднялась в цене на 90 %, а потеряла всего 50 %, многие могут решить, что за год приобрели выгоду 40 %. Никто и никогда не верит в то, что может проиграть.