Сравнительные прогнозы
Взгляните на небо. Как вы считаете, пойдет ли дождь в течение ближайших двух часов?
Скорее всего, вам несложно было ответить на этот вопрос. Вывод, который вы сделали – например, «весьма вероятно, скоро пойдет дождь», – дался вам без труда. Достаточно посмотреть на облака, и их вид естественным образом трансформируется в оценку вероятности дождя.
То, что вы сейчас сделали, – элементарный пример сравнения. Мы описали оценочные суждения как процесс присвоения своему субъективному впечатлению (или одному из аспектов впечатления) определенного балла по определенной шкале. Сравнение – существенная часть этого процесса. Когда вы отвечаете на вопрос «Как бы вы оценили свое настроение по шкале от 1 до 10?» или «Пожалуйста, поставьте от одной до пяти звезд своим впечатлениям от сегодняшнего шопинга», вы занимаетесь сравнением: то есть решаете задачу по присвоению определенного балла по оценочной шкале в соответствии с вашим настроением или вашими впечатлениями.
Сравнение и когерентность
В предыдущей главе вы уже встречались с Биллом. Вспомним еще раз его характеристику: «Биллу тридцать три года. Он умен, однако лишен воображения, страдает навязчивыми идеями и вообще очень неэнергичный человек. В школе он хорошо успевал по математике, однако не проявлял способностей к общественным и гуманитарным наукам». Мы попросили вас прикинуть вероятность различных профессий и хобби для Билла. Как оказалось, при ответе на вопрос вы совершили подстановку – а именно заменили оценку вероятности оценкой похожести. Вместо того чтобы всерьез задаться вопросом «насколько вероятно, что Билл работает бухгалтером», вы начали размышлять, насколько он подходит под стереотип данной профессии. Сейчас мы вернемся к вопросу, который так и остался без ответа: как именно вы рассуждали в процессе вынесения суждения?
Нетрудно сообразить, насколько описание Билла соответствует стереотипам профессий и хобби. Он явно больше походит на бухгалтера, чем на типичного джазмена, а тем более на серфингиста. Пример иллюстрирует чрезвычайную универсальность процесса сравнения, что совершенно очевидно, когда нужно охарактеризовать человека. Можно задать неограниченное количество вопросов о Билле. Скажем, как насчет того, чтобы побродить с ним по пляжу на необитаемом острове? Скорее всего, вы готовы дать немедленный интуитивный ответ на основе той скудной информации, которую вам предоставили. Так вот, мы рады сообщить: Билл, представьте себе, оказался страстным любителем путешествий, причем с исключительными навыками выживания! Если вы удивлены (а скорее всего, это так), значит, вы только что потерпели неудачу в попытке достичь когерентности.
Удивление особенно велико, поскольку новая информация несовместима с образом Билла, который у вас сформировался ранее. Теперь представьте, что храбрость Билла и его навыки выживания включены в его первоначальную характеристику. Вы наверняка мысленно сконструировали бы совершенно другой образ – например, человека, который чувствует себя на своем месте только в условиях дикой природы. Общее впечатление от Билла становится менее когерентным, и вследствие того будет сложнее подобрать для него подходящую профессию и хобби, однако вы испытали бы намного меньший диссонанс.
Конфликтующие подсказки делают еще более сложным достижение когерентности и вынесение суждения, которое удовлетворило бы всем условиям. Наличие конфликтующих подсказок служит отличительным признаком комплексных суждений, в которых мы ожидаем много шума. Задача о Гамбарди, где имеются как положительные, так и отрицательные характеристики, – отличный тому пример. Мы вернемся к комплексным суждениям в главе 16. А в этой главе мы сосредоточим внимание на оценках относительно простых – главным образом тех, которые выставляются по шкале интенсивности.
Сравнение интенсивности
В ряде шкал для вынесения суждения мы пользуемся качественным выражением. Это относится к профессиям, хобби, врачебным диагнозам. В этих случаях отметки на шкале не упорядочены: красный не больше и не меньше синего.
Однако многие другие оценки выставляются по количественной шкале (или шкале интенсивности). Физические параметры, такие как размер, вес, яркость, температура и громкость, затраты и стоимость, вероятность и частотность, – все это количественные оценки. К ним относятся и более абстрактные шкалы, которые оценивают уверенность, энергичность, привлекательность, гнев, страх, аморальность, строгость наказания.
Общая особенность этих количественных параметров состоит в том, что при сравнении двух величин или понятий из одной категории можно ответить на вопрос «Какой из них больше?». Вы, например, знаете, что порка – более строгое наказание, чем шлепок по руке, или что вам больше нравится «Гамлет», чем «В ожидании Годо» – точно так же, как говорят, что Солнце ярче Луны, слон весит больше хомяка, а средняя температура в Майами выше, чем в Торонто.
Люди обладают поразительной интуитивной способностью сопоставлять интенсивность объектов даже из несравнимых категорий – путем наложения одной шкалы на другую166. Вы можете сопоставить интенсивность вашего впечатления от разных музыкантов с высотой зданий в вашем городе. (Если вы считаете, например, что Боб Дилан – самый выдающийся исполнитель, вы сопоставляете уровень вашего восхищения им с самым высоким зданием города.) Вы можете сопоставить текущий уровень политических разногласий в вашей стране с летней температурой в хорошо известном вам городе. (Невиданная политическая стабильность предстанет перед вами как летний день в Нью-Йорке, когда на улице чуть больше двадцати градусов и дует легкий бриз.) А если вас попросят выразить свои впечатления от ресторана, сравнив его с объемом романа вместо обычной пятибалльной шкалы, вы сочтете просьбу довольно экстравагантной, но не то чтобы неосуществимой. (И тогда ваш любимый ресторан может оказаться «Войной и миром».) Как ни странно, все поймут, что вы имеете в виду.
В обычном разговоре диапазон шкалы зависит от контекста. Высказывание «Она скопила кучу денег» имеет разные значения, если в одном случае вы чествуете успешного инвестиционного банкира, которая покидает свой пост, а в другом восхищаетесь девочкой-подростком, которая подрабатывает няней. Даже значение слов «большой» и «маленький» полностью зависит от системы отсчета. Можно, например, сделать осмысленным утверждение типа «Большая мышь пробежала по хоботу маленького слона».
Искажения в сравнительных прогнозах
Следующая загадка иллюстрирует как силу сравнения, так и систематические ошибки в оценках167, которые с ним связаны.
Джули учится в университете. Прочтите информацию о ней, а затем оцените ее средний балл (по стандартной шкале от 0,0 до 4,0):
Джули бегло читала в четыре года.
Какой у нее средний балл?
Если вы знакомы с системой образования в США, вы быстро выдадите число, которое, вероятнее всего, будет близким к 3,7 или 3,8. То, каким образом догадка насчет среднего балла Джули так быстро пришла вам в голову, как раз иллюстрирует процесс сравнения.
Для начала вы оценили, насколько развита была Джули в детстве. Вам это легко удалось, потому что она начала читать необыкновенно рано и по уровню своего развития сразу попала в соответствующую категорию на вашей шкале. Если вас попросят описать эту шкалу, вы, скорее всего, скажете, что высшая категория звучит примерно как «экстраординарные способности с раннего детства», заметив при этом, что Джули данной категории не вполне соответствует (некоторые дети умеют читать и в возрасте до двух лет). Судя по всему, Джули принадлежит к следующей категории детей – «блестящие, но не экстраординарные способности».
Второй ваш шаг – сопоставление значения среднего балла с оценкой, данной вами Джули. Не отдавая себе в том отчета, вы мысленно представили значение среднего балла, который также попадает в категорию «блестящие, но не экстраординарные способности». Сравнительный прогноз возник у вас в голове словно ниоткуда, едва вы узнали о Джули.
Осознанное выполнение расчетов, требуемое для оценки и сравнения, заняло бы некоторое время, однако в быстрой системе мышления (Системе 1) все произошло мгновенно и без усилий. Наша история об угадывании среднего балла Джули включает в себя сложную, многоступенчатую последовательность произведенных в уме операций, которые невозможно отследить напрямую. Для механизмов сопоставления в психологии нехарактерна конкретность – однако она проявляет себя с удивительной настойчивостью. После множества аналогичных опытов у нас не остается сомнений, что, если задать различным группам людей следующие два вопроса, они поставят в ответе одинаковые числа168:
▣ Какой процент сокурсников Джули научился читать в более раннем возрасте, чем она?
▣ Какой процент сокурсников Джули имеет более высокий средний балл, чем у нее?
Ответ на первый вопрос дается независимо: вам просто предлагают оценить определенный факт, который вы узнали о Джули. Второй вопрос, требующий прогнозирования, очевидно, более сложен – однако интуиция уговаривает вас ответить на него так же, как и на первый.
Два вопроса о Джули аналогичны двум другим в дискуссии об иллюзии достоверности, которые мы предлагали ранее в качестве универсального примера, способного ввести в заблуждение. Первый вопрос о Джули предлагает оценить «интенсивность» полученной вами информации. Второй вопрос требует определить «интенсивность» прогноза. И мы подозреваем, что вам по-прежнему сложно отличать одно от другого.
Интуитивное предсказание среднего балла Джули – пример психологического механизма, описанного в главе 13: подстановки или замены более сложного вопроса более простым. Ваша Система 1 упрощает сложную задачу прогнозирования, предлагая ответить на более простой вопрос: насколько выдающимися были навыки чтения Джули в возрасте четырех лет? Осталось сделать один дополнительный шаг – а именно сопоставление, – чтобы сразу переключиться с возраста, выраженного в годах, на успехи в учебе, выраженные в баллах.
Подстановка имеет место лишь тогда, когда доступная информация имеет отношение к вопросу. Знай вы о Джули, что она быстро бегала или посредственно танцевала, вам бы это ничего не дало. Зато любой факт, который можно интерпретировать как убедительное свидетельство ее умственных способностей, вероятнее всего, сгодится для подстановки.
Подстановка неизбежно вызывает ошибки, если истинные ответы на два вопроса неодинаковы. Подмена среднего балла возрастом, в котором девочка начала читать, хотя и выглядит убедительно, все же абсурдна. Подумайте о событиях, которые могли произойти с Джули после четырех лет: она попала в страшную аварию; родители пережили драматический развод; первый учитель был уникальным педагогом и сильно повлиял на нее; она забеременела… Любое из этих событий и множество других могли сказаться на ее успехах в колледже.
Сравнительное прогнозирование может быть оправдано лишь тогда, когда ранние навыки в чтении и средний балл в колледже идеально коррелируют – а это явно не так. С другой стороны, полностью проигнорировать информацию о ранних навыках в чтении также будет ошибкой, потому что этот факт содержит релевантные данные. Оптимальный прогноз лежит между двумя крайностями – полное знание и абсолютное незнание.
Что вы знаете о некоем конкретном случае, когда вам неизвестно о нем ничего определенного, кроме категории, к которой он относится? Здесь придет на помощь «взгляд со стороны». Если от нас требуют предсказать средний балл Джули, не предоставив о ней никакой информации, мы, само собой, назовем усредненное значение – примерно 3,2. Это и есть «взгляд со стороны». Более подходящая для Джули оценка, скорее всего, выше 3,2 и ниже 3,8. Точное значение зависит от предиктивной ценности информации: чем больше мы доверяем возрасту, в котором девочка научилась читать, как прогностическому фактору, тем выше оценка. В случае Джули информация крайне скудная, и наиболее разумный прогноз соответственно будет ближе к средней успеваемости студентов колледжа. Имеется формальный, но при этом довольно простой способ скорректировать ошибки в сравнительном прогнозировании; более детально мы рассмотрим его в Приложении 3.
Сопоставлению в уме исходных данных трудно сопротивляться, хотя оно и приводит к статистически абсурдным прогнозам. Менеджеры по продажам часто думают, что сотрудники, которые в прошедшем году работали более успешно, и далее будут в числе лидеров. Руководителям высшего ранга порой попадаются необыкновенно талантливые кандидаты, и тогда они полагают, что новые сотрудники займут ключевые должности в организации. Продюсеры, как правило, ожидают повторения успеха от режиссера, предыдущий фильм которого стал блокбастером.
Такие примеры сравнительного прогнозирования более чем вероятно приведут к разочарованию. С другой стороны, имея исходные данные в самом наихудшем варианте, мы дадим прогнозы, которые с большей степенью вероятности окажутся крайне негативными. Интуитивные предсказания, основанные на сравнении исходных данных – как оптимистичные, так и пессимистичные, – всегда слишком экстремальны. (Технический термин для таких ошибок – нерегрессивные, поскольку они отказываются принимать во внимание статистический феномен, называемый регрессией к среднему.)
Однако следует отметить, что подстановка и сравнение не всегда воздействуют на прогнозы. Если воспользоваться терминологией двух систем, интуитивная Система 1 быстро предлагает ассоциативное решение проблем по мере их возникновения, однако эти решения – прежде чем их приняли на веру – должна одобрить Система 2. Сравнительное прогнозирование порой отвергается в пользу более сложных правил. К примеру, люди с большей охотой делают прогнозы благоприятных событий, чем неблагоприятных. Мы полагаем, что вы затруднились бы спрогнозировать посредственные успехи Джули в колледже, научись она читать слишком поздно. А вот если вам доступно больше информации, асимметрия между благоприятными и неблагоприятными прогнозами исчезает.
Для коррекции интуитивных прогнозов всех видов предлагаем вам взглянуть на них со стороны. В дискуссии о перспективах Майкла Гамбарди мы рекомендовали привязать вашу оценку вероятности успехов Майкла к релевантной априорной вероятности (проценту назначенных на должность руководителей, которые в течение двух лет остаются на посту). В случае количественных прогнозов (средний балл Джули)«взгляд со стороны» рекомендует привязку к усредненному значению. «Взгляд со стороны» можно игнорировать только для очень простых задач, когда доступная информация позволяет дать прогноз с полной уверенностью. А вот в серьезных случаях «взгляд со стороны» может стать частью решения.
Шум в сравнительных прогнозах: пределы абсолютных оценок
Наша ограниченная способность распознавать категории на шкалах интенсивности приводит к неточности сравнений. Такими словами, как «большой» или «богатый», обозначаются одинаковые отметки на шкалах при измерении размеров или уровня дохода. Вот и потенциально важный источник шума.
Женщина, которая уходит на пенсию с поста инвестиционного банкира, уверенно заслуживает отметку «богатая», однако насколько она богата? В языке есть много слов: состоятельный, обеспеченный, зажиточный, небедный, супербогатый и так далее. Если вам предоставить подробные характеристики уровня доходов отдельных людей и попросить закрепить за каждой из этих характеристик свое определение, то сколько категорий вы создадите, не прибегая к детальным сравнениям между ними?
Количество категорий, которые мы можем распознать на шкале интенсивности, вынесено в заглавие классической статьи по психологии «Магическое число семь169 плюс-минус два», опубликованной в 1956 году. За пределами этого лимита люди начинают делать ошибки – например, присваивать параметру А более высокую категорию, чем параметру Б, в то время как при сравнении только А с Б оценивают Б выше.
Представьте себе четыре линии разной длины в диапазоне от двух до четырех дюймов, причем каждая линия длиннее следующей на одинаковый отрезок. Вам поочередно показывают линии, после чего вы должны присвоить им номера от 1 до 4: от самой короткой до самой длинной. Простое задание, не правда ли? А теперь представьте, что вам показывают пять линий разной длины и вы должны присвоить им номера от 1 до 5. Это по-прежнему просто. Когда вы начнете ошибаться? Когда количество линий достигнет магического числа семь! Удивительно, но это число мало зависит от диапазона, в котором находятся длины линий: если он составляет от двух до шести дюймов (вместо от двух до четырех), вы точно так же начнете ошибаться, когда количество линий превысит семь. То же самое происходит, если вам демонстрируют звуки различной громкости или вспышки света различной яркости. Вот истинный предел способности человека однозначно распределять по категориям размерные величины, и этот предел – около семи категорий.
Предел нашей разрешающей способности имеет большое значение, потому что умение сопоставлять параметры с категориями на шкале интенсивности не может превосходить наше умение присваивать значения этим параметрам. Процесс сопоставления является универсальным, хотя и довольно грубым инструментом быстрой Системы 1, а также ядром многих интуитивных оценок.
Магическое число не является абсолютным. Тренированный человек способен на более точное распределение по иерархическим группам. Например, мы можем отчетливо выделить несколько категорий среди мультимиллионеров по стоимости их активов, а судьи могут классифицировать преступления по степени тяжести в каждой из множества категорий, в свою очередь упорядоченных по серьезности. Тем не менее, чтобы этот процесс работал, категории должны заведомо существовать в четко определенных границах. В процессе присвоения линиям номеров в зависимости от длины вам не придет в голову разделить более длинные и более короткие на две различные категории. В режиме быстрого мышления процесс классификации сознательно не контролируется.
Есть способ преодолеть ограниченность разрешающей способности шкал: вместо абсолютных значений использовать сравнения. Мы намного лучше умеем сравнивать оценки, чем размещать их на шкале.
Как вы поступите, если вам потребуется дать оценку большому количеству ресторанов или певцов по двадцатибалльной шкале? Конечно, с пятибалльной шкалой работать проще, а обеспечить идеальную достоверность с двадцатибалльной невозможно. (Легко присвоить «Пиццерии Джо» три звезды, но как сделать выбор между одиннадцатью или двенадцатью?) Есть простое, хотя и отнимающее много времени решение. Для начала распределяем рестораны или певцов по пяти категориям, оценивая их по пятибалльной шкале. Затем ранжируем их внутри каждой категории, что обычно не должно составлять труда: вы прекрасно знаете, кого предпочтете: «Пиццерию Джо» или «Бургеры Фреда», Тейлор Свифт или Боба Дилана, хотя и определили их в одну категорию. Чтобы облегчить задачу, проще выделить четыре уровня внутри каждой категории. Теперь можно отсортировать по степени неприязни даже тех исполнителей, которых вы не любите.
Психология данного упражнения очевидна. Банальное сравнение между подлежащими оценке объектами способствует более точной классификации, чем присвоение рейтинга каждому объекту по отдельности. То же самое и с оценкой длины линий: ваша способность последовательно сравнивать их длины намного лучше, чем способность распределять по категориям; а если вам покажут две линии одновременно, точность будет еще выше.
Преимущество сравнительных оценок распространяется на многие области применения. Если у вас есть грубое представление о состоятельности разных людей, лучше сравнивать их в пределах одной категории, чем оценивать каждого в отдельности. Если вы проверяете школьные сочинения, более целесообразно разложить их по порядку от лучшего к худшему, чем читать и оценивать каждое. Сравнительные оценки более точны, чем категорические или абсолютные. Как показали вышеприведенные примеры, они также более трудоемки и требуют бо́льших затрат времени.
Оценка каждого объекта в отдельности по шкалам, однозначно принадлежащим к сравнительным, сохраняет некоторые преимущества сравнительных оценок. В некоторых ситуациях, особенно в образовании, в рекомендациях для кандидатов на зачисление или повышение в должности часто требуется поместить кандидата в «топ 5 процентов» или «топ 20 процентов» определенной группы, например «студентов вашего курса» или «программистов с одинаковым опытом работы». Эти рейтинги редко заслуживают того, чтобы принимать их всерьез, потому что бессмысленно ожидать корректного применения шкалы от того, кто дает характеристику. А вот в других ситуациях это небесполезно: когда менеджеры оценивают сотрудников или когда аналитики просчитывают инвестиции, кандидат, которого 90 % экспертов поместили в «топ 20 процентов», заслуживает особого внимания. Использование сравнительных оценок является одним из средств сокращения шумовых помех, которые мы обсудим в пятой части книги.
Многие задачи по вынесению оценок требуют сопоставления отдельных случаев с какой-либо категорией на шкале (например, семибалльной шкале согласия) или присвоения одной из расположенных по порядку характеристик (например, «маловероятно» или «крайне маловероятно» при оценке шансов наступления события). Этот тип сравнения изобилует шумом, поскольку является слишком грубым. Люди могут колебаться в выборе отметок на шкале, даже если они в принципе согласны с оценкой. Методика, которая вынуждает применять исключительно сравнительные оценки170, вероятнее всего, должна сократить шум. В следующей главе мы проанализируем более подробно, каким образом использование неподходящей шкалы может увеличить шум.
К разговору о сравнениях
«Мы оба оценили фильм как очень хороший, хотя вы, как мне кажется, получили от просмотра намного меньше удовольствия, чем я. Мы использовали одни и те же слова, а вот шкалы у нас, похоже, разные».
«Мы предполагали, что второй сезон сериала станет не менее захватывающим, чем первый. Вот вам и сравнительный прогноз! Он подвел нас!»
«Трудно оценить каждое сочинение само по себе. Не попробовать ли вам разложить сочинения по порядку от лучшего к худшему?»