Глава 2. О чем может рассказать коэффициент умственного развития
Что же такое тесты IQ и откуда они взялись? Трудно вести интеллектуальный разговор о тестировании интеллекта, не зная ответы на эти вопросы. Для начала остановимся на двух историях, связанных с исследованием умственных способностей.
Френсис Гальтон: кто сильнее сожмет рукой динамометр
Безусловно, одной из наиболее влиятельных книг всех времен является труд Чарльза Дарвина «Происхождение видов» (1859). В его основе лежит идея о том, что эволюцию видов и происхождение человека можно объяснить на основе процессов естественного отбора. Книга стимулировала развитие многих научных направлений, одно из которых связано с изучением человеческого разума и его развития. В конечном итоге теория Дарвина базируется на предположении о том, что все способности человека в определенном смысле являются непрерывным продолжением способностей низших животных. Что же тогда объединяет интеллект низших животных с интеллектом людей?
Двоюродный брат Дарвина сэр Френсис Гальтон, пожалуй, первым использовал идеи своего кузена при изучении интеллекта человека. Гальтон предположил, что людей, как более разумных особей, отличает от их менее разумных собратьев два основных качества. Во-первых, энергия, или работоспособность. Согласно гипотезе Гальтона, интеллектуально развитые люди в самых различных областях деятельности выделяются поразительным запасом энергии. Вторым качеством является чувствительность. Гальтон считал, что чем умнее человек, тем чувствительнее он к различным стимулам. Все это может показаться вполне научным, но первые дерзкие опыты Гальтона в области исследования интеллекта отличает то же смешение научных подходов и предубеждений, которое успешно процветает и в наши дни. Например:
У идиотов поразительно низкие способности различать внешние факторы; они едва отличают тепло от холода, а чувство боли у них настолько приглушено, что многие из них, кажется, с трудом представляют, что это такое. В их беспросветной жизни боль вполне может быть воспринята как приятный сюрприз[6].
В течение семи лет – с 1884 по 1890 год – Гальтон возглавлял отдел в Южно-Кенсингтонском музее Лондона, где желающие за небольшую плату могли протестировать свой интеллект. Единственная проблема заключалась в том, что применявшиеся там тесты представляли собой, мягко говоря, занятную смесь, которая позволяла оценивать все что угодно, но только не интеллект в его подлинном смысле. Например, Гальтон изобрел свисток, с помощью которого определялась максимальная воспринимаемая человеком высота звука. Отличный тест на чувствительность слуха, но причем здесь интеллект? С таких позиций кот или другая подобная тварь может быть признана куда более умной, чем любой из нас!
В другом тесте использовалось несколько коробок с револьверными патронами, набитыми дробью, шерстью или ватой. Вид у коробок был идентичен, и отличались они только весом. Суть теста заключалось в том, чтобы отличить более легкие коробки от более тяжелых. Тест на чувствительность к весу? Может быть. Тест на интеллект? Едва ли. Подобное утверждение относится и к тесту на чувствительность к запаху роз. Какие выводы делать в этом случае по отношению к испытуемым с насморком или аллергией на розы?
Должно быть, вы решили, что Лондон потешался над идеями Гальтона. Совсем наоборот. Будь он всеобщим посмешищем, разве стал бы сэром Френсисом? Люди воспринимали его очень серьезно, и, насколько нам известно, служба тестирования принесла ему немалые прибыли. Причем речь идет не только о посетителях музея, которые хотели получить научно обоснованную оценку своих способностей. На знаменитого психолога Джеймса Маккина Кэттела идеи Гальтона произвели столь сильное впечатление, что он начал распространять их в Соединенных Штатах.
Кэттел изобрел свой собственный тест (1890), в основе которого лежали те же принципы, что и у Гальтона. Так, например, в тесте с динамометром необходимо было сжимать его изо всех сил, а показания прибора использовались затем при вынесении заключения об интеллекте. В другом тесте определялось, при каком давлении человек начинает испытывать боль. Пожалуй, единственный раз в жизни восприимчивость к боли оказалась преимуществом – она позволяла получить более высокую оценку интеллекта!
Как вы можете предположить, со всеми этими измерениями была одна проблема. Они ни о чем не говорили. Первым забил тревогу студент Кэттела по фамилии Уисслер. Он обнаружил, что результаты тестов его учителя никак не связаны ни друг с другом, ни с оценками испытуемых студентов, которые они получали в своем Колумбийском университете. Проведенный Уисслером анализ нельзя признать образцом научного исследования, но он позволил убедить современников, что тесты Кэттела являются своего рода миной.
К сожалению, эта мина оказалась миной замедленного действия. Как говорил еще Сантаяна, кто не учится на чужих ошибках, обречен повторять их сам. Сегодня легионы неогальтонианцев возродили работы Гальтона и Кэттела, по существу воскресив полчища мертвецов. Снова используются такие показатели, как время реакции (с какой скоростью вы нажимаете кнопку, увидев световой сигнал) и время идентификации линии (с какой скоростью вам удается определить, какая из двух линий длиннее). Там, где речь идет об интеллекте, развенчание вздорной идеи еще не значит, что эта идея похоронена навсегда. Она может вернуться и принести немало бед.
Порожденные эволюционной теорией Дарвина, идеи Гальтона с точки зрения этой теории были не лишены определенного смысла. Дикие животные с недоразвитыми чувствами, как правило, не выживали. С другой стороны, преимущества получали те животные, которых отличала необычная острота чувств. Возможно, много лет назад наши предки, обладая более развитыми чувствами, имели бы с точки зрения эволюционного отбора главные козыри. Но часто то, что дает определенное преимущество, в другое время не имеет особого значения. Например, моль со светлой и моль с темной окраской оказываются в условиях города как в выгодном, так и в невыгодном положении в зависимости от уровня загрязнения воздуха. Темная моль с дымчатой окраской менее заметна при сильных загрязнениях, тогда как светлая моль при таких обстоятельствах более уязвима. При меньших выбросах в атмосферу относительные плюсы и минусы меняются местами. В наше время обостренные чувства уже не являются тем важным фактором, который обеспечивает преимущества с точки зрения продолжения рода или выживания вообще. Некоторые теории являются пророческими: они появились раньше своего времени. Теория Гальтона, напротив, опоздала на многие тысячелетия.
Альфред Бине: выявление способностей к обучению
В 1904 году министр народного образования в Париже создал комиссию для выработки методов отличия действительно умственно «дефективных» детей от тех, кто не успевал в школе по другим причинам. Какая задача ставилась перед комиссией? Гарантировать то, что дети будут переводиться в классы для умственно отсталых только в тех случаях, когда они «практически не способны чему-либо научиться в обычных школах»[7]. Для решения этой задачи Альфред Бине и его коллега Теодор Симон разработали соответствующую систему тестов.
Отметим, что в основе деятельности Бине лежало желание помочь детям и защитить их, а вовсе не ущемлять их интересы. Если в школе учились несколько человек, которые являлись для учителей сплошной головной болью, то у последних был очень удобный выход из ситуации: перевести таких учеников в классы для умственно отсталых. Никто не утверждал, что учителя были отъявленными мерзавцами, которые стремились просто облегчить себе жизнь, хотя, без сомнения, подобные мысли иногда их искушали. Проблема состояла в том, что нельзя было провести четкого различия между детьми с проблемами в поведении и умственно отсталыми детьми. В результате и к тем, и к другим относились одинаково.
Предложенные Бине и Симоном концепция интеллекта и методы его измерения несколько отличались от подходов Гальтона и Кэттела. Характеризуя тесты других авторов как «потерянное время», Бине и Симон определяли суть интеллекта как рассудительность, называемую также здравым смыслом. «Практическая сметка, инициатива, способность адаптироваться к различным обстоятельствам, умение оценивать, понимать суть и рассуждать – вот ключевые аспекты интеллекта»[8].
Согласитесь, в определениях Бине гораздо больше смысла, чем в подходах Гальтона. Бине приводил пример Хелен Келлер. Результаты ее тестов на визуальную и слуховую чувствительность были просто плачевными, хотя нельзя было усомниться в высоком уровне интеллекта женщины – многие признавали ее умственные способности выдающимися. Бине разработал тесты, которые могли успешно проходить и люди с физическими недостатками. Для Бине интеллект определялся способностью рассуждать, а не остротой чувств.
Многие знают Бине только по его тестам, но он является и автором теории интеллекта, причем хорошей теории. Бине полагал, что разумную мысль отличают три характерных элемента, которые он назвал «направление», «адаптация» и «критицизм». Под направлением понимается знание того, что и как делать. Адаптация касается выработки конкретной стратегии выполнения задачи, следования этой стратегии и адаптации ее в процессе реализации. Критицизм заключается в способности критиковать свои мысли и действия. Скажем, вы хотите купить новый автомобиль. Направление позволяет понять, что нужно узнать об автомобилях и как использовать эту информацию при осуществлении своего выбора. Адаптация вступает в игру, когда предпринимаются конкретные действия, принимаются решения и корректируется по ходу действий стратегия (например, вы решаете, что вполне можно отказаться от телевизора для пассажиров на заднем сидении, которые могут смотреть его, пока вы ведете машину). Критицизм будет использоваться при оценке процесса принятия решения и используемых стратегий выбора марки автомобиля или места его покупки.
Подобно тестам Гальтона, идеи Бине были импортированы в Соединенные Штаты, но на этот раз сразу в Калифорнию, а не в Нью-Йорк. Основываясь на теории и тестах Бине, профессор психологии Стэнфордского университета Льюис Терман разработал американизированный вариант тестов. Достоинства этих разработок оценивало уже время. Система Стэнфорд-Бине до сих пор сохраняет свою конкурентоспособность в бизнесе тестирования интеллекта.
Идеи Бине имели смысл в том контексте, для которого они собственно и предлагались: прогнозирование успехов обучения. К сожалению, как и в многочисленных случаях с другими удачными идеями, они начали использоваться далеко за пределами областей своего оптимального приложения. Тесты для выявления академических способностей стали применяться и в неакадемических сферах. Более того, эти тесты имели и все еще имеют ограничения, которые заставляют усомниться в результатах их использования даже в сугубо образовательном контексте.
Тесты, основанные на теории Бине
Какие же вопросы включают в тесты для определения IQ? Многие из нас слышали о таких тестах, тестировались в свое время раз или два, но едва ли вспомнят конкретное содержание вопросов. В действительности слишком многие любят порассуждать об IQ-тестах, имея смутное понятие об их достоинствах и недостатках. Масса пустых слов отражает часто политические или социальные убеждения, а не объективные факты. Нет ничего плохого в том, что человек привносит в подобные тесты свои политические и социальные пристрастия – я и сам так поступаю. Но сначала необходимо разобраться с тестами, увидеть их сильные и слабые стороны. Так что позвольте мне остановиться на некоторых деталях одного из двух наиболее распространенных тестов, шкале Стэнфорд-Бине, которую можно считать развитием оригинальных разработок Альфреда Бине.
Четвертое издание книги «Шкала интеллекта Стэнфорд-Бине» (Stanford-Binet Intelligence Scale, Forth Edition, SB IV) является последним из серии изданий, первое из которых появилось на свет в 1905 году[9]. Первая ревизия (т. е. второе издание) шкалы Стэнфорд-Бине датируется 1939 годом, а третье издание было выпущено в 1960 году. Тестироваться могут дети в возрасте от двух лет; верхний возрастной предел не устанавливается, хотя реальные испытания тестов (называемые стандартизацией) проводились для молодых людей не старше двадцати трех лет.
В чем достоинства этого теста? Что из себя представляет система Стэнфорд-Бине? Она включает пятнадцать субтестов, но только шесть из них могут использоваться для всех возрастных групп тестируемых. Субтесты разбиваются на четыре категории: вербальное мышление, количественное мышление, фигуральное/абстрактное мышление и краткосрочная память. Рассмотрим некоторые примеры пятнадцати субтестов.
1.-Словарные тесты. Испытуемым предлагается сформулировать значение слов. На низших уровнях слова представляются в виде картинок. Позже они предлагаются в напечатанном варианте. Например, может быть задан вопрос, что означает слово «претенциозный». Словарные тесты предлагаются испытуемым из всех возрастных групп. Вопросы на знание словаря присутствуют во многих тестах проверки интеллекта и других аналогичных испытаниях, например «тестах проверки способностей к обучению». Анализ подобных элементов тестирования позволяет понять сомнения некоторых психологов и педагогов по поводу того, что эти упражнения причисляют к тестам интеллектуальности.
Прежде всего необходимо понять, что укоренившееся представление о принципиальном различии тестов проверки интеллекта, с одной стороны, и тестов оценки достижений, с другой стороны, является во многом мифом. Тесты интеллектуальности, как правило, оценивают достижения испытуемого, которых, как предполагается, он добился за предыдущие несколько лет. Никто, даже самые горячие приверженцы теорий о врожденных и наследственных способностях, не станет утверждать, что мы рождаемся с уже сформировавшимся словарным запасом в мозге. Кроме того, для выполнения тестов оценки достижений также требуется определенный интеллект: как минимум, он нужен для усвоения того материала, который проверяется при тестировании.
Во-вторых, имейте в виду, что при тестировании словарного запаса очень легко может быть нарушен принцип равноправия культур. Тест, основанный на английском словаре, едва ли в той же степени подходит для ребенка, который от рождения разговаривал по-испански, по-вьетнамски или по-японски, как для ребенка, выросшего в англоязычной среде. На практике общее количество слов, которые знает ребенок, говорящий на двух языках, может заметно превышать словарный запас его англоязычного сверстника. Но проблема состоит в том, что тесты формируются только из английских слов, что дает очевидное преимущество тем детям, для которых английский язык является родным.
Что поразительно, желающие использовать тесты проверки интеллекта, разработанные в других странах (как правило, это Соединенные Штаты – крупнейший в мире производитель и потребитель таких тестов), часто просто переводят их на язык своей страны. При этом предполагается, что перевод не искажает тест; что слова, даже после перевода, по сложности и значимости в своем языке эквиваленты словам оригинала; что определение абстрактных слов является в их культуре такой же знакомой процедурой, как и в американской культуре. Как правило, ни одно из этих предположений не выполняется, но это не мешает издавать по существу бессмысленные переводы американских или каких-либо других тестов.
В-третьих, способ тестирования словаря иллюстрирует одно из основных положений настоящей книги – тесты проверки интеллекта оценивают интеллект академический, оторванный от контекста. Не так давно я присутствовал на занятии, где учитель проверял с помощью теста знание словаря учениками средней школы. Каждый ученик должен был дать абстрактное определение слова и использовать это слово в предложении. Рассмотрим два различных ответа, связанных со словом «понижать»:
• уменьшить количество или интенсивность… Чтобы понизить у ребенка температуру, доктор дал ему аспирин.
• сделать меньше… Политик постарался понизить уровень беспокойства в обществе в связи с возможным повышением налогов.
Отметим, что абстрактное определение лучше у первого ученика – у второго оно слишком общее. Но второй ученик, возможно, испытывая проблемы с абстрактным определением, знает, как использовать слово в конкретном контексте. Именно он будет демонстрировать более высокий интеллект в повседневном общении или даже на занятиях в школе. Но с точки зрения IQ-теста преимущество отдается первому ученику.
И последнее (по порядку, но не по значимости). Рассмотрим, что дают эти словарные тесты нашей образовательной системе. Что заставляет учеников средних школ запоминать словарные слова? Это ведь не помогает научиться грамотно писать или читать, говорить или слушать. Наиболее естественный способ обучения состоит в том, чтобы учить слова в контексте – например, читая или слушая других. В конце концов, в жизни важно уметь хорошо читать, писать, слушать и говорить, а не выдавать назубок определения слов. Заучивание словарных слов – не только неестественный процесс; оно очень редко способствует основательному долгосрочному удержанию этих слов в памяти. Поскольку слова учатся в отрыве от значимого контекста, они быстро забываются, как забывается содержание большей части курсов, которые мы зубрим в школе. Но поскольку в школьных тестах проверки способностей знание словаря оценивается, как правило, на основе оторванных от жизни примеров, учителя заставляют миллионы учеников тратить время на запоминание слов, которые они с большой вероятностью не знают, как использовать, и с той же вероятностью очень скоро забудут. Учителя готовят учеников к тестам, а эти тесты вовсе не оценивают то, что действительно должны знать дети или взрослые.
2.-Тесты на понимание. На этом уровне испытуемые должны продемонстрировать понимание общественных или культурных норм – объясняя, например, почему люди иногда одалживают деньги или почему люди голосуют. На первый взгляд может показаться, что эти тесты оценивают интеллект в контексте реального мира, то есть проверяют те способности, в наличии которых мы крайне заинтересованы. Но имеем ли мы здесь дело с действительно реальным миром или карикатурой на этот мир – сказочкой, которую иногда рассказываем себе о том мире, в котором нам хотелось бы жить?
Почему, например, люди просят деньги в долг? Очевидно, потому, что хотят купить то, что в данное время не в состоянии полностью оплатить. Но рассмотрим, почему люди берут взаймы в реальных ситуациях? Иногда, как, например, в случае покупки дома, это связано с необходимостью уплаты налогов. Иногда это вызвано желанием обладать предметами роскоши – автомобилями, яхтами, особняками, – которые они не только не могут, но и не должны покупать. Иногда таким образом добывают себе дополнительные карманные деньги, заведомо не собираясь их возвращать. Иногда эти деньги тратятся на покупку запрещенных препаратов, которые в конечном итоге убивают человека. А иногда, безусловно, и по тем причинам, которые фигурируют в качестве правильных ответов в тесте.
Или почему люди голосуют? В стране, где 99,6 процента населения отдают голоса за узаконенного диктатора (вспомните результаты никого не удивившей недавней победы на выборах Саддама Хусейна), причина в том, что люди вынуждены голосовать за ставленника руководящей верхушки. Иногда, голосуя, люди хотят продемонстрировать недоверие всем выдвигаемым кандидатам – граждане США в подобных случаях вписывают в бюллетени своих кандидатов; иногда люди идут на избирательные участки потому, что им за это платят. Безусловно, иногда голосование есть свободное волеизъявление и выражение своих политических пристрастий – именно такого ответа от вас ждут авторы теста; но в немалом числе случаев данный вопрос не имеет смысла, поскольку в значительной части мира люди не голосуют и никогда в своей жизни голосовать не будут.
В тесте на понимание испытуемые, как правило, излагают не то, что считают правдой, а то, что, по их мнению, желает услышать тестирующий. В смысле оценки понимания людьми «игры в тестирование» эти тесты вполне выполняют свои функции. Они могут быть связанными и с пониманием сути тех игр, которые ведутся в школах. Но эти тесты ни в коей мере не отражают подлинных умственных способностей, особенно у тех, кого с детства не учили разбираться и участвовать в подобных играх. Как это ни странно, многие считают, что подобные тесты связаны с культурой, в рамках которой живут люди, хотя на самом деле это не так. Они связаны с фантазиями конкретных Диков, Джейн и Салли о том, каким образом хочет представить себя эта культура.
3.-Тесты на абсурдности (несоответствия). В этих тестах испытуемым показывают картинки, на которых есть несоответствия, и задача состоит в том, чтобы найти эти несуразности. Например, испытуемые должны указать, что хоккеисты не могут играть на поверхности озера, в котором плавают люди в купальных костюмах. Но откуда ребенку из страны с тропическим климатом знать, что такое хоккей на льду? Сможете ли вы отыскать несоответствия на картинках, изображающих регбистов или играющих в крикет, хотя эти игры вовсе не относятся к числу экзотических? А что вы скажете насчет игры го? Чтобы увидеть абсурдность изображенного, необходимо хорошо знать содержание картинки – и только тогда можно разглядеть хотя бы возможные несоответствия.
4.-Связь слов. Здесь испытуемый должен сказать, что общего у первых трех слов из приведенного набо-ра и почему четвертое слово выпадает из этого ряда. Например, что общего у яблока, банана и апельсина, чего нет у чашки. Тест кажется чрезвычайно простым, но только для тех, кто вырос в среде, где все эти фрукты доступны и, соответственно, хорошо знакомы. Вы знаете, например, что такое гуава? А есть страны, в которых ответ на этот вопрос не вызовет затруднений даже у самых маленьких детей. Очень часто то, что преподносится в качестве тестов на вербальное мышление, оказывается проверкой знания словаря. Оба моих ребенка проходили предварительный тест проверки способностей к учебе, и оба получили одинаковые замечания. Для проверки вербального мышления детям предлагалось находить словесные аналогии, но проблема была не в том, что они не могли найти требуемые аналогии, а в том, что они не знали значения предлагаемых слов.
Таким образом, иногда тесты, предназначенные для оценки одних вещей (вербальное мышление), проверяют главным образом совсем другое (в данном случае знание словаря). Вот пример подобных упражнений, предлагаемых в рамках SAT-тестов: попробуйте указать аналогии – ИНТЕНСИФИЦИРОВАТЬ: УСИЛИВАТЬ: АКТИВИЗИРОВАТЬ: (а) увеличить; (б) уменьшить; (в) усиливать; (г) ослаблять; (д) мешать – если вы не знаете значения указанных слов.
К основным недостаткам подобных тестов относится то, что на основе интерпретации их результатов делаются ложные выводы. Так, в приведенном выше примере те, кто просто не знает значения редко используемых слов, могут получить ярлык людей с неразвитым вербальным мышлением. Думаю, было бы замечательно, если бы каждый знал, что и «интенсифицировать», и «активизировать» может означать «усиливать». Конечно, если вы решили стать учителем словесности, вам положено знать значение подобных слов. В то же время я подозреваю, что очень многие без проблем проживут всю жизнь и, возможно, добьются в ней немалых успехов, не отягощая себя знанием ни одного из этих слов.
5–6.-Анализ и копирование образцов. В тесте на анализ образцов испытуемый воспроизводит с помощью черно-белых двумерных фрагментов различные геометрические формы. Копирование подразумевает воспроизведение нарисованных геометрических фигур.
Эти два субтеста, возможно, отчетливее других демонстрируют ограниченность стандартной точки зрения на интеллект. Само слово «копирование» говорит о многом. Как правило, у испытуемых вознаграждается умение копировать работы других. Так о каком интеллекте идет речь? Это равносильно признанию вершиной творчества деятельность тех, кто день за днем проводит в музеях, копируя работы великих мастеров. В то же время кто возразит, что тесты типа Стэнфорд-Бине нацеливают на учебу, во главу угла которой ставится копирование и точное повторение слов учителя? Преуспеете в этом – будете круглым отличником. Если вы полениваетесь – возможно, потому, что вам претят столь бездумные подходы, – вашу интеллектуальность могут поставить под сомнение. Лично я считаю, что одно из преимуществ взрослых людей перед детьми состоит в том, что от нас, взрослых, уже не требуют закрашивать книжки-раскраски «правильными» цветами, ни в коем случае не выходя за очерченные границы. Если вы верите в подобные тесты, можете использовать эти книжки-раскраски в качестве совершенного мерила интеллекта.
7.-Матрицы. В данном субтесте испытуемому предлагается матрица, часть которой не заполнена, и он должен выбрать среди нескольких альтернатив правильный вариант заполнения. Матрицы уже давно используются для тестирования IQ. Но особое внимание уделяется так называемым «прогрессивным матрицам Равена» – чисто цифровым конструкциям, заслужившим славу наиболее объективного критерия оценки умственных способностей в целом. Их считают образцом справедливости по отношению к различным культурам, поскольку в них отсутствуют слова и, по мнению их приверженцев, они одинаковым образом воспринимаются представителями различных культур. Хотя о подлинном равноправии, конечно, не может быть и речи.
Итак, вы получили некоторое представление о возможных упражнениях, с которыми приходится сталкиваться при индивидуальном тестировании интеллекта. Остановимся теперь на проблемах подсчета и интерпретации результатов.
В методе Стэнфорд-Бине в выборке стандартизации – выборке, на основе которой устанавливается соответствие между количеством правильных ответов и значением IQ, – разность возрастов самых старших и самых младших ее представителей составляет двадцать два года – достаточно широкий диапазон. Данная выборка стандартизации используется в качестве контрольной группы для определения значимых результатов конкретного тестирования. Сколько, по вашему мнению, человек было протестировано для того, чтобы установить однозначную связь между количеством набранных очков (так называемый предварительный счет) и фактическим результатом тестирования (так называемым коэффициентом интеллектуальности, который позже мы обсудим подробнее)? В качестве отправной точки возьмем население Соединенных Штатов, составляющее примерно 250 миллионов человек. Должно быть, вы думаете, что выборка стандартизации включает 500 000 или хотя бы 50 000 человек? А как насчет 5000? Фактически она составляет 5013 человек – не так уж много, когда принятие решений, влияющих на дальнейшую жизнь испытуемых, зависит от точности интерпретации результатов. А если вспомнить, что выборке соответствует возрастной диапазон в двадцать два года, на каждый год возраста приходится менее 250 человек!
Диапазон в двадцать два года выглядит, с одной стороны, достаточно впечатляюще, но если вы посмотрите на проблему с другой точки зрения, он покажется весьма скромным. Он отражает тот факт, что данные тесты предназначены для проверки способностей к обучению. Выборка соответствует тем годам жизни, которые жители Соединенных Штатов проводят за школьными партами и в студенческих аудиториях. Но после двадцати двух лет (или около того) молодые люди покидают стены школы и начинают трудовую жизнь. Способности, которые позволяют добиваться успеха, уже другие, а тесты остаются прежними. Таким образом, система тестирования не только разработана, но и отнормирована с использованием выборки представителей населения со значительным возрастным смещением. Такая застывшая во времени реальность проявляется во всей своей ущербности, когда человеку солидного возраста приходится возвращаться за школьную парту и проходить тесты, отражающие положение вещей для юношей, а не для взрослых людей. Им приходится тратить время на изучение геометрии и прочих премудростей, которые они не использовали уже много лет и, скорее всего, никогда не будут использовать, кроме как при тестировании.
Хотя были предприняты определенные усилия для того, чтобы сделать эту выборку (с возрастным смещением) представительной по отношению к населению США, эти попытки закончились неудачей. Одна группа населения представлена в выборке с избытком – доля ее представителей в выборке выше соответствующей доли в общем населении страны. Что это за группа? Как раз та, которая почти всегда с избытком присутствует в различных психологических исследованиях, особенно в исследованиях интеллектуального развития. Речь идет о людях с более высоким социальным и экономическим статусом. Для компенсации этого недостатка выборки использовались методы статической коррекции. Но подобные корректировки носят заведомо приближенный характер, что опять-таки не добавляет уверенности в точности результатов тестирования.
Сравнения с другими тестами, включая прежние версии шкалы Стэнфорд-Бине, показали следующее: хотя отмечается примерное согласие результатов, количество очков как для одаренных людей, так и для умственно отсталых несколько ниже аналогичных результатов как для прежних версий данного теста, так и для его основного конкурента, теста Векслера. Учитывая, что минимальные результаты используются для вынесения диагноза «умственно отсталый», а максимальные результаты, соответственно, диагноза «интеллектуально одаренный», указанные систематические расхождения не способствует глубокому доверию к тестам, на основе которых выносятся жизненно важные решения.
Существуют и другие проблемы с этим видом тестов. Одна из них заключается в том, что для различного возраста предлагаются и различные субтесты (задачи), и не совсем понятно, как сравнивать результаты тестирования представителей отдельных возрастных групп. Более того, отличаются и допустимые диапазоны начисления очков для различных возрастов, а также для различных субтестов и наборов субтестов, что затрудняет сопоставление результатов не только по возрастам, но и при оценке отдельных способностей (например, когда необходимо определить слабые и сильные стороны испытуемого).
Вероятно, наиболее серьезной проблемой подобного тестирования является то, что статистический анализ (называемый «факторным анализом») структуры теста никак не связан со структурированием теста с целью получения частных результатов. Другими словами, нет соответствия этих результатов и методов выявления средствами статистического анализа действительных мыслей испытуемого. Таким образом, после проведение тестов у вас может оказаться набор результатов, которые никак не отражают процессы мышления тестируемого человека. Например, где конкретно может преуспеть человек с высокими показателями пространственного мышления?
Альтернативой методу Стэнфорд-Бине являются тесты Векслера – наиболее распространенная шкала тестирования интеллектуальности. Они основаны на тех же представлениях об интеллекте, что и шкала Стэнфорд-Бине. Система Векслера включает три уровня тестирования – «Тесты Векслера для проверки уровня интеллектуальности взрослых людей – исправленные» (WAIS-R), третье издание «Тестов Векслера для проверки уровня интеллектуальности детей» (WAIS-III) и «Тесты Векслера для проверки уровня интеллектуальности детей дошкольного и младшего школьного возраста» (WPSSI).
По результатам тестирования Векслера получают три показателя: вербальный, деятельный и общий. Вербальный показатель основан на таких тестах, как «словарь» и «подобие слов», при выполнении которых испытуемый должен указать, в чем состоит схожесть или связь пары объектов или понятий. Показатель деятельности основан на таких тестах, как «заполнение картинок», где нужно идентифицировать недостающую часть на рисунке объекта, или «упорядочение картинок», где нужно расположить перепутанные картинки (например, фрагменты из мультфильма) так, чтобы получилась связная история. При определении общего показателя комбинируются результаты вербального и деятельного тестирования.
Системе Векслера, как и тестам Стэнфорд-Бине, присущи проблемы, связанные с ее содержанием. Например, в тестах «подобие слов» преимущество отдается более категоричным ответам о схожести или несхожести объектов (например, оба объекта принадлежат к классу Х), чем, скажем, ответу, что объекты связаны функционально, то есть первый использует второй. Вывод о том, что первый ответ является в определенном смысле «лучше», чем второй, отражает не столько уровень мышления, сколько понимание процесса тестирования. Некоторые тестируемые способны находить нужные категоричные решения, но просто не знают, что именно они являются более предпочтительными при подсчете результатов. Аналогично, тест на заполнение картинок требует знания содержания этих картинок, а упражнение на упорядочение картинок окажется более простым для тех, кто уже привык к следующим в хронологическом порядке картинкам, например в виде мультфильмов или комиксов.
Как составляются тесты проверки умственных способностей
Каким принципам следуют авторы и издатели при создании подобных тестов? Существует два основных подхода к построению тестов, хотя один из них используется гораздо чаще другого.
Эмпирический подход
В данном подходе проводится серия наблюдений над людьми, которые преуспели в некоторой конкретной области, например в школе. После этого вопросы строятся так, чтобы отделить тех, у кого есть максимальные шансы добиться успеха, от тех, у кого эти шансы минимальны. Или даже еще проще: можно выбрать задания, с которыми дети постарше справятся с большей вероятностью, чем дети младшего возраста. Фактически именно таким образом поступал Бине – выбирал задания, позволявшие отделять старших детей от младших. Подобный подход выглядит достаточно разумным. В конце концов, с возрастом дети, как правило, умнеют. Однако с этим подходом связаны некоторые важные проблемы, приведшие в настоящее время к ряду дилемм, которые приходится решать при тестировании умственных способностей.
Одна из трудностей состоит в том, что выборки, на основе которых разрабатываются тесты, состоят фактически из одних детей. Вспомните, что тесты первоначально использовались и по-прежнему используются преимущественно для того, чтобы выделить очень одаренных детей среди их менее одаренных сверстников. В результате такие тесты, как правило, больше подходят детям, чем взрослым. Это и создает дилемму. Дети массу времени тратят на решение математических задач, тогда как взрослые могут по много лет вообще не заниматься подобными вещами. Когда зрелые люди пытаются поступить в колледж или аспирантуру, им предлагают выполнить стандартные тесты типа SAT или GRE, где нужно помнить теоремы из курсов алгебры и геометрии, а они, возможно, слышали о них в последний раз лет десять тому назад. Очевидно, эти тесты не могут служить таким же критерием оценки взрослых людей, каким они служат для учеников или недавних выпускников школ. Ничего удивительного в том, что люди старшего возраста часто при тестировании показывают слабые результаты.
Таким образом, структура и содержание тестов отражает в большей степени программу средней школы, чем те вещи, с которыми приходится сталкиваться зрелым людям в повседневной жизни. Эти тесты более уместно относить к критериям оценки «учебного интеллекта». Более того, школьная система, на которой они основаны, – это западная школьная система, которая принята вовсе не во всем мире. Даже в Соединенных Штатах ученики могут получать альтернативное образование; так, например, юные религиозные евреи ходят в синагогу, где основополагающие принципы черпаются из Талмуда, а не из классической западной литературы.
Вторая, связанная с первой, проблема обусловлена самим процессом тестирования. В младших классах дети еще не знакомы с процедурой тестирования. Лично я с большей настороженностью отношусь к результатам тестирования учеников до четвертого класса (то есть тех, кому еще не исполнилось девять-десять лет), поскольку маленьким детям часто в новинку сама обстановка тестирования. Я все еще помню свой первый тест в третьем классе с ответами на отдельных листочках. Это был «Тест проверки базовых способностей для штата Айова», который считался тестом достижений. У меня буквально стоит перед глазами то, как я подошел к последнему заданию и с ужасом обнаружил, что у меня осталось несколько незаполненных клеток для ответов. Я просто запутался и вносил ответы в позиции, которые соответствовали совсем другим вопросам. Но учительницу это не волновало. По результатам теста она сделала вывод о том, что уровень моих знаний в рамках тестируемого материала очень низок.
С годами ученики приобретают навыки выполнения тестов. Сама обстановка тестирования становится для них более привычной. Но дети, не посещавшие школы западного образца, могли никогда не сталкиваться с подобными заданиями. Точно так же люди среднего и старшего возраста, как на Западе, так и в других местах, могут годами не иметь ни малейшего представления о таких тестах. Для них процедура тестирования и даже мысль о ней могут быть сопряжены с переживаниями или страхом. И опять-таки, нельзя интерпретировать результаты их тестирования на основе тех же критериев, что и у молодежи.
Исследования показали, что немаловажное значение могут иметь и определенные особенности тестируемых. Например, чернокожие дети могут оказаться в менее выгодном положении при выполнении типичных тестов проверки умственных способностей. Могут сказаться и менее очевидные различия. Много лет назад, работая в летние месяцы в «Psychological Corporation», одном из крупнейших издательств тестов, которое находилось тогда в Нью-Йорке, я участвовал в приеме экзаменов. В компании решили, что для достижения максимально равноправных условий тестирования необходимо записать все задания на магнитофонную пленку. В таком случае каждый испытуемый будет слышать один и тот же голос, читающий инструкции с одинаковым для всех темпом и дикцией. В теории все выглядело замечательно. На практике все оказалось не так гладко.
Например, можно было ожидать, что для записи пригласят профессионального диктора с разборчивой, четкой артикуляцией и, возможно, с тем приятным «ванильным» акцентом уроженцев Среднего Запада, который легче всего воспринимается слушателями. Но по каким-то причинам президент компании решил начитать инструкции к тесту сам. Профессиональным диктором он не был. Что более существенно, его характерный техасский выговор основательно запутал, по всей видимости, немало ньюйоркцев. Его чтение было, возможно, по душе жителям Хьюстона, но многим жителям Нью-Йорка приходилось напрягаться, чтобы понять, о чем идет речь.
А что еще хуже, идея о том, что все будут одновременно выполнять инструкции, записанные на пленку, сыграла со многими злую шутку. Я наблюдал, как некоторые испытуемые терялись во время теста, у них буквально опускались руки – они еще не закончили одно задание, а механический голос из магнитофона уже диктовал следующее. Но когда сотрудники, в обязанности которых входило принятие решений о приеме испытуемых на работу, получали результаты тестирования, они видели аккуратные, чистые компьютерные распечатки, и создавалось впечатление, что так же четко и гладко проходил и сам тест.
В качестве последнего недостатка эмпирического подхода к построению тестов можно заметить, что авторы этих тестов, как правило, не задаются вопросом о том, что представляет собой интеллект. Они просто используют подтвержденные практикой критерии, например то, что позволяет отличить детей младшего возраста от детей постарше. Но дети с годами становятся в среднем выше и тяжелее. Авторы тестов не предлагают использовать для измерения интеллекта линейку или весы; рост и вес не являются критерием интеллекта. Но то, что на практике предлагается использовать для этих целей и в конечном итоге включается в тесты, вовсе не выглядит более обоснованным, чем измерение роста и веса. При отсутствии теории интеллекта нельзя дать четкого определения этого понятия, если, конечно, не удовлетвориться сомнительной формулировкой «интеллект – это то, что измеряется тестами»; данное рабочее определение предложил ныне покойный профессор Гарвардского университета с весьма уместной фамилией – Боринг (boring (англ.) – скучный, занудный).
Тесты, основанные на теории
Второй подход построения тестов состоит в создании теории интеллекта, на основе которой затем вырабатываются тесты. Преимущество такого подхода, очевидно, в том, что вы вооружены четким определением понятия интеллекта. Потребители тестов – психологи, школы или служащие, которые приобретают этот товар, – могут решать, нравится им данная теория или нет, и на основе этого решения покупать или не покупать тесты. Во многих отношениях такой подход к тестированию является более честным. Издатели тестов говорят, что они понимают под интеллектом, а потребители могут принять эту точку зрения или отвергнуть ее. Здесь нет лукавства с ярлыками: вам открыто говорят, что продают.
Но лишь очень немногие тесты проверки умственных способностей создаются на основе теорий интеллекта. Почему? Потому, что такой подход вынуждает издателей тестов принимать определенную концепцию интеллекта. А они, как правило, избегают этого: либо потому, что сами имеют весьма смутное представление об этом, либо для того, чтобы побольше продать своей продукции. Они рассуждают подобно производителям пищевых продуктов до принятия законов о точности содержания ярлыков и наклеек: чем меньше люди знают о том, что им предлагают, тем меньше вероятность, что они от этого откажутся. Сегодня, если вам не нравятся продукты с высоким содержанием жира, вы просто их не покупаете. Раньше, не зная содержания жира в конкретном продукте, вы вполне могли бы и купить его, повышая таким образом общий объем его продаж. Что касается тестов, то ввиду отсутствия четких теоретических основ вы часто покупаете то, о чем имеете достаточно смутное представление.
Как оцениваются тесты проверки умственных способностей
Безусловно, потребители тестов не являются полными идиотами и хотят получить адекватную информацию об этом товаре – их приходится убеждать, что тесты небесполезны хотя бы в некоторых процессах принятия решений (или, по крайней мере, производят такое впечатление).
Валидность
Первую важную информацию такого рода, которая будет постоянно обсуждаться в данной книге, часто называют «критерием валидности». Вопрос здесь состоит в том, насколько результаты тестирования измеряют то, что они должны измерять в соответствии со своим назначением. Отражают ли они то, что от них действительно ожидают? Например, критерием валидности тестов проверки умственных способностей часто служат оценки, которые ученики получают в школе; а если речь идет о программах профессиональной подготовки, критерием может быть последующая эффективность на рабочих местах.
В так называемых технических руководствах по использованию тестов приводится масса статистических материалов, связанных с критериями валидности тестов. Но здесь, опять-таки, не все так просто. В какой степени нас должны беспокоить оценки в школе? Разве они служат показателем того, что один человек умнее другого? Или должны ли нас волновать показатели стандартизованных тестов достижений? Мой сын начал выпускать свою газету в школе, он постоянно готовит материалы в уже существующую школьную газету, пилотирует самолет, переводит в местной больнице на английский язык жалобы и другие медицинские проблемы испаноязычных пациентов. По-моему, неплохие достижения для семнадцатилетнего парня. Однако ни одно из них не относится к тем критериям, по которым проверяется валидность тестов проверки интеллектуальности. А разве взрослых людей волнуют полученные когда-то оценки? Может быть, кандидатов на ответственные посты в промышленности отбирают на основе этих оценок? Сомневаюсь!
С моей точки зрения, очень печально, что мы относимся к результатам тестирования способностей как к официальным, важным данным, а к внеклассной деятельности детей – как к чему-то второстепенному. И поскольку часто бывает удобно прикрываться количественными результатами, мы предпочитаем просто считать, а не серьезно анализировать такую деятельность. В результате ученик, посещающий три внешкольных клуба, оценивается выше того, кто придумал и организовал один клуб. Наилучшим предсказателем интеллекта успеха в будущем является интеллект успеха в прошлом. И предсказания должны базироваться на успешной деятельности в реальном мире в течение длительного периода времени, а не на успехах в мире тестирования, длительность существования которого составляет всего три часа.
Уже не один год я заявляю: тесты не измеряют то, что действительно важно для подлинного успеха и в учебе, и на работе. В частности, я утверждаю, что на уровне аспирантуры, где готовятся профессионалы, тесты не измеряют навыки и способности, которые важны для получения работы. В конце концов, я решил подтвердить свои слова объективными фактами. Вместе с Венди Вильямсом мы исследовали значимость предсказаний приемного письменного экзамена (GRE). В выборку были включены абитуриенты за двенадцатилетний период (166 студентов), обучавшиеся в рамках нашей программы по психологии для аспирантов. Результаты прогнозов GRE сравнивались с оценками, полученными в первый и второй год аспирантуры, а также, что более важно, с оценкой студентов преподавателями с точки зрения (а) аналитических способностей, (б) творческих способностей, (в) практических способностей, (г) исследовательских способностей, (д) способностей к преподаванию, (е) подготовленных диссертаций. Безусловно, в аспирантуре последний показатель имеет гораздо большее значение, чем полученные оценки.
Ну и какими оказались результаты? Рассматривая совместно мужчин и женщин (последние на равных основаниях участвовали и в тестах, и в самой программе), мы обнаружили, что GRE устойчиво прогнозирует оценки, получаемые в течение первого года программы, но не более. Хотя уровень оправданности предсказаний и здесь был более чем скромен. Для GRE-тестов на вербальное мышление общая корреляция составляла 0,18 (0 – отсутствие корреляции, 1– полная корреляция) – результат на грани статистической значимости. Для аналитических способностей корреляция была равна 0,17 – опять-таки на пределе статистической значимости. Максимальная корреляция, что не удивительно, была получена для теста достижений в психологии – 0,37. Достижения в тесте явились наилучшим предсказанием достижений в программе. Какие-либо другие важные критерии тест не прогнозировал. Он не предсказывал даже оценки на втором году обучения. Стало понятно, почему издатели теста, приводя информацию о валидности теста, уделяли такое внимание оценкам в течение первого года обучения!
Интересные особенности были обнаружены после того, как мы провели классификацию по половому признаку. Один из субтестов – аналитический – с умеренной точностью, но статистически значимо прогнозировал некоторые из наиболее важных критериев, но только для мужчин. Например, для мужчин корреляция показателей аналитического GRE-теста с оценкой преподавателями аналитических способностей аспирантов составляла 0,31. Для женщин эта корреляция была равна всего 0,05. Фактически, для женщин тест вообще не давал статистически значимых предсказаний. Таким образом, комбинация результатов для мужчин и женщин дает обманчивую картину эффективности теста в прогнозировании успеха в аспирантуре. Хотя достижения мужчин и женщин в рамках нашей программы в общем равнозначны, предвестники их успехов существенно различаются. Причины этих расхождений пока неизвестны.
Мы полагаем, что на основании проведенных исследований можно сделать несколько полезных выводов. Во-первых, тесты предсказывают прежде всего оценки, и часто именно оценки оказываются их единственным удачным прогнозом. Нет ничего плохого в предсказании оценок – они также важны, тем более что мы постоянно себя в этом убеждаем, – но жизнь вовсе не сводится к одним только оценкам. Во-вторых, точность прогноза не одинакова для различных групп, о чем нельзя забывать, анализируя результаты тестирования. Женщинам приходится решать ряд проблем, которые неведомы мужчинам. Кроме того, как показывают исследования, женщины часто убеждены, что не способны выполнять определенные задачи, в результате чего они действительно очень слабо справляются с этими задачами. Когда человек настраивается на неудачу, вероятность неудачного исхода заметно возрастает.
Мы не были особо поражены результатами наших исследований GRE-тестирования, равно как не были удивлены и реакцией на них в различных группах, где мы показывали эти результаты. Те, кто с самого начала скептически относился к тестам, кивали головой – дескать, ничего другого мы и не ожидали. Но горячие приверженцы тестирования со скепсисом отнеслись как раз к нашим изысканиям. Они, например, заявили, что для подлинной проверки теста необходима информация о том, насколько преуспели бы в программе те, кто не был принят.
В определенном смысле они правы. Было бы замечательно узнать, как бы пошли дела у тех, кто не был принят. Лично я считаю, что у большинства из них все было бы в порядке. Но проблема в том, что мы не можем провести подобные исследования – именно потому, что такие люди не были допущены к участию в программе, причем чаще всего на основании результатов тестирования. То есть чтобы разубедить скептиков, необходимо провести исследования, которые провести невозможно. Но зато можно сделать что-то довольно близкое к этому. В течение года или нескольких лет мы могли бы принимать всех абитуриентов, независимо от результатов тестирования, и посмотреть, как они проявят себя в различных аспектах программы. В этом случае базовая выборка была бы свободна от того смещения, которое «портит» выборку, сформированную по результатам тестирования. Идеальным с точки зрения эксперимента был бы, безусловно, случайный прием абитуриентов. Но, конечно же, никто не захочет закрывать глаза на результаты тестирования в течение года или двух, а руководство факультета будет против набора аспирантов по случайному принципу. Таким образом, система остается на прежнем месте, а люди – при своих убеждениях, которые, похоже, так никогда и не удастся переломить.
Наши исследования GRE-тестов и другие подобные данные указывают на необходимость получения дополнительной информации о валидности тестов – помимо той, что обычно приводится в технических руководствах. Нужны более универсальные критерии, а также данные о валидности тестов для различных групп людей и различных ситуаций. Часто подразумевается, что, раз тесты работают для одной группы, они будут работать и для других, хотя на практике можно наблюдать обратное.
Надежность (достоверность)
При оценке тестов их издатели и потребители уделяют пристальное внимание еще одной характеристике. Речь идет о надежности (достоверности), которая определяет, насколько устойчиво тест измеряет то, для чего он предназначен. Другими словами, если тест выполняется один раз, а затем еще раз, будут ли совпадать результаты?
Многие из распространенных тестов достаточно надежны – в противном случае они бы и не завоевали такую популярность. Но здесь речь идет об усредненных показателях. Встречаются люди, результаты которых флуктуируют в умеренных пределах, а есть и такие, у которых разбежки от теста к тесту могут быть значительными. Так, например, с помощью специальных пособий и курсов подготовки многим удается улучшать результаты выполнения таких тестов, как SAT и GRE, или других аналогичных конкурсных тестов.
В связи с доступностью таких книг и курсов, а также с учетом того, что они позволяют в среднем заметно повышать показатели тестирования, возникает вопрос о равноправии. Как быть с теми, кто не знает о существовании таких курсов, кто не может себе их позволить или у кого нет на них времени? Безусловно, издатели тестов будут настаивать, что даваемые книгами и курсами преимущества не так уж велики. В среднем, конечно, нет. Но для отдельных людей они существенны, а что более важно, когда речь идет о миллионах решений, принимаемых в течение года по результатам миллионов тестов, даже очень маленькие различия приведут в среднем к весьма впечатляющим последствиям. Для некоторых соответствующая книга или курсы могут сыграть важную роль, и ввиду неравноправного доступа к ним результаты тестирования для различных людей не могут интерпретироваться единым образом. Поэтому общая надежность тестов призвана нивелировать подобные нежелательные последствия неравноправия.
Издатели также отдают предпочтение таким тестам, в которых отдельные задания конкретного субтеста измеряют примерно одну и ту же характеристику. Они даже приводят статистические данные, демонстрирующие однородность различных элементов субтеста по отношению к измеряемой характеристике. Хотя за такую согласованность результатов приходится расплачиваться. Чем больше элементов теста измеряют одно и то же, тем меньше диапазон проводимых измерений. Другими словами, согласованность достигается за счет широты охвата. Узость используемых тестов, похоже, мало кого волнует; но тесты ведь действительно очень ограничены! Мы имеем надежные хорошие измерения пассивного интеллекта. Но как использовать результаты этих измерений?
Как используются тесты
Тесты используются так же, как это описывает принцип Гейзенберга: прибор, проводящий измерения, сам влияет на оцениваемые характеристики. Например, в нашем обществе те, кто находится на верхних ступеньках социальной лестницы, – юристы, врачи, бизнесмены, профессоры колледжей – имеют, как правило, более высокие IQ, чем те, кто занимает нижние ступеньки этой лестницы, – поденщики, уборщики, дворники. Таким образом, IQ связан с занимаемым положением, но является ли он причиной достижения этого положения?
Здесь важно уметь отличать причинно-следственную связь от простой корреляции. Известно, например, что большинство населения Нигерии имеет черный цвет кожи, а большинство жителей Норвегии – белый. Однако вы же не сделаете вывод о том, что проживание в Нигерии делает кожу человека черной, а жизнь в Норвегии, соответственно, белой. Вот вам пример, что корреляция не всегда является причиной. При установлении корреляции следует иметь в виду, что имеются по крайней мере три возможные ее причины. Предположим, имеется корреляция между двумя вещами, например измеренным интеллектом и занимаемым служебным положением. Из соображений общности назовем их «фактор Х» и «фактор У». Возможно, фактор Х вызывает фактор У; возможно, фактор У вызывает фактор Х; но не исключено, что существует фактор более высокого порядка, который является причиной для них обоих.
Таким образом, корреляция между IQ и занимаемым рабочим местом может быть связана с тремя различными механизмами. Именно благодаря высокому IQ человек может получить более престижную работу – это вполне вероятно. Или более хорошее рабочее место может способствовать повышению IQ, что, в свою очередь, также справедливо. Хорошая работа позволяет тренировать интеллектуальные способности, что в результате ведет к совершенствованию интеллекта и повышению IQ. Но может быть и высокий IQ, и хорошая работа обусловлены некоторыми другими факторами. Но что это тогда за факторы?
Рассмотрим ситуацию в Соединенных Штатах. Для того чтобы поступить на юридический факультет, необходимо пройти юридическое тестирование (LSAT); чтобы поступить на факультет бизнеса, необходимо пройти соответствующее бизнес-тестирование (GMAT); чтобы поступить на медицинский факультет, необходимо пройти тестирование на знание медицины (MCAT); чтобы поступить в аспирантуру, необходимо выполнить соответствующие тесты для аспирантов (GRE или MAT). Для поступления в аспирантуру на специальности с высоким конкурсом необходимо набрать определенный результат на вступительном тестировании. Аналогичная процедура приема практикуется в престижных колледжах и частных школах.
Так какова же связь между приведенными фактами и корреляцией между IQ и занимаемым рабочим местом? Обычные тесты оценки интеллектуальности связаны со всеми этими тестами на приемных экзаменах, равно как последние взаимосвязаны друг с другом – несмотря на различные названия все они измеряют практически одни и те же способности. Использование незначительных вариаций названий и содержания тестов может оказаться прибыльным бизнесом, но все эти манипуляции слабо сказываются на конечных результатах. Те, кто хорошо справляется с одним из тестов, как правило, не имеет проблем и с остальными.
Предположим, что кто-то по тем или иным причинам испытывает трудности с тестированием. Возможно, этот человек обладает выдающими творческими способностями, но у него проблемы с аналитическим мышлением. Возможно, речь идет о человеке с незаурядной практической сметкой и замечательным здравым смыслом, который в то же время достаточно беспомощен на абстрактном, академическом уровне. Возможна и боязнь тестирования – подобное в свое время было со мной. Или, скажем, человек вырос в семье, где говорили по-испански, по-французски или по-вьетнамски, и его английский язык оставляет желать лучшего. А может быть, английский его родной язык, но, поскольку родители этого человека были вынуждены оба работать, ему в детстве мало читали и редко с ним разговаривали, что сказалось на вербальном интеллекте. Можно назвать множество причин, в связи с которыми у людей могут быть проблемы с тестированием.
Если такой человек захочет пройти по конкурсу в аспирантуру (что дает своего рода пропуск на престижное рабочее место), можно сказать, что ему не повезло, поскольку практически все учебные заведения в рамках выбранной им специальности требуют прохождения практически одного и того же теста. Решив получить образование, такой человек рискует постоянно оказываться перед запертой дверью. В конечном итоге он имеет все шансы опуститься на нижние ступеньки профессиональной лестницы. Сравним теперь таких людей с теми, кто без проблем справляется с тестами. Возможно, у последних и не так уж много талантов, но среди них есть умение набирать при тестировании большое количество очков, которые позволяют получать образование по выбранной ими специальности. Возможно, им окажутся не по силам наиболее сложные программы обучения, но шансы получить приемлемое образование у них все-таки выше. А это образование позволит, в свою очередь, приобрести и более престижную профессию.
Поэтому не приходится удивляться, что люди на верхних ступеньках профессиональной лестницы имеют высокие результаты тестирования. Без таких результатов они бы просто не смогли там оказаться. Фактически мы сами создаем корреляцию между IQ и профессиональным статусом!
Очень важно иметь в виду, что так было не всегда и не везде в мире общество организовано подобным образом. Если вы вернетесь в пятидесятые годы, то обнаружите, что в среднем результаты SAT были гораздо ниже, чем через десять лет. Что же произошло? Неужели люди вдруг стали настолько умнее? Конечно же нет. Просто во многих колледжах изменили критерии набора студентов, уделяя больше внимания результатам тестирования и меньше – социальным аспектам. С определенной точки зрения выдвижение на первый план показателей тестирования повышает шансы более способных абитуриентов. В других странах на возможность получения высшего образования помимо способностей влияют и другие факторы, в том числе социальное происхождение.
Рассмотрим интересную аналогию. Предположим, что в нашем обществе принимается решение больше не обращать внимания на результаты тестирования, поскольку даже у одних и тех же людей эти результаты весьма изменчивы. Один раз, выполняя SAT, вы можете набрать 500 очков, а при повторном тестировании на следующий день набираете, например, 570 очков. Поэтому решают заменить результаты тестирования более устойчивой характеристикой – ростом человека. С определенного момента прием в колледжи и аспирантуру будет осуществляться на основе роста абитуриента. Для поступления в Гарвард рост должен быть, скажем, шесть футов и четыре дюйма. Для Йельского университета достаточно шести футов и трех дюймов (плюс привлекательный внешний вид). И так далее, пока не дойдем до наименее престижных заведений, где «проходной рост» составит четыре фута и три дюйма. Безусловно, для поступления на престижный медицинский или юридический факультет нужно быть еще выше, скажем шесть футов и семь дюймов. Моя аналогия может показаться вам глупой, но на самом деле это не так. В реальной жизни люди, занимающие верхние ступеньки социальной и профессиональной лестницы, в среднем выше тех, кто оказывается внизу. Рост учитывается, только мы себе в этом не признаемся.
Продолжим нашу аналогию. Через двадцать пять лет после введения в качестве основного критерия приема роста вы решаете сопоставить средние IQ людей с различным статусом – юристов, врачей и управленцев, со одной стороны, с поденщиками, дворниками и рабочими на конвейерах, с другой стороны. Что же вы обнаружите? Окажется, что чем выше занимаемая человеком ступенька на социальной и профессиональной лестнице, тем больше его рост. Это свидетельствует о том, что более высокий рост способствует более успешному выполнению профессиональных обязанностей? Нет! Это отражает то, что рост человека использовался в качестве критерия при принятии решения о том, какую работу ему будет позволено – или не позволено – выполнять.
Я не утверждаю, что IQ совсем не связан с профессиональными успехами. Связан, хотя и слабо. Просто ни в коем случае нельзя делать вывод, как сделали Хернштейн и Мюррей в своей книге «Кривая Белла», о существовании некой таинственной руки – некой силы природы, – которая подымает наверх сливки общества, а его отбросы опускает вниз. Скорее, мы должны признать, что имеем то общество, которое создаем своими руками. Не природа решает, кого из нас выделять, – решает общество.
Конечно, коэффициент умственного развития кое-что значит, но не так уж и много. Связанные с IQ характеристики, как правило, объясняют менее 10 процентов расхождений между теми, кто преуспел в жизни, и теми, кто оказался менее удачен. Это означает, что природа 90 процентов вариаций остается непонятной, по крайней мере с точки зрения IQ. По-моему, нет особых оснований утверждать, что IQ играет важную роль. А как обстоит дело с различиями между группами?
Групповые отличия по IQ и умственным способностям
Существуют факты, которые трудно оспорить. Например, в Соединенных Штатах различные расовые и этнические группы имеют различные IQ. Сам по себе факт подобных вариаций не является свидетельством наличия смещения в тестах. Смещение не есть функция расхождения результатов тестирования в различных группах. О смещении можно говорить только в том случае, когда тесты, предназначенные для прогнозирования определенной характеристики, не дают одинаковых различий.
Накопленные данные о смещении (то есть необъек-тивности) тестов изучены подробно и дотошно. Главный вывод проведенных исследований – тесты не смещены, по крайней мере в традиционном для статистики смысле. Давайте все-таки подумаем о сути этого вывода.
Имеется в виду следующее: если группа А показывает при тестировании интеллекта худшие результаты по сравнению с группой В, то, как правило, она также будет слабее проявлять себя и при реализации тех характеристик, для прогнозирования которых предназначен используемый тест. Таким образом, если груп-па А хуже справляется с традиционным тестом оценки интеллекта, чем группа В, то у группы А с большей вероятностью будут, например, более низкие оценки в школе. Так, в среднем в Соединенных Штатах у представителей негритянского населения показатели тестирования примерно на одно стандартное отклонение (15 очков IQ) ниже, чем у представителей белой расы. Первые также слабее успевают в школе. Ага! Артур Дженсен, Ричард Хернштейн, Чарльз Мюррей и другие представители «правого крыла» в теории интеллекта утверждают, что смещение отсутствует. Американцы азиатского происхождения при прохождении многих тестов показывают результаты несколько выше, чем их белые сограждане, и точно так же они имеют более высокие показатели в школе. Значит, смещения действительно нет? Но погодите минутку.
Являются ли отклонения для различных расовых групп врожденными, или, другими словами, наследуемыми? Хернштейн и Мюррей утверждают, что да[10]. Но факты не подтверждают их выводов. Хернштейн и Мюррей, наряду с другими исследователями, указывают, что наследуемый характер различий между группами связан с наследуемой природой интеллекта. Но фактически все доступные данные позволяют проводить лишь внутригрупповые оценки наследуемости. Эти данные говорят о механизмах передачи интеллекта в пределах одних и тех же групп, а не между группами. Таким образом, исследования, проведенные преимущественно для белых близнецов, могут рассказать о причинах различий индивидуумов, относящихся к белым близнецам, но никак не объяснят расхождений между группами, одни из которых состоят из представителей белой расы, а другие – из представителей черной.
Выявляемые различия нельзя признать статистически безупречными. Приведем один популярный пример, который также используют Хернштейн и Мюррей. Предположим, у вас есть семена кукурузы в достаточном количестве, чтобы были представлены все нормальные вариации данной культуры. Половина семян высевается на полях Айовы, а вторая половина – на скудных землях Моджавской пустыни. Хотя качества сортов кукурузы являются в высокой степени наследуемыми, в данном случае различия в развитии двух посевов определяются исключительно внешними условиями. Каким образом все это связано с различиями белых и черных групп?
Даже если интеллект является в определенной степени наследуемым, подобная наследуемость, которая определяется внутри групп, не объясняет причины различий между группами. На это указывает и пример с кукурузой. Более того, сравнивая группы, необходимо иметь четкое представление о том, что сопоставляется. Так, например, в Соединенных Штатах утверждение о чистоте рас является откровенной глупостью. Афроамериканцы представляют собой в значительной степени результаты «скрещивания» преимущественно черных индивидуумов африканского происхождения с преимущественно белыми индивидуумами европейского или какого-либо другого происхождения. Различаемые в психологических исследованиях расовые группы определяются не биологическими, а социальными признаками. Другими словами, люди причисляются к конкретной расе по их словам, а не по тому, где они родились.
Имеются интересные факты, указывающие на то, что различия «белые-черные» не являются по своей природе генетическими, а определяются прежде всего внешними условиями. Например, дети нескольких сотен немецких детей, родившихся в результате связи их матерей с чернокожими американскими солдатами во время Второй мировой войны, имеют IQ, который совпадает в пределах половины одного очка с IQ тех, в происхождении которых были аналогичным образом замешаны белые американские солдаты. Более того, среди детей, появившихся в союзах белых и черных родителей, более высокий IQ отмечается в тех случаях, когда к белой расе принадлежит мать. Это опять-таки указывает на социальную, а не на генетическую природу обсуждаемых различий.
Еще один момент. Психолог из Мичиганского университета Ричард Нисбет изучил соответствующую литературу и обнаружил семь опубликованных исследований, в которых сравниваются генетические и связанные с внешними условиями аспекты различий IQ для белого и черного населения. В отличие, например, от изучения близнецов, эти исследования были непосредственно направлены на выявление природы отличий белых людей от черных. В шести из них не удалось найти каких-либо свидетельств в пользу генетического происхождения различий. А исследования Скарра и Вайнберга 1976 года кажутся весьма сомнительными. Не совсем ясно, как должны интерпретироваться их результаты, хотя сами авторы считают, что они не свидетельствуют в пользу генетической точки зрения. Любопытно и достаточно грустно то, что Хернштейн и Мюррей подробно обсуждают только одно это неоднозначное исследование, и, как и следовало ожидать, их интерпретация результатов противоположна той, что приводят сами авторы. В данном случае (равно как и во всей их книге) игнорируются факты, не соответствующие гипотезе этих авторов, а допускающие неоднозначную интерпретацию факты неизменно подгоняются под их социально-политические взгляды.
Является ли величина IQ причиной групповых различий, связанных с достижением определенного положения и успеха в обществе? Хернштейн и Мюррей не сомневаются в этом. Вся их книга направлена на подтверждение данной точки зрения. И в этом они не одиноки. Те же позиции занимает и Дженсен, и многие другие. Но что любопытно, собственные данные Хернштейна и Мюррея не подтверждают выдвигаемых ими гипотез. В одном из своих исследований они обнаружили, что по сравнению с белыми у негров с таким же средним значением IQ в два раза выше вероятность проживания в бедности, более чем в пять раз выше вероятность рождения вне брака, в три раза выше вероятность существования за счет благотворительности, более чем в два раза выше вероятность проживания в бедности в течение первых трех лет жизни, и в два раза выше вероятность малого веса при рождении. Эти данные не подтверждают вывод о том, что именно IQ определяет способность к адаптации в описанных ситуациях, поскольку IQ для обеих групп был одинаков.
Еще в начале века паникеры от социологии указывали на групповые различия IQ и предупреждали о страшной угрозе таких различий – их пугал не сам факт существования расхождений, а то, что несовпадение скоростей воспроизводства в различных группах с неизбежностью приведет к понижению интеллекта нации в целом. Если, как утверждают эти «ученые», люди, занимающие низшие ступени общественно-экономической лестницы и соответственно имеющие более низкие IQ, воспроизводят себя быстрее, то независимо от того, определяется интеллект генами или внешними условиями, средний IQ в стране будет неуклонно понижаться, поскольку «второсортные» родители будут с опережающим темпом обеспечивать общество и недостойными генами, и плохими внешними условиями.
Эта гипотеза имеет успех у многих паникеров, несмотря на тот факт, что за последние тридцать лет или около того IQ вырос более чем существенно – на величину полного стандартного отклонения (примерно 15 пунктов IQ). Подобный рост, который называют «эффектом Флинна» (по фамилии его открывателя, Джеймса Флинна[11]), является камнем преткновения для наших паникеров, и, похоже, объяснить его им никак не удается. Эффект Флинна наблюдается не только в Соединенных Штатах. Он отмечен во многих странах по всему миру. Фактически, тот человек, который сегодня имел бы показатель IQ 85 пунктов, всего пару поколений тому назад набрал бы средний показатель примерно 100 пунктов.
По поводу эффекта Флинна имеется масса спекуляций, но убедительные объяснения отсутствуют. Среди вероятных причин могут быть и лучшее образование, и лучшее питание, и школьная реформа – но это только догадки. Точно известно лишь то, что вопреки прогнозам о снижении интеллектуальные способности нации в среднем возрастают.
Однако сегодня мы столкнулись с проблемой другого рода, которая свидетельствует об определенной деградации. Наряду с ростом средних показателей IQ, наблюдается снижение результатов некоторых тестов, которые используются при отборе абитуриентов в колледжи. Безусловно, эти тесты оценивают лишь часть способностей человека. Но они свидетельствуют о снижении так называемых «академических» навыков. Многие профессора, включая и автора этих строк, обратили внимание на снижение в последние годы вербальных способностей студентов, то есть способностей, связанных с владением речью. Снижение оказалось настолько существенным, что после многих лет использования неизменных норм для оценки SAT Государственная служба тестирования в образовании была вынуждена провести перенормировку тестов, приняв в качестве среднего показатель 500 пунктов.
Низкие показатели не связаны, как многие могут подумать, с ухудшением ситуации с менее способными членами общества. Хотя мы теперь и имеем больше посредственных результатов, эта тенденция связана прежде всего с различиями в выборках тестируемых детей. Сейчас тестирование проходят значительно больше учеников и студентов, чем это имело место в 50-е, 60-е и даже 70-е годы, когда показатели были выше. Раньше тестировались лишь лучшие ученики, теперь охватываются практически все. Реальная проблема состоит как раз в снижении наиболее высоких результатов. До перенормировки тестов особенно бросалось в глаза уменьшение показателей в районе 600 и 700 пунктов, т. е. речь идет о верхней части шкалы. Почему происходит понижение верхней планки? Я полагаю, здесь наиболее вероятны следующие три причины.
Во-первых, приносит свои плоды присущая нашей нации озабоченность проблемами «неблагоприятных» людей. Люди с низкими способностями, безусловно, требуют особого внимания, но не меньшего внимания заслуживают и обладатели высоких способностей. Наши национальные приоритеты проявляются в том, что 99,9 процента бюджета специального образования направляется на нужды представителей нижней части шкалы измерения способностей. А это является откровенной глупостью. Наши одаренные дети (под одаренностью я подразумеваю весь спектр способностей и талантов, а не только IQ), вероятно, составляют наиболее ценные ресурсы нации. Они – наша главная надежда в мире все возрастающей конкуренции. А в начальной и средней школе им уделяется гораздо меньше внимания, чем детям с различного рода трудностями. Считается, что одаренные дети сами пробьют себе дорогу. Их относят к категории, меньше нуждающейся в помощи. А это неверно. Помощь нужна им не меньше, чем их сверстникам с более низкими способностями. Часто им приходится учиться в условиях, которые нагоняют на них тоску и зарождают ненависть к школе. Один из моих подопечных, без сомнения гений в математике, был вынужден две трети года, котрые он провел в обычной школе, повторять разделы математики, которые он уже давно знал. Это пустая трата времени и неуважение к способностям. Никому не проходит в голову научить таких детей тому, как наилучшим образом использовать данный им свыше дар.
Во-вторых, наблюдается систематическое «оглупление» наших учебников. На этот факт указала Салли Райс из Университета штата Коннектикут, проводившая исследования по заданию Министерства образования США. В среднем учебники опустились на три уровня согласно принятой градации по сравнению с тем временем, когда я учился в начальной школе – примерно тридцать лет назад. Стали примитивнее и учебники для младших классов. В качестве автора учебных пособий я ни разу не испытывал давления с целью заставить меня повышать уровень содержания, напротив, от меня требовали понижать уровень сложности.
Очень просто обвинить во всем издателей. Кто им позволил калечить наших детей? Но проблема не в издателях, проблема в школах. Что школы покупают, то издатели и выпускают. Если школа потребует учебники высокого уровня, издатели будут выпускать именно такие учебники. Захотят школы книги с прекрасными цветными иллюстрациями – пожалуйста. Цель издателей – получать прибыли, поэтому они выпускают для своих заказчиков все, что они требуют.
В нашей стране мы все говорим о высоких стандартах – многочисленные государственные и общественные структуры только и твердят об этом. Но все разговорами и заканчивается, а конкретных действий нет. Когда издатели выпускают учебник относительно высокой сложности, его не покупают. Массовый рынок делает ставку на примитивный уровень, и издатели знают об этом. Приобретая учебники, и представители среднего образования, и даже профессора колледжей покупают что попроще, чтобы не дай бог не ущемить самолюбие своих подопечных. Но при этом ученики и студенты не получают действительно стоящую пищу для ума.
Наше лицемерие не ограничивается одним лишь образованием. Я посетил уже, наверное, две дюжины стран, и у меня сложилось впечатление, что ни в одной из них нет стольких людей с избыточным весом, сколько в Соединенных Штатах. Какое же предлагается решение? Мы повышаем уровни веса, которые считаются допустимыми для соответствующего возраста! А тем временем смертность от сердечно-сосудистых заболеваний возрастает. Как поступили производители одежды, обнаружив, что спрос на малые размеры падает и все больше и больше женщин вынуждены покупать более крупные размеры, изрядно при этом смущаясь и расстраиваясь? Они изменили маркировку размеров одежды, и теперь толстые женщины покупают себе меньшие размеры и остаются очень довольными. Конечно, можно изменить этикетку, но сама вещь от этого не меняется, как не решается и существующая проблема. Мы можем написать на учебнике «для шестого уровня», но судить-то надо по содержанию, а правда в том, что это содержание становится все примитивнее для всех уровней.
В своей книге «Пробел в обучении» Гарольд Стивенсон из Мичиганского университета и Джеймс Стиглер из UCLA описали интересный парадокс. Сравнивая японских и американских родителей, авторы обнаружили, что наши соотечественники гораздо больше удовлетворены достижениями своих детей, чем японские родители, несмотря на то что у американских детей фактические показатели заметно ниже. Американские родители убеждены, что дела идут хорошо и со школами у нас полный порядок. «О недостатках школы говорят лишь безответственные злопыхатели». И талии у наших женщин тоже замечательные. Наша национальная способность к самообману просто поражает! И то, что мы наблюдаем, путешествуя по всему миру, не способно раскрыть нам глаза. Если появляются проблемы с результатами тестирования наших детей, можно в любой момент провести перенормировку тестов – дети без проблем будут получать нужные оценки по чтению, спотыкаясь при этом на каждом слове. Цена этого самообмана – неизбежное падение конкурентоспособности нации. По-моему, слишком высокая цена, а со временем она станет еще выше. Нам необходимо повышать уровень интеллекта нации, а не понижать его.
Интеллект может изменяться
Интеллект человека и даже его IQ не являются чем-то застывшим. Когда-то и я считал интеллект неизменным – по жизни человек идет с тем, что достается ему при рождении. Сегодня многие ученые, занимающиеся исследованиями интеллекта, а возможно, даже большинство из них считают его достаточно пластичным – определенные вмешательства позволяют придавать ему желаемые формы и даже способствовать его росту[12].
В качестве примера приведем программу «Head Start», выполнявшуюся в шестидесятые годы с целью формирования у маленьких детей к моменту их поступления в школу необходимых зачатков интеллектуальных способностей и практических навыков. Долгосрочные наблюдения за участниками программы показали, что к подростковому возрасту дети, которые участвовали в программе, по своему развитию примерно на год опережали не участвовавших в программе школьников из контрольной группы[13]. Те, кто прошел подготовку, показывали более высокие результаты в тестах оценки способностей к учебе, у них было меньше проблем с поведением, и они, как правило, не требовали особого внимания педагогов и медиков. Хотя перечисленные показатели не отражают непосредственно уровень интеллекта, были выявлены сильные положительные корреляции описанных показателей с результатами традиционных тестов умственных способностей. В ряде более поздних программ были продемонстрированы определенные успехи, которых удавалось добиться, действуя вне рамок домашних и семейных условий. Интересным примером здесь служит «Азбучный проект» Рами и Кэмпбелла (1984, 1992), который позволил в ряде отдельных случаев заметно повысить интеллектуальные способности школьников.
В исследованиях Роберта Бредли и Бетти Колдуэл было показано важное значение домашней среды с точки зрения развития интеллекта у маленьких детей. Эти ученые выявили заметную корреляцию высоких результатов IQ-тестов с рядом факторов в ранней (дошкольной) домашней обстановке: эмоциональная и вербальная отзывчивость главного воспитателя и степень его участия в развитии ребенка; недопустимость необоснованных ограничений и наказаний; организация соответствующей обстановки и активного графика; разнообразие повседневных стимулов и поощрений и возможность их выбора. Кроме того, Бреди и Колдуэл установили, что эти факторы значительно сильнее влияют на рост IQ, чем переменные, отражающие социально-экономический статус или структуру семьи, например количество детей в семье.
Домашняя обстановка особенно важна для детей, потерявших родных и близких. Так, Вэйн Деннис, американский психолог, работавшая в Иране, показала, что дети из ряда сиротских приютов этой страны, которых не усыновили или не удочерили в возрасте до двух лет, как правило, становятся умственно отсталыми. У детей, которые обрели приемных родителей, умственное развитие было в норме. В данном случае не было серьезного вмешательства психологов – дело было в различии условий стимуляции интеллекта и условий воспитания в соответствующих средах. Причем речь идет об очень серьезных вариациях показателей – примерно 50 пунктов IQ. Таким образом, если диапазон изменения качества внешних условий широк, среда может иметь огромное значение. На практике даже скромная, но адекватная среда способна заметно улучшить IQ ребенка, а возможно, и другие аспекты его интеллектуальных способностей.
Одной из наиболее впечатляющих программ совершенствования интеллектуальных способностей был «Проект Одиссей», выполнявшийся в Венесуэле. Проект действовал в период существования в этой стране Министерства развития интеллекта – уникальной ситуации в истории человечества, когда целое государственное учреждение занималось на национальном уровне повышением интеллекта населения[14]. Программа охватывала широкий спектр аналитических и творческих способностей, а результаты ее тщательно оценивались. Принятая при этом система оценки может быть использована в качестве модели контроля подобных программ, поскольку в ней использовался широкий диапазон критериев оценки успешности программы. Результаты исследований были опубликованы в одном из наиболее престижных психологических журналов.
Я упомянул эту программу главным образом для того, чтобы отдать дань авторам системы ее тщательного оценивания, а именно Ричарду Хернштейну и его коллегам (Рэю Никкерсону, Маргарите де Санчес и Джону Светсу). Эти исследования выполнялись в рамках «Проекта интеллекта», целью которого было развитие интеллектуальных способностей у венесуэльских школьников. Хернштейн был тем же самым человеком, который позже на страницах книги «Кривая Белла» написал, что попытки повысить интеллектуальный уровень потерпели сокрушительную неудачу, что это был типичный пример необоснованных претензий, которые никогда не могут быть реализованы на практике. С одной стороны, можно удивляться тому, что соавтор успешной программы и главный автор системы ее оценивания делают затем заключение, что подобные программы обречены на неудачу.
Но, с другой стороны, в этом нет ничего удивительного. Многие области науки настолько политизированы, что в посвященных им дискуссиях часто доминируют не научные, а именно политические подходы. Исследования интеллекта, безусловно, можно отнести к таким наукам, особенно когда речь идет о возможности его совершенствования или о групповых различиях. Политические аргументы сыплются с обеих сторон – и справа, и слева, а опасность политизации заключается как раз в том, что в подобной шумихе могут затеряться действительно научные доводы.
Необходимо различать подлинное совершенствование интеллектуальных способностей от рутинной подготовки к выполнению тестов. Существует, например, немало пособий и курсов, с помощью которых можно повысить результаты тестирования. Эти пособия позволяют «набить руку» на упражнениях, которые чаще других встречаются в стандартных тестах, что имеет слабое отношение к повышению интеллектуального уровня. Я вовсе не утверждаю, что эти пособия и курсы абсолютно бесполезны. Моим детям довольно скоро предстоит прохождение SAT-тестов. Я им купил одно из пособий и буду только рад, если они им воспользуются. Знаю, что этим они не повысят свой интеллект, но могут повысить результаты выпускного тестирования, что позволит поступить в выбранный ими колледж. В среднем такие курсы и пособия позволяют получать заметный выигрыш при выполнении стандартизованных тестов[15]. Умные люди не особо жалуют все эти тесты, но признают необходимость показывать результаты, достаточные для прохождения определенных барьеров в системе образования. Поэтому они не пренебрегают возможностями повышать эти результаты не потому, что это важно для них, а потому, что наше общество придает им, пусть и неоправданно, столь большое значение.
В связи с этими книгами и курсами возникает проблема равноправия. Дело в том, что не у всех найдутся на них время и деньги. И те, кто не может себе их позволить, оказываются в менее выгодном положении. Более того, люди, у которых есть на это свободные средства и время, распределены среди населения далеко не случайным образом. Как правило, это представители средних и верхних средних классов нашего общества. Опять-таки, тесты в среднем больше благоволят тем, кто имеет более выгодные стартовые позиции.
То, о чем мы только что говорили, является частным случаем проявления так называемого «эффекта Матфея». В Библии именно Матфею принадлежат слова о том, что богатые будут со временем богатеть, а бедные – становиться беднее. И это относится не только к деньгам. Эффект Матфея ведет к усилению поляризации при распределении различных ресурсов в обществе – это наблюдается сейчас и в Соединенных Штатах, и в других странах, – а также к обострению противоречий и непонимания между имущими и неимущими.
Что любопытно, в школах, особенно в старших классах, все больше занятий посвящается непосредственной подготовке к тестам. В один из родительских дней я присутствовал на уроке английского языка у моей дочери и наблюдал, как ученики запоминают, а затем повторяют вслух значения трудных слов. Фактически урок был слегка замаскированной подготовкой к SAT-тесту. Вина в этом не только педагогов: они находятся под постоянным давлением как родителей, так и чиновников, заинтересованных в повышении результатов тестирования. Но усвоенный подобным образом словарь очень скоро забывается, поскольку новые слова поступают в память неинтегрированно, вне контекста. Детей не учат, как использовать эти слова и увязывать их с уже накопленными знаниями.
Мы провели исследования, направленные на поиск альтернативных подходов обогащения словарного запаса[16]. Вместо того чтобы заставлять зубрить новые слова, детей в отобранных группах учили узнавать значение слов из контекста. Суть метода состояла в использовании содержащейся в контексте информации, которой часто достаточно для понимания смысла нового слова. Например, дети читают фразу: «Мать смотрела на ребенка сквозь дымку над кипящим варевом». Новым словом для них является «дымка», и детей учат, как на основе имеющейся информации можно сделать вывод, что оно означает, скорее всего, пар или дым. Действительно, ведь в данном случае речь идет о том, что образуется над огнем с кипящей жидкостью и является прозрачным или полупрозрачным для взгляда.
В наших исследованиях участвовали две контрольные группы. Одна группа имела возможность знакомиться с теми же текстами, но там не объясняли, как распознавать значение новых слов на основе контекста. В другой группе ученикам вообще ничего не показывали и не объясняли. Затем сравнивали показатели групп, в которых детей учили работать с контекстом, с результатами двух контрольных групп. Результаты двух последних групп оказались заметно хуже: они существенно отставали в умении разгадывать значения новых слов на основе доступной информации. Контрольные группы особенно между собой не различались. Другими словами, одна лишь практика без соответствующих инструкций не дает заметного эффекта.
Детей необходимо учить «вычислять» значение новых слов. После окончания школы эти навыки помогут им регулярно пополнять свой словарный запас, тогда как механически заученные слова очень скоро выветрятся из памяти. Если вы хотите развивать у людей интеллект, необходимо научить их работать с контекстом, а не заниматься зубрежкой. Есть немало свидетельств того, что умственные способности вполне можно улучшать[17]. Но если мы будем по-прежнему использовать IQ и множество других тестов в качестве единственного критерия оценки интеллекта, то рискуем лишить своих детей и многих знаний, и многих возможностей, без которых трудно стать действительно умными людьми.