Сам феномен ассоциации был описан в философии довольно давно. Например, нидерландский философ Бенедикт Спиноза еще в XVII веке описывал связывание представлений по принципу смежности во времени или пространстве. Научное исследование ассоциативного научения ввел Иван Петрович Павлов. Его условный рефлекс, по сути, и является ассоциативным научением: связыванием двух стимулов, следующих друг за другом. Правда, Павлов изучал научение у собак и только один специфический вид ассоциативного научения: когда связываются нейтральный стимул (например, звонок) и значимый для собаки стимул (еда или электрический ток). Павлов показал, что при совместном предъявлении звонка и еды собака начинает реагировать на звонок так же, как и на еду: выделять слюну.
Ассоциативное научение у людей работает на основе тех же механизмов, однако стимулы могут связываться любые – не обязательно имеющие отношение к еде или боли. Кроме того, изучая научение у собак, нельзя было поставить вопрос о том, необходимо ли сознательно воспринимать связь двух объектов, чтобы эта связь отложилась в памяти. С человеком это возможно, так как мы можем разными способами узнать, осознает человек заучиваемую связь или нет[69].
Как мы видели в классическом примере с собакой Павлова, ассоциативное научение может связывать не только два эмоционально нейтральных стимула, но и нейтральный стимул с эмоционально заряженным, например приятным. Если вместе или сразу после нейтрального стимула мы видим стимул, который нам приятен (например, любимая музыка), первый стимул также начинает нам нравиться. На него как бы распространяется приятное впечатление, которым для нас обладает второй стимул. Так, например, работает реклама: рядом с брендами всегда помещаются красивые улыбающиеся люди и простая приятная музыка, которая понравится максимальному количеству людей.
Ассоциативное научение постоянно сопровождает наше мышление. С одной стороны, оно помогает формировать опыт, нужный для решения тех или иных задач. Например, отдельные признаки математической задачи могут быть связаны в опыте с определенным типом решения (см. примеры с усвоением закономерностей решения разных типов уравнения в главе 3). Тогда ассоциативное научение может подсказать, какой из возможных способов решения можно попробовать использовать. Так же происходит и в других сферах: определенный звук работы двигателя может подсказать нам, с чем, скорее всего, связана проблема в автомобиле.
В этом разделе мы рассмотрели, как впечатления и события, смежные по времени, связываются в нашей памяти, причем для этого не обязательно сознательно замечать эти связи: они всё равно могут проявиться в нашем поведении или мышлении в будущем. В следующем разделе мы рассмотрим, что происходит, когда связываются не два стимула (какой-то звук с каким-то объектом), а наше действие – и что-то приятное (вознаграждение) или неприятное (наказание).
Обусловливание и обучение с подкреплением
Обучение, где связь формируется между стимулом или действием, с одной стороны, и последующим вознаграждением – с другой стороны, имеет свои особенности. Называется такое научение оперантным обусловливанием.
Обусловливание – это формирование условного рефлекса, которое мы рассматривали в предыдущем разделе. А оперантное означает, что эта реакция формируется под воздействием того, что следует вслед за ней. Действие, которое управляется его последствиями, называется оперантом. В качестве такого последствия, связывающего стимул с реакцией, выступает что-то приятное (то есть подкрепление) или неприятное (то есть наказание).
Такой вид научения хорошо известен дрессировщикам животных. Собаке дается сигнал (например, слово «сидеть»), и когда собака делает то, что хочет тренер (садится), она получает то, что ей нравится (лакомство или ласка). Таким образом, здесь формируется связь между стимулом-триггером (слово «сидеть») и действием (смена позы). А закрепляется эта реакция через вознаграждение. Ассоциативное научение больше влияет на наше восприятие: услышав звук колес паровоза, мы ожидаем гудок. Оперантное обусловливание связывает некий сигнал с действием (рис. 4.3).
Рис. 4.3. Классическое обуславливание и оперантное обуславливание
Оно имеет важное значение не только для животных. Когда какое-то действие приводит к желаемому результату, мы начинаем чаще совершать это действие. Если на работе ждут бесплатный кофе и печеньки – приходить на работу будет чуть приятнее и легче, даже если это раннее утро. Можно вознаграждать себя или ребенка за желаемое поведение – например, сделанное вовремя домашнее задание или физическое упражнение. Наградой может быть всё, что вам нравится: сладость, час компьютерной игры или общение в соцсетях. Научение может обеспечиваться также и отрицательным подкреплением, то есть наказанием. Такой вид научения тоже многим знаком.
Как же оперантное обусловливание связано с мышлением? Мыслительный акт тоже можно назвать действием: мы совершаем выбор, в каком направлении развивать рассуждение. Если какие-то мысли или направления рассуждения приводили нас раньше к подкреплению, например к успешному решению задачи, – мы стремимся повторять этот же образ действий. Обратное происходит с мыслями или действиями, которые ведут к неприятным последствиям: за исключением некоторых патологических состояний (стрессовые воспоминания, навязчивые идеи и т. д.), мысли или рассуждения, приводившие к неприятностям, мы стремимся не повторять.
Из вышесказанного следует какой-то неприятный детерминизм: неужели, однажды решив задачу каким-то способом, мы будем всегда решать ее только так? Действительно, ни люди, ни животные себя так не ведут. Нам скучно повторять то, что мы уже делали, и мы имеем склонность к экспериментам. В теории оперантного обусловливания существуют полезные понятия эксплуатации (англ. exploitation) и разведки (англ. exploration) (рис. 4.4). Эксплуатация предполагает повторение прежних удачных действий. Разведка же предполагает эксперимент: иногда люди просто из любопытства пробуют решить привычную задачу новым способом. Например, попробовать зайти в новое кафе по дороге на работу или вообще попробовать другой путь. Люди отличаются друг от друга тем, как часто и в каких ситуациях они склонны к эксплуатации и разведке[70].
Рис. 4.4. Эксплуатация и разведка
Современные исследования показывают, что люди чаще склонны к разведке, когда испытывают положительные эмоции или просто пребывают в хорошем настроении[71]. Отрицательные эмоции, наоборот, скорее способствуют фокусу на том, что точно принесет ожидаемый результат[72]. Действительно, если утро не задалось, вы вряд ли будете экспериментировать с новым путем на работу: если еще из-за этого опоздаете – будет совсем плохо! Некоторые теоретики связывают это с эволюционной биологией нашего поведения: когда организм в опасности и необходимо выжить любой ценой, нужно использовать самый надежный способ из всех возможных. Когда же мы в безопасности, можно попробовать что-то новое, потому что цена ошибки не так высока[73].
Разведка связана с творческим мышлением. Последнее по определению предполагает поиск новых путей решения задачи. Поэтому мы можем сделать вывод, что открытия (большие и маленькие) скорее нас посетят в расслабленном и приятном состоянии (что не отменяет предшествующей сфокусированной работы по сбору информации и перебору привычных решений). Можно сделать и обратный вывод: если нужно решить сложную задачу известным способом, сфокусироваться на знакомом методе – это лучше делать в небольшом напряжении, возможно, даже зарядившись отрицательными эмоциями.
Современная теория оперантного обусловливания указывает на важность неожиданности вознаграждения в научении. Если наше действие привело к неожиданному приятному исходу, это действие скорее закрепится, и мы повторим его в будущем. То же и с неприятным исходом: чем более он неожиданный, тем сильнее он влияет на наше поведение в будущем.
В теории оперантного обусловливания используется понятие «ошибки предсказания». Она может быть положительной (когда результат оказывается лучше, чем мы ожидали) и отрицательной (когда результат оказывается хуже, чем ожидали). Такая ошибка субъективно переживается нами как эмоция: положительная и отрицательная соответственно[74].
Из этого следуют интересные выводы. Так, если мы долго решали какую-то задачу, уже почти отчаялись, но наконец-то, неожиданно для себя, решили ее – мы получим сильную положительную ошибку предсказания и, соответственно, положительную эмоцию. Это объясняет, почему людям бывает интереснее браться за сложные дела, чем за простые: простые не приносят радости при успешном выполнении. Получается, что не только эмоции могут влиять на наше мышление и поведение (негативная эмоция ведет к фокусировке внимания), но и мыслительная деятельность может порождать эмоции.
Оперантное обусловливание лежит в основе большого количества форм нашего поведения и мышления. В главе 1 мы обсуждали бихевиоризм – научное направление, популярное в американской психологии в первой половине ХХ века. Оно пыталось описать всё поведение человека через научение. Однако далеко не все формы поведения и мышления оказалось возможно описать через формирование реакций с подкреплением. Один из главных примеров критики бихевиоризма можно найти в области усвоения языка. Чтобы выучить язык на основе принципов оперантного обусловливания, понадобилось бы очень много времени – намного больше человеческой жизни. Творческое мышление, хотя и может – как мы говорили выше – запускаться разведкой в оперантном обучении, тем не менее функционирует совсем по другим принципам, нежели повторение ранее подкрепленных действий.