та ситуация напоминает мне стихотворение Оливера Уэндела Холмса об “одноконном фаэтоне”. Как вы помните, после столетней службы этого древнего экипажа обнаружилось, что он был столь тщательно сконструирован, что ни колеса, ни верх экипажа, ни оглобли, ни сиденье не содержали какой-либо части, в которой проявился бы неэкономичный излишек степени износа по сравнению с, любой другой частью. Фактически “одноконный фаэтон” представляет вершину техники, а не просто юмористическую фантазию. Если бы обода колес просуществовали чуть дольше, чем спицы, или крылья – чуть дольше, чем оглобли, то эти неизносившиеся части означали бы неиспользование известных экономических ценностей. Эти ценности можно было бы либо отбросить, не причиняя ущерба продолжительности срока службы коляски в целом, или их можно было бы в равной степени перераспределить по всей коляске, чтобы продлить срок ее службы. В самом деле, любое сооружение иной природы, чем “одноконный фаэтон”, сконструировано расточительно.
Это означает, что с точки зрения наибольшей экономии в обслуживании абонентов нежелательно, чтобы процесс моего соединения с абонентом
А,
которому я звоню трижды в день, и абонентом
В,
который для меня представляет только запись в телефонном справочнике, было бы фактом одинакового порядка. Если бы мне были предоставлены несколько более прямые средства соединения с абонентом
А,
тогда удвоение времени, теряемого в ожидании вызова абонента
Б,
было бы вполне компенсировано.
[с.70]
Если, следовательно, было бы возможно без чрезмерных затрат изобрести аппарат, который будет регистрировать мои прошлые вызовы и распределять степень обслуживания в зависимости от частоты предыдущего использования мною телефонных линий, то я получил бы лучшее обслуживание, или менее дорогостоящее, или то и другое.
“Philipslamp company” в Голландии удалось сделать это. Качество се обслуживания было улучшено посредством обратной связи так называемого “высшего логического типа” Рассела. Эта система допускает большее многообразие, большую применимость и работает более эффективно, чем обычное оборудование с энтропической тенденцией более вероятного преодолевать менее вероятное.
Повторяю, обратная связь есть метод управления системой путем включения в нее результатов предшествующего выполнения ею своих задач. Если эти результаты используются просто как цифровые данные для расчета системы и ее регулирования, то мы имеем простую обратную связь, осуществляемую инженером-диспетчером. Однако если информация, поступающая как результат выполнения или невыполнения машиной своих задач, способна изменять общий метод и форму выполнения задач, то мы получаем процесс, который вполне можно назвать процессом научения.
Другой пример процесса научения связан с проблемой конструирования машин, определяющих упреждение цели. В начале второй мировой войны сравнительная неэффективность огня зенитной артиллерии сделала необходимым изобретение приборов, которые следили бы за положением самолета, определяли расстояние до него, вычисляли продолжительность времени, в течение которого артиллерийский снаряд достигнет его, и указывали место, где он будет находиться к концу этого времени. Если бы самолет обладал способностью предпринимать совершенно произвольные действия уклонения, то никакая степень искусства не позволила бы нам воспроизвести пока еще не известное движение самолета в течение отрезка времени между произведением выстрела и приблизительным достижением своей цели артиллерийским снарядом. Однако от многих обстоятельств зависит, что летчик либо не предпринимает, либо не может предпринимать произвольных действий уклонения. Летчик ограничен тем, что если он быстро повернет самолет, то вследствие действия центробежной силы он
[с.71]
потеряет сознание, а также и тем, что механизм управления самолетом и пройденный летчиком курс обучения практически навязывают ему некоторые постоянные навыки управления самолетом, которые проявятся также и в его действиях уклонения. Эти закономерности не являются абсолютными, а представляют собой скорее статистические предпочтения, проявляющиеся большее количество раз. Они могут быть различными у различных летчиков и, конечно, они будут различными у разных самолетов. Вспомним, что в преследовании такой быстро движущейся цели, как самолет, у вычислителя нет времени прибегнуть к помощи своих приборов и определить, где будет находиться самолет. Вся система расчета должна быть вмонтирована в самое управляющую орудием систему. В эту систему расчета должны быть включены данные, зависящие от наших прошлых статистических экспериментов с самолетами данного типа в разнообразных летных условиях. На современной ступени корректирования огня зенитной артиллерии применяется аппарат, который использует либо постоянные данные этого рода, либо наборы ограниченного количества таких постоянных данных. Правильно выбранный набор этих данных можно подключить посредством сознательного действия наводчика орудия.
Однако проблему управления огнем зенитной артиллерии можно также разрешить путем автоматизации. Сама задача определения летной статистики самолета на основе действительного наблюдения его полета, а затем преобразования этих данных в правила управления орудием представляет собой как конкретную, так и математическую задачу. По сравнению с действительным преследованием самолета в соответствии с данными правилами этот процесс является сравнительно медленным действием и предполагает серьезную предварительную работу, проделанную наблюдением предшествовавшего полета самолета. Тем не менее возможно механизировать его продолжительное действие. Мы, следовательно, можем сконструировать зенитное орудие, которое само накапливает статистические данные о движении летящей цели, затем перерабатывает эти сведения, передавая их в систему управления, и, наконец, применяет эту систему управления как быстродействующий способ регулирования своего положения по отношению к зафиксированному местоположению и движению самолета.
[с.72]
Насколько мне известно, такого орудия еще нет, однако эта проблема попадает в рамки исследования, которое мы ведем с целью использования этой проблемы для других задач теории упреждений. Корректировка общего плана наводки и огня орудия в соответствии с особой системой осуществляемых летящей целью движений, по существу, является актом научения. Это является изменением в
программной катушке
вычислительного механизма орудия – изменением не столько цифровых данных, сколько процесса их истолкования. Этот процесс представляет собой фактически очень общий вид обратной связи, воздействующей на весь метод поведения прибора.
Только что рассмотренный здесь усовершенствованный процесс научения пока еще ограничен механическими условиями системы, в которой он совершается, и, очевидно, не соответствует нормальному процессу научения у человека. Однако, исходя из процесса научения у человека, можно вывести совершенно разные методы, какими можно механизировать процесс научения сложного вида. Эти указания даются соответственно локковской теории ассоциации и павловской теории условного рефлекса. Однако, прежде чем рассматривать их, мне хотелось бы сделать некоторые общие замечания, заранее ответив на определенную критику того тезиса, который я выдвину ниже.
Разрешите мне изложить основу, на которой возможно развить теорию научения. Несравнимо большая часть работы неврофизиолога посвящалась исследованию передачи импульсов нервными волокнами, или нейронами, и этот процесс изображается как явление “все или ничего”. То есть если сила возбуждения достигает той точки или порога, с которого она вообще будет распространяться по нервному волокну и не угасает на относительно коротком расстоянии, то оказываемое этим возбуждением воздействие на сравнительно отдаленную точку на нервном волокне, по существу, будет независимым от его первоначальной силы.
Эти нервные импульсы распространяются от нейрона к нейрону через точки контакта между ними, называемые
синапсами,
где один входящий нейрон может соединяться со многими выходящими нейронами, а один выходящий нейрон – со многими входящими нейронами. В этих синапсах посылаемый одним входящим нервным волокном импульс часто является недостаточным для получения эффективного выходящего импульса. Вообще если импульсы,
[с.73]
передаваемые входящими синапсическими сочленениями на данный выходящий нейтрон, слишком немногочисленны, то выходящий нейрон не будет реагировать. Говоря “слишком немногочисленны”, я не обязательно имею в виду то, что все входящие нейроны действуют одинаково, или даже то, что относительно любого ряда входящих активных синапсических сочленений можно раз и навсегда решить, будут ли возбуждаться выходящие нейроны. Я также не намерен игнорировать то обстоятельство, что некоторые входящие нейроны, вместо того чтобы стремиться произвести возбуждение в связанных с ними выходящих нейронах, могут стремиться помешать этим нейронам принять новое возбуждение.
Как бы то ни было, несмотря на то, что прохождение импульсов по нейрону можно описать довольно простым способом как явление “все или ничего”, передача импульса через слой синапсических сочленений обусловливается сложной моделью реагирования, когда некоторые комбинации входящих нейронов, возбуждающихся в течение известного ограниченного времени, будут обусловливать дальнейшее движение сигналов, хотя некоторые другие их комбинации не будут обусловливать это движение. Эти комбинации не представляют собой нечто установленное раз и навсегда, они также не зависят только исключительно от прошлых сигналов, поступивших в синапсичсский слой. Известно, что они изменяются в зависимости от температуры и могут также измениться в зависимости от многих других факторов.
Такое представление о нервной системе соответствует теории машин, состоящих из ряда переключающих устройств, где включение последующего переключателя зависит от действия определенных комбинаций соединенных с ним предшествовавших переключателей, включающихся в то же самое время. Эта действующая по принципу “все или ничего” машина называется