Хороша ли его живопись? Честно говоря, не очень. Но почему у Томми после инсульта внезапно возникла эта непреодолимая тяга к живописи? Он попытался рассказать мне, что происходило в его голове, когда им овладел этот творческий порыв: «Я все время воображал молнию, пронзающую одну половину мозга и попадающую в одну клетку, из которой вырывается целое вулканическое извержение пузырьков. И мне казалось, что в каждом пузырьке – они были как пузырьки в пене от Fairy – содержатся миллиарды других пузырьков. И когда они лопнули, тут-то и произошел весь этот творческий взрыв».
Нейробиологические исследования установили, что, подобно алгоритмам, приводящим в действие генеративные состязательные сети в Google Brain, наш мозг тоже обладает двумя активно противоборствующими системами. Одна порождает эксгибиционистское стремление создавать. Творить. Выражать. Вторая система действует как ингибитор, критическое alter ego, которое подвергает сомнению наши идеи, ставит их под вопрос и критикует. Для того чтобы решиться на что-то новое, нам нужно очень точное равновесие между ними. Творческая мысль должна находиться в равновесии с контуром обратной связи, который оценивает мысль, чтобы она могла усовершенствоваться и снова быть выработана.
Судя по всему, инсульт, который перенес Томми, выключил ингибиторную часть его мозга. Ничто не говорило ему, что пора остановиться, что то, что он создает, возможно, не так уж и прекрасно. У него осталась только взрывная эксгибиционистская тяга создавать все новые и новые безумные картины и идеи.
Немецкий художник Пауль Клее выразил это напряжение в своих «Педагогических эскизах»: «Уже в самом начале продуктивного действия, вскоре после первого момента движения к созиданию, возникает противоположное продуктивному – начальное рецептивное движение. Это означает: создающий контролирует, было ли то, что уже возникло, сделано хорошо»[55].
Томми умер от рака в 2012 году, совершенно не сожалея о том, что с ним случилось: «Два инсульта подарили мне одиннадцать лет великолепных приключений, которых не мог ожидать никто».
Стратегия Эльгамаля сводилась к следующему: написать код, имитирующий этот диалог между генератором и фильтром (или дискриминатором), происходящий по большей части бессознательно в уме художника. Сначала ему нужно было создать дискриминатор – алгоритмического специалиста по истории искусств, способного оценивать произведения. Вместе со своим коллегой Бабаком Салехом он начал обучать алгоритм так, чтобы тот мог взять картину, которой он раньше не видел, и классифицировать ее стиль или автора.
Вероятно, крупнейшая база данных оцифрованных изображений содержится на сайте WikiArt: там имеются 81 449 картин 1119 разных художников, созданные на протяжении 1500 лет. Можно ли создать алгоритм, который, натренировавшись на содержимом WikiArt, научится классифицировать стиль или автора случайно выбранной картины? Эльгамаль использовал часть имеющихся данных в качестве тренировочного массива, а остальные данные – для проверки работы алгоритма. Но на поиск чего именно должен быть запрограммирован такой алгоритм? Какие ключевые отличительные черты могут помочь в классификации такой крупной базы данных произведений искусства?
Чтобы распознать художника математическими методами, нужны некие величины, которые можно измерять. Базовый процесс похож на тот, который используется в алгоритме Spotify или Netflix, но вместо индивидуальных вкусов он должен определять отличительные черты. Если ввести измерение двух разных характеристик картин, включенных в массив данных, то каждую картину можно представить графически, в виде точки на двумерном графике. Что же такое следует измерять, чтобы картины Пикассо вдруг оказались собраны в одном углу графика, а картины Ван Гога – в другом?
Например, при измерении одной величины (скажем, количества желтого цвета на картине) можно расположить картины Пикассо (обозначены крестиками) и Ван Гога (обозначены ноликами) на координатной оси следующим образом:
Пока что измерение одной этой характеристики не позволяет нам отделить произведения одного художника от произведений другого. Иногда Пикассо использует небольшое количество желтого, как на картине Р1, которая попадает на нашей шкале в точку с координатой 1. Но в других его работах желтый цвет более выражен, как на картине Р2, которая оказывается в точке 3. Две представленные на графике работы Ван Гога, VG1 и VG2, также содержат разное количество желтого цвета. Измерение желтого нам не помогает.
А что, если мы решим измерить еще одну характеристику (например, количество синего цвета на картинах)? На этот раз мы расположим те же картины на вертикальной оси, по которой отложена величина этой новой характеристики.
От синего тоже выходит мало толку. Мы не можем четко отделить картины Пикассо от картин Ван Гога. Но посмотрите, что происходит, когда мы объединяем эти два измерения и переносим картины в двумерную систему координат. Картина Пикассо Р1 оказывается в точке с координатами (1,2), а картина Ван Гога VG1 – в точке (2,4). Но в этой двумерной системе координат можно построить прямую, отделяющую произведения этих художников друг от друга. Объединив измерения количества синего и желтого, мы получаем график, в нижней половине которого находятся картины Пикассо, а в верхней – картины Ван Гога.
После того как алгоритм научится отличать Пикассо от Ван Гога по этим двум характеристикам, когда ему покажут новую для него картину и предложат определить, Ван Гог это или Пикассо, он измерит эти два параметра, отметит координаты картины на графике, и то, с какой стороны от разделительной линии окажется картина, позволит алгоритму предположить с наибольшей уверенностью, кто из художников был ее автором.
В этом простом примере я выбрал для различения художников цветовые характеристики. Но существует бесчисленное множество других характеристик, которые можно отслеживать. Преимущество машинного обучения состоит в возможности исследования всего пространства возможных измерений и выбора правильного сочетания характеристик, позволяющего отличать одних художников от других, – как мы это сделали в своем простом примере с желтым и синим цветами. Двух параметров будет недостаточно, так что нужно найти достаточное количество явно выраженных элементов, по которым одного художника можно отличить от другого. Введение каждой следующей измеримой переменной увеличивает размерность пространства, в котором мы находим координаты картин, и дает нам больше шансов определить стили художников. К концу этого процесса мы будем размещать картины на многомерном графике, а не в двух измерениях, которые мы видели в своем простом примере.
Выявление измеримых параметров может производиться двумя способами. Программист может внести в код определенные характеристики, которые, по его мнению, могут помочь различать художников: использование пространства, фактуру, форму, геометрию, цвета. Но системы машинного обучения особенно интересны своей способностью заниматься неконтролируемым обучением и самостоятельно находить характеристики, достойные внимания. Человеку, анализирующему дерево решений, иногда бывает трудно определить, на каких именно характеристиках сосредоточивается алгоритм при классификации картин. Самые современные системы компьютерного зрения оценивают более 2000 разных атрибутов изображений, которые называются теперь классемами. С этих атрибутов полезно начинать анализ картин, отобранных программистом в качестве тренировочного материала для алгоритма.
Из наброска графика, представленного выше, мы видели, что для различения Пикассо от Ван Гога достаточно и двумерного пространства. Чтобы подойти к распознаванию стилей в реальном наборе данных, алгоритму пришлось распределять картины по 400-мерному пространству, то есть измерять 400 параметров разного рода. Когда получившийся алгоритм протестировали на картинах, которых он до этого не видел, он сумел правильно определить художников более чем в 50 % случаев, но ему оказалось трудно различать таких живописцев, как Клод Моне и Камиль Писсарро. Оба они были импрессионистами, оба жили в конце XIX и начале XX века.
Интересно отметить, что оба художника посещали Академию Сюиса[56], где и подружились, и эта дружба породила некоторые заметные пересечения в их творчестве.
Группа из Ратгерского университета решила выяснить, сумеет ли ее алгоритм найти в истории искусств моменты резких всплесков творческой энергии, в которые появлялось нечто новое, невиданное до этого. Сможет ли он распознать картины, которые ломали установившиеся стандарты и становились провозвестниками новых стилей живописи? Одни художники постепенно раздвигают пределы существующих традиций, а другие создают радикально новые стили. Способен ли алгоритм определить момент зарождения кубизма или искусства барокко?
Алгоритм уже представил все картины точками, распределенными по многомерному графику. Если добавить к этому графику еще одно измерение – время – и отметить моменты создания этих картин и алгоритм отметит огромное изменение положения картин в многомерном пространстве при продвижении по этой оси времени, будет ли такой скачок соответствовать моменту, который историки искусства назвали бы революцией в творчестве?
Взять, к примеру, «Авиньонских девиц»[57] Пикассо – картину, которая перевернула, по мнению многих, существовавшие до нее стандарты. Когда «Девицы» впервые были выставлены в Париже в 1916 году, реакция на это полотно была чрезвычайно враждебной – как и следует ожидать в случае революционных изменений эстетики. Рецензия, напечатанная в журнале Le Cri de Paris, заявляла: «Кубисты открывают военные действия против здравого смысла, не дожидаясь войны». Но вскоре эта картина уже была признана поворотной точкой в истории искусства. Всего несколько десятилетий спустя художественный критик газеты New York Times писал: «Одним ударом она бросила вызов искусству прошлого и неумолимо изменила искусство будущего». Интересно отметить, что алгоритм тоже сумел заметить радикальное изменение положения этого полотна на многомерном графике по сравнению с современными ему произведениями и определить с высокой вероятностью, что оно резко отличалось от всего, созданного ранее. Может быть, алгоритмы вскоре отодвинут на задний план и художественных критиков New York Times.