Код креативности. Как искусственный интеллект учится писать, рисовать и думать — Маркус дю Сотой

Алгоритм-дискриминатор группы из Ратгерского университета подобен специалисту по истории искусств, который может оценить, относятся ли те или иные картины к общепризнанным, уже существующим стилям, и заметить, когда в них появляется нечто новаторское. Его соперник, алгоритм-генератор, должен создавать новые работы, отличные от существующих, но признаваемые произведениями искусства. Чтобы разобраться в проблеме нахождения нового, но не слишком нового, Эльгамаль углубился в идеи психолога и философа Д.Э. Берлайна, который утверждал, что для изучения эстетических явлений особенно важна психологическая концепция «возбуждения». Берлайн считал, что к наиболее существенным возбуждающим свойствам эстетики относятся новизна, неожиданность, сложность, неоднозначность и способность озадачивать или запутывать. Тонкость заключается в том, что произведение должно быть новым и удивительным, но не отклоняться от ожидаемого настолько, чтобы возбуждение переросло в отторжение из-за чрезмерной необычности результата.

Эта идея отражена в так называемой кривой Вундта. Если окружающие нас произведения искусства слишком привычны, это вызывает безразличие и скуку. Именно поэтому художники в своей работе никогда по-настоящему не останавливаются на достигнутом: художника (а впоследствии и зрителя) возбуждает нечто отличное от уже знакомого. Но стремление к возбуждению или диссонансу не должно быть слишком сильным, чтобы не попасть на спадающую ветвь кривой Вундта. Художник стремится достичь максимальной гедонистической ценности.

Эльгамаль и его сотрудники запрограммировали свой алгоритм-генератор так, чтобы у него был стимул создавать произведения, стараясь попасть на этот пик кривой Вундта. Ему нужно было стараться максимизировать отличия, в то же время не отходя слишком далеко от стилей, признанных в мире искусства приемлемыми. А алгоритм-дискриминатор должен был сообщать алгоритму-генератору, находит ли он работу слишком вторичной или, наоборот, экстравагантной настолько, что ее нельзя считать произведением искусства. Каждое такое суждение изменяло параметры алгоритма-генератора. Так и работает машинное обучение: алгоритмы изменяются по мере получения новых данных, обучаясь на реакции на свои действия. Разработчики надеялись, что такой двунаправленный обмен информацией приведет алгоритмы к созданию новых произведений, которые попадут в то самое желанное место на кривой Вундта. Эльгамаль называет такие системы творческими состязательными сетями.

Как же отреагировали люди на результаты работы этих алгоритмов? Когда группе любителей искусства показали новые работы, представленные в 2016 году на выставке Арт-Базель, одной из главных ярмарок современного искусства, и предложили сравнить их с произведениями, созданными творческой состязательной сетью Эльгамаля, они нашли компьютерные работы более вдохновляющими и более близкими себе (эти изображения можно увидеть по адресу https://arxiv.org/pdf/1706.07068.pdf).

Возможно, самый весомый признак того, что художественные работы искусственного интеллекта начинают воспринимать всерьез, появился в октябре 2018 года, когда аукционный дом Christie’s первым продал произведение искусства, созданное алгоритмом. Эта картина была результатом работы парижской группы, которая использовала не творческую сеть, разработанную Эльгамалем, а исходную идею генеративной состязательной сети Гудфеллоу. Эта группа обучала свой алгоритм на 15 000 портретов, написанных начиная с XIV века и до наших дней.

В результате получился портрет мужчины в темной одежде с белым воротником с незавершенной прорисовкой лица, которая придает этому персонажу несколько пугающий вид. Портрет странным образом сдвинут от центра, как будто бы модель не очень-то хотела, чтобы ее изображали. Определить период, к которому относится полотно, трудно: стиль портретов XVIII века сочетается в нем с очень современным стилем исполнения, напоминающим работы британского художника Гленна Брауна. Но, возможно, загадочнее всего подпись автора в нижнем углу картины. Вместо имени художника мы находим в нем математическую формулу.

Этот портрет – лишь одна из целой серии работ, созданных алгоритмом. Парижская группа решила проиллюстрировать ими вымышленное генеалогическое древо, описывающее разные поколения семейства Белами. Портрет, проданный на аукционе Christie’s, изображает Эдмона Белами, правнука графа де Белами, портрет которого был куплен частным образом в феврале 2018 года за 12 000 долларов (портрет правнука ушел с аукциона за головокружительную сумму 432 000 долларов). Фамилия была выбрана в честь Гудфеллоу, выдвинувшего идею состязающихся алгоритмов: bel ami[58] – это вольный перевод английского выражения good fellow на французский.

Разумеется, именно к идее обучения на произведениях, созданных художниками в прошлом, и применения полученных знаний для достижения чего-то нового и сводится творческий процесс большинства художников-людей. Современное искусство можно понять только в свете нашего общего прошлого. В конце концов, именно с этим знанием или этой системой отсчета зрители по большей части приходят на встречу с новым искусством. Ни на одно из произведений на выставке Арт-Базель не смотрят люди, никогда ранее не видевшие живописи Пикассо или Мунка. Творчество по большей части проистекает из идеи возмущения настоящего ради создания будущего, которое сохраняет некоторые связи с настоящим, но тем не менее порывает с ним. Это эволюционная модель, и, что особенно интересно, именно ее и переняли алгоритмы.

Такой подход может показаться отвратительно манипулятивным. Идея превращения искусства в цифровой ландшафт с единственной целью – определить точки, которые будут представлять максимальную гедонистическую ценность, выглядит ужасно. Разве не должны великие художники выражать свою сокровенную тоску? Однако и такому альтернативному пути к художественному творчеству может найтись отлично подходящая ему роль. Подобные алгоритмы состязательных сетей могут вывести нас на новые территории, которые мы также считаем искусством, но не решаемся осваивать. Компьютерный код способен находить неиспользованные возможности в искусстве, созданном кодом человеческим.

Посмотрим, как думает алгоритм

Искусство многогранно, но мне кажется, что лучше всего искусство позволяет нам увидеть, как работает разум других. Возможно, в этом и заключается истинный потенциал произведений искусства, создаваемых искусственным интеллектом, потому что они могут помочь человеку наконец разобраться в скрытой от него природе порождающего их компьютерного кода. Если на смену человеку вот-вот должен прийти искусственный интеллект, может быть, имело бы смысл получить некоторое представление о его мировоззрении.

Одна из групп, работающих в компании Google, использовала произведения искусства, создаваемые искусственным интеллектом, для изучения «мыслительных процессов» алгоритмов распознавания визуальных образов, которые она создавала. Как я объяснял в главе 5, были разработаны алгоритмы, способные отличать изображения кошек от изображений бананов при помощи иерархической системы вопросов об изображении, которые задает такой алгоритм. По сути дела, алгоритм пытается определить, что изображено на картинке, играя в 20 вопросов.

Проблема состоит в том, что по мере обучения и развития машины программист постепенно перестает понимать, по каким именно чертам она отличает бананы от кошек. Глядя на необработанный программный код, очень трудно восстановить принципы работы алгоритма. Есть миллионы разных вопросов об изображении, которые алгоритм может задать, и понять, как и почему выбираются именно эти, а не другие вопросы, бывает непросто. Пытаясь понять, как работает алгоритм, группа из Google придумала один хитрый прием: перевернуть программу с ног на голову. Алгоритму дали случайное пиксельное изображение и предложили усилить или выделить те элементы, которые, по его мнению, привели бы к распознаванию идентифицируемых черт. Исследователи надеялись, что результат позволит понять, как работает алгоритм. Такой перевернутый алгоритм назвали DeepDream[59].

Изображения, которые производит DeepDream, кажутся мне, может быть, самой важной формой ИИ-искусства из всех, которые я видел, занимаясь этой темой. Здесь речь не идет о попытках создать новую картину Рембрандта или состязаться с современными художниками на выставке Арт-Базель; эти изображения позволяют нам отчасти разобраться, как алгоритмы распознавания визуальных образов видят мир. Они, возможно, не обладают большой эстетической ценностью, но, на мой взгляд, они выражают главную задачу искусства – попытку увидеть мир чужими глазами и понять мировоззрение другого.

Алгоритм DeepDream работает по тому же принципу, что и сознание человека, который, глядя на изображение, внезапно видит на гренке человеческое лицо, а в облаках – формы животных, хотя на самом деле ничего такого там нет. Мозг человека в ходе эволюции стал чрезвычайно восприимчив к образам животных, поскольку это было необходимо для выживания. Но это значит, что иногда мы видим животных там, где их нет. Алгоритмы распознавания визуальных образов работают похоже. Они выискивают в изображении структуры и интерпретируют их. Находить такие структуры они научились в сжатом процессе эволюции, натренировавшись на тысячах изображений; их выживание зависит от правильной интерпретации таких структур. По сути дела, машинное обучение представляет собой форму цифровой эволюции. Что же видят алгоритмы в цифровом кустарнике?

Результаты, полученные в Google, были весьма поразительными. Буквально ниоткуда начали появляться морские звезды и муравьи. По-видимому, алгоритм обладал способностью не только распознавать изображения, но и генерировать их. Но эта работа была не просто забавной игрой. Она дала интереснейшую информацию о том, как обучался алгоритм. Например, на изображениях гантелей всегда присутствовали руки, держащие гантели. Очевидно, алгоритм узнал о гантелях из изображений тренирующихся людей. Поэтому он не понимал, что этот предмет – не часть человеческого тела и может существовать отдельно от рук.

Предыдущая Стр. 29 из 64 Следующая

Оглавление