Первая волна: ИИ интернета
ИИ интернета уже, вероятно, залез в вашу голову, а если нет – то в ваш бумажник. Вы когда-нибудь ловили себя на том, что битый час смотрите видео на YouTube, хотя не собирались этого делать? Сайт со сверхъестественной догадливостью предлагает вам один за другим ролики, которые вы просто не можете не посмотреть до того, как вернетесь к работе? А Amazon, похоже, знает, что вы хотите купить, раньше, чем вы успеете об этом подумать?
Если да, то вы уже пользуетесь преимуществами ИИ интернета (или уже стали его жертвой, в зависимости от того, как вы оцениваете свое время и деньги).
Первая волна ИИ начала подниматься почти 15 лет назад и набрала полную силу около 2012 года. ИИ интернета – это в основном рекомендательные алгоритмы: они изучают наши личные предпочтения, а затем предлагают контент, подобранный специально для нас. Эффективность этих механизмов зависит от данных, к которым у них есть доступ, и именно крупные интернет-компании в настоящее время располагают самыми большими объемами цифровых данных в мире. Однако эти данные становятся действительно полезными для алгоритмов только после того, как они были «размечены». Но вам, как пользователям, не нужно активно «размечать» что-либо – оценивать контент или привязывать к нему ключевые слова. Ярлыки появляются при сопоставлении части данных с конкретным результатом: «купил» против «не купил», «нажал» против «не нажал», «посмотрел до конца» против «перешел на другое видео». Эти метки – наши покупки, «лайки», просмотры или время пребывания на конкретных страницах – в дальнейшем используются для обучения алгоритмов, чтобы те могли предлагать нам подходящий контент. У обычного пользователя появляется чувство, что интернет «становится лучше» – то есть дает ему то, чего он хочет, – а его интернет-зависимость усиливается. Это еще одно доказательство силы ИИ: он использует данные, чтобы узнать нас как можно лучше, а затем оптимизирует свои действия, приспосабливаясь к нашим желаниям. Такая оптимизация приводит к существенному увеличению прибыли для интернет-компаний, зарабатывающих деньги на кликах: Google, Baidu, Alibaba, YouTube и их аналогов со всего мира. Используя ИИ интернета, Alibaba рекомендует вам продукты, которые вы, скорее всего, купите, Google показывает целевую рекламу, на которую вы обязательно кликнете, а YouTube предлагает видеоролики, которые вам захочется просмотреть. Применив те же методы в другом контексте, компания Cambridge Analytica использовала данные Facebook, чтобы лучше повлиять на американских избирателей во время президентской кампании 2016 года. Кстати, считается, что именно Роберт Мерсер, основатель Cambridge Analytica, первым сказал: «Хорошие данные – это очень много данных»[54].
Алгоритмы и редакторы
Первая волна ИИ породила интернет-компании совершенно нового типа. В Китае лидером среди них является Jinri Toutiao (что означает «Сегодняшние заголовки»). Основанную в 2012 году Toutiao иногда называют китайским BuzzFeed, потому что оба сайта служат агрегаторами, преподносящими пользователю «оптимизированные» под его интересы новости. Но на «оптимизации» под индивидуального пользователя сходство и заканчивается. В BuzzFeed штат молодых редакторов ловко готовит оригинальный контент. «Редакторы» Toutiao – это алгоритмы.
Механизмы ИИ Toutiao ищут в интернете контент, используя инструменты обработки естественного языка и компьютерного зрения для анализа материалов широкой сети партнерских сайтов и утвержденных источников. Затем они, опираясь на прошлое поведение своих пользователей – их клики, данные о прочтении, мнения, комментарии, и так далее, – создают персонализированные новости, соответствующие интересам каждого человека. Алгоритмы приложения даже меняют заголовки, чтобы увеличить число кликов. И чем больше этих кликов, с тем большей точностью Toutiao будет предлагать им контент, который они хотели бы увидеть. Эта положительная обратная связь позволила создать одну из самых востребованных платформ контента в интернете, в приложении которой пользователи проводят в среднем по 74 минуты в день[55].
Отчеты роботов и фейковые новости
Toutiao использует машинное обучение не только для сбора контента, но и для создания статей и контроля над их содержанием. Во время летних Олимпийских игр 2016 года в Рио-де-Жанейро эта компания вместе с Пекинским университетом работала над созданием «журналиста», который мог бы писать короткие заметки об итогах спортивных событий за несколько минут после их завершения. Статьи получались не совсем «художественными», но скорость была невероятной: по окончании некоторых соревнований «репортер» выпускал короткие резюме в течение двух секунд и «охватывал» более 30 спортивных событий в день.
Алгоритмы также используются для выявления сфабрикованных новостей. Первоначально читатели обнаруживали вводящие в заблуждение тексты и сообщали о них – это была, по существу, бесплатная разметка данных. Затем Toutiao использовала эти помеченные данные, чтобы научить алгоритм самостоятельно распознавать фальшивые новости. А затем она пошла настолько далеко, что даже научила отдельный алгоритм такие новости создавать. Далее оба алгоритма заставили соревноваться в том, чтобы обмануть друг друга. В процессе этой борьбы они совершенствовались. Основанный на ИИ подход к контенту принес компании огромную прибыль. К концу 2017 года Toutiao уже оценивалась в 20 млрд долларов и вышла на новый круг финансирования, после которого ее оценка может превысить 30 млрд долларов. Для сравнения, BuzzFeed стоит 1,7 млрд. Прогнозируемые доходы Toutiao на 2018 год составляют сумму между 4,5 и 7,6 млрд долларов. Компания прилагает много усилий, чтобы выйти на зарубежные рынки. После предпринятой в 2016 году неудачной попытки купить Reddit, популярный в США сайт-агрегатор, в 2017 году Toutiao прибрала к рукам французский агрегатор новостей и Musical.ly – китайское приложение для караоке, безумно популярное у американских подростков.
Успех Toutiao наглядно демонстрирует достижения Китая в области ИИ интернета. Имея аудиторию из более чем 700 млн интернет-пользователей, говорящих на одном языке, интернет-гиганты Китая зарабатывают огромные деньги на оптимизации онлайн-услуг с помощью ИИ. Это способствовало и быстрому росту рыночной капитализации Tencent, которая в ноябре 2017 года превысила рыночную капитализацию Facebook, а затем перешагнула показатель в 500 млрд долларов. Прежде этого рубежа не достигала ни одна китайская компания. Оставшиеся позади Alibaba и Amazon теперь были вынуждены соревноваться между собой. Несмотря на сильные позиции Baidu в исследовании ИИ, его мобильные сервисы значительно отстают от продуктов Google. Но эту нишу заполнили быстро выросшие китайские компании вроде Toutiao, которые строят свой бизнес на основе ИИ интернета и уже оцениваются в миллиарды долларов. И прибыль этих интернет-компаний многократно возрастет, когда они научатся еще лучше и дольше удерживать наше внимание и собирать наши клики.
В целом китайские и американские компании примерно одинаково сильны в области ИИ интернета, и их шансы на лидерство составляют приблизительно 50 на 50. Я предвижу, что через пять лет китайские технологические компании добьются небольшого преимущества (60 к 40). Мы ведь помним, что в Китае больше пользователей интернета, чем в Соединенных Штатах и всей Европе, вместе взятых, и эти пользователи легко переводят деньги создателям контента, платформам O2O и другим пользователям. Такая комбинация создает почву для выпуска креативных интернет-приложений на основе ИИ и открывает уникальные возможности для монетизации.
Добавьте к этому хватких и хорошо финансируемых предпринимателей, и вот уже есть пусть не решающее, но вполне существенное преимущество Китая перед Кремниевой долиной.
Однако экономический потенциал, генерируемый первой волной ИИ, в целом ограничен сферой высоких технологий и цифрового мира. Огромные возможности оптимизации с помощью ИИ станут доступны более традиционным компаниям в самых разных областях экономики, когда придет вторая волна – ИИ для бизнеса.
Вторая волна: ИИ для бизнеса
Первая волна ИИ основывается на действиях интернет-пользователей, которые автоматически помечают данные при просмотре. Основная идея ИИ бизнеса заключается в том, что традиционные компании также автоматически помечают огромные объемы данных в течение десятилетий. Например, страховые компании выплачивают страховку при несчастных случаях и выявляют мошенников, банки выдают кредиты и документируют сроки их погашения, а больницы ведут учет диагнозов и показателей выживаемости. Все эти действия создают размеченные точки данных: к каждому набору признаков привязывается определенный результат. Но до недавнего времени наиболее традиционным предприятиям было трудно использовать эти данные на практике. ИИ бизнеса ищет в базах данных скрытые корреляции, которые люди могут не заметить. Он опирается на все когда-либо принятые решения и достигнутые результаты и использует помеченные данные для обучения алгоритма, способного работать лучше самых опытных специалистов. Это потому, что люди обычно делают прогнозы на основе показательных признаков – тех данных, которые тесно связаны с результатом, часто посредством четкой причинно-следственной связи. Например, при прогнозировании вероятности того, что человек заболеет диабетом, показательными признаками будут его вес и индекс массы тела. Алгоритмы ИИ, конечно же, учитывают показательные признаки, но они также принимают во внимание тысячи других, менее заметных факторов: периферийные точки данных, на первый взгляд не важные, но способные повлиять на прогноз при сопоставлении их с десятками миллионов конкретных случаев. Человек нередко не может увидеть в этих корреляциях причинно-следственную связь: например, почему заемщики, которые берут кредиты в среду, погашают эти кредиты быстрее? Но алгоритмы, способные объединить тысячи п