Формула YouTube. Все, что необходимо знать, от старта канала до вирусного контента — страница 9 из 54

Машина трудится… и все работает

Каждый день YouTube рекомендует пользователям сотни миллионов видео на десятках разных языков в каждом уголке мира. На его предложения приходится 75 % времени, которое люди проводят на платформе.

В 2012 году ежедневное время просмотров составляло в среднем около ста миллионов часов. В 2019 году этот показатель достиг умопомрачительного миллиарда часов в день. Один миллиард часов видеоконтента ежедневно потребляется зрителями на одном ресурсе! За семь лет и тысячи, если не десятки тысяч выполненных настроек и корректировок искусственный интеллект стал практически безошибочно рекомендовать видео, которые зрители смотрели бы дольше. Он стал опытным цифровым садовником, который знает, какой продукт выращивать для каждого клиента, основываясь на видео, которыми они «питаются». Вы также можете стать мастером-садовником YouTube, когда вооружитесь правильными инструментами. Просто возьмите свою лопату, потому что мы все еще осваиваем целину.

Глава 4Разбивка алгоритма

Вы только что узнали много нового об истории алгоритмов, на которых работал YouTube с момента его создания, а также о том, что на сегодняшний день они практически совершенны. Но что это значит? Как именно работает навигация? Давайте проясним, что происходит, когда на платформе появляется посетитель.

Как только пользователи заходят на youtube.com, за ними начинают следить. Выглядит это так. Представьте, что, будучи подростком, вы пришли в гости к своему другу, а его надоедливый младший брат не дает вам прохода. Но при этом он не висит на вас, требуя к себе внимания, а молча наблюдает за вашим поведением и выполняет каждую прихоть. Вы хотите перекусить – он бежит на кухню и приносит яблоко. Вы говорите: «Нет, спасибо». Тогда он забирает яблоко и возвращается с пакетом чипсов. Вы едите Cheetos. Затем у вас заходит разговор о Хане Соло, поэтому он бежит в гостиную и включает «Империя наносит ответный удар».

Когда вы придете в следующий раз, он с порога вручит вам печенье и включит «Возвращение джедая». Его предположение о том, что вы, возможно, захотите поесть или посмотреть, основано на вашем последнем визите, и, скорее всего, оно абсолютно точно. Держу пари, вы захотите почаще бывать в этом доме, раз в нем к вам так хорошо относятся и знают, чем угодить. (Если только он не включит «Последнего джедая» или «Соло», тогда в следующий раз вы пойдете к Цукербергу, потому что эти фильмы – полный отстой.)

Допустим, вместо Cheetos вы захотели морковные палочки, а вместо «Звездных войн» – комедию «Офис». В следующий раз вам предложат брокколи и сериал «Парки и зоны отдыха». Концепция работает с любыми предпочтениями.

Эти примеры иллюстрируют цели YouTube:

• Спрогнозировать, что будет смотреть зритель.

• Сохранять его максимальную вовлеченность и удовлетворенность.


То, как эти цели достигаются, разбивается на два процесса:

1) Сбор и использование данных статистики.

2) Алгоритмы (во множественном числе).

1. Сбор и использование данных

Ежедневно ИИ YouTube собирает 80 миллиардов единиц данных о поведении пользователей. Для достижения целей он собирает сведения в двух ключевых областях. Первая область, в которой ведется наблюдение, – это поведение пользователей, вычисляемое с помощью метаданных. Информация о видео основывается на поведении человека, чьи глаза смотрят на экран, а пальцы кликают. «Сигналы удовлетворения» обучают ИИ тому, что предлагать, а что – нет.

Существует конкретный перечень этих сигналов:

• какие видео смотрит пользователь;

• какие видео он пропускает;

• время, которое он тратит на просмотр;

• лайки и дизлайки;

• фидбек «не интересно»;

• опросы после просмотра видео;

• вернется ли он, чтобы пересмотреть или закончить просмотр;

• сохранит ли ссылку, чтобы вернуться и посмотреть позже.

Все эти сигналы питают контур обратной связи удовлетворенности. Этот цикл создается на основе данных, которые алгоритм получает от конкретного поведения. Он «зацикливает» типы видео, которые вам нравятся, с помощью своих предложений. Именно так персонализируется опыт каждого пользователя.

СБОР МЕТАДАННЫХ

Как именно ИИ собирает данные? Наблюдение начинается с превью. Искусственный интеллект YouTube использует передовые технологии набора продуктов ИИ Google. Он работает с программой под названием Cloud Vision (CV), применяющей оптическое распознавание символов (OCR) и изображений для классификации видео на основе превью. CV фиксирует каждый элемент превью и, используя миллиарды единиц данных, уже имеющихся в системе, распознает эти элементы и передает информацию обратно в алгоритм. Например, превью, включающее крупный план лица всемирно известного физика Стивена Хокинга, распознается как таковое в CV, поэтому видео будет помещено в подборку рекомендаций вместе с другими видео, имеющими тег «Стивен Хокинг». Именно так ваши видео обнаруживаются и просматриваются.

Вы хотите перекусить – он бежит на кухню и приносит яблоко. Вы говорите: «Нет, спасибо». Тогда он забирает яблоко и возвращается с пакетом чипсов. Вы едите Cheetos. Затем у вас заходит разговор о Хане Соло, поэтому он бежит в гостиную и включает «Империя наносит ответный удар».

Кроме того, CV использует инструмент «безопасность», который, основываясь на данных, собранных из изображений в превью, определяет, насколько видео безопасно для просмотра всеми аудиториями, или в нем есть темы только для взрослых, кадры насилия или другой сомнительный контент. Программа подтверждает «достоверность» сделанной оценки. Оценка также отражает, насколько точно содержимое видео соответствует тому, что показано в превью.

Cloud Vision позволяет создателям видео загрузить превью и заранее узнать, как оно, скорее всего, будет оценено системой. Если по какой-то причине CV отметит превью как неуместное, вы сможете изменить его перед загрузкой видео. Эта возможность помогает избежать демонетизации и других проблем, с которыми авторы сталкивались в прошлом. Программа помогает действовать на опережение вероятных проблем. CV не дублирует меры безопасности YouTube, но достаточно близка к ним, что позволяет авторам заранее понять, как контент будет оценен платформой. CV может пропустить то, что для YouTube окажется неприемлемым, но все же этого достаточно для предварительного запуска.


Рис. 4.1. Превью с точками данных


ВИДЕОИНТЕЛЛЕКТ

После проверки превью ИИ просматривает каждый кадр видео, создает список кадров и проставляет на них метки. Например, если вы снимаете видео на парковке, ИИ отмечает фасад магазина, людей, цветы, названия брендов и многое другое. Эту информацию он будет использовать для рекомендаций, а также проверит ее на безопасность, как и превью. Знайте, что находится на каждом кадре видео, которое вы создаете! ИИ все заметит и отсортирует, выделит главные объекты и отсеет второстепенные в видео и его метаданных.

ЗАКРЫТЫЕ СУБТИТРЫ

То же самое ИИ делает с речью в видео. У платформы есть функция автоматических субтитров, и ИИ распознает слова в роликах, чтобы дополнить данные об их содержании. Таким образом, просмотр кадров с присвоением меток похож на визуальный просмотр видео, а прослушивание аудио позволяет оценить, что на самом деле произносится. Все поступает в систему.

ЕСТЕСТВЕННЫЙ ЯЗЫК

ИИ также вычленяет фактическую структуру предложения и разбивает ее на схемы. Так он определяет смысл сказанного и особенности стиля изложения, чтобы группировать видео по категориям, а не только по темам. Например, два создателя контента сняли видео о Стивене Хокинге. Но одно из них биографическое или научное, а другое – юмористическое или развлекательное. Несмотря на то, что в обоих роликах говорится об одном человеке, они попадут в разные категории рекомендуемых видео.

НАЗВАНИЕ И ОПИСАНИЕ ВИДЕО

Думаю, вы понимаете, что алгоритм также просматривает заголовок и описание видео, чтобы дополнить то, что он уже узнал из превью, покадрового просмотра и языка. Но он отслеживает все эти сведения только до тех пор, пока не начнут поступать данные о просмотре.

ИИ «знает», что люди могут вводить в заблуждение, но у них не получится скрыть содержание видео. Не добавляйте название и описание к своим роликам бездумно, лишь бы заполнить все поля перед загрузкой. Словоблудие отталкивает, поэтому подбирайте слова с умом. Большинство создателей контента не составляют описание для видео, а ведь это еще одна точка данных, на которую обращает внимание ИИ при ранжировании видео в поиске.

Не добавляйте название и описание к своим роликам бездумно, лишь бы заполнить все поля перед загрузкой. Словоблудие отталкивает, поэтому подбирайте слова с умом.

2. Алгоритмы (во множественном числе)

Знаете ли вы, что у YouTube не один алгоритм? ИИ использует несколько систем, и каждая из них имеет цель и назначение.

Вот базовые функции сайта, которые видят зрители:

• Главная страница;

• Подписки;

• Рекомендации;

• В тренде;

• Уведомления;

• Поиск.

Каждую из этих функций обслуживают отдельные алгоритмы, которые оптимизируются для более высокой точности попадания, и все они включены в ИИ YouTube. У них есть отдельные показатели соответствия, позволяющие определять, что работает для пользователей в каждой конкретной системе. Уровень попаданий отражает, как часто зрители находят то, что действительно хотят посмотреть. Вы знаете, что такое поклевка? Это когда рыба клюет на приманку. Представьте, что вы рыбак, который забросил свою удочку-видео в воду. Потенциальные зрители – это рыбы, заметившие вашу «приманку». Примерно десять из них проплывут мимо, потому что приманка им не понравится. Но найдется рыба, которая скажет: «Выглядит неплохо» и клюнет. Допустим, вы забрасываете удочку 10 раз, и из 100 рыб 10 клюнут. Вот ваш показатель попадания. Скорость попадания очень важна для каждой системы в ИИ. Алгоритмы крайне чувствительны к поведению пользователей и метаданным каждого источника трафика, поэтому они знают, как изменить их, чтобы увеличить частоту попаданий.