Внедрение искусственного интеллекта в бизнес-практику. Преимущества и сложности — страница 26 из 47

вероятных совпадений (используя технологию стартапа Tamr, с которым я работаю в качестве консультанта) – иными словами, они находят в разных базах данные, с высокой вероятностью описывающие одно и то же, даже если между ними есть незначительные различия. Раньше это достигалось посредством применения трудоемких методов, но теперь процесс идет гораздо быстрее. Я уже описывал, как GE сравнивает данные о поставщиках на уровне компании. GlaxoSmithKline использовала тот же подход для создания единых репозиториев клинических исследований, биологических испытаний (экспериментов) и генетических данных, что теперь позволяет ученым анализировать гораздо более крупные базы данных, чем в рамках собственных исследований.

Третий способ управления данными – сверка множества документов, которые должны быть одинаковыми, но на практике могут различаться. Еще одна компания, с которой я работаю, RAGE Frameworks (ныне входит в состав Genpact), таким образом сверяет огромное количество контрактов. Она извлекает из контрактов важную информацию (например, объем планируемой поставки конкретного продукта) и производит сверку с другими связанными документами (например, с объемом фактической поставки, зафиксированным в извещениях об отгрузке или транспортных накладных). Если объемы не совпадают, сотрудники могут связаться с поставщиком. При ведении бизнеса возникает множество неточностей, и такая сверка документов может снизить их количество.

Применение в бизнес-процессах

Хотя способность ИИ-инструментов управлять информацией кажется несколько прозаичной, ей находится немало применений. Вот лишь некоторые из них:

● автоматизированное извлечение множества типов информации из множества типов документов и взаимодействий;

● сверка обязательств по контракту с фактическим объемом предоставленных продуктов и услуг;

● сравнение счетов и фактически отпущенных или полученных по ним единиц продукции;

● сопоставление сходных записей во многих базах данных.

Организационные последствия

Некоторые сотрудники выполняют в компаниях задачи такого типа и могут лишиться работы в случае автоматизации или частичной автоматизации их труда. Однако гораздо более типичны ситуации, когда ручная обработка задач настолько трудоемка, что организации вообще отказываются от их выполнения. Например, масштабная унификация данных требует многолетнего труда множества специалистов по обработке данных. В результате лишь немногие организации преуспевают в этой сфере.

Унификация данных открывает аналитикам и специалистам по обработке данных возможности анализировать данные и находить в них новые смыслы. В связи с этим спрос на этих специалистов может повыситься, хотя он высок и сегодня. Кроме того, унификация данных открывает людям широкий спектр возможностей для сотрудничества в рамках организаций, использующих общие данные.

Преграды для широкого внедрения

В техническом отношении применение ИИ для управления данными не представляет особой сложности, а необходимые инструменты и рабочая сила не слишком дороги. Главной преградой на пути к широкому внедрению технологии может стать неосведомленность о проблемах и возможностях их решения – возможно потому, что цель решить их не кажется достаточно интересной и амбициозной. Например, руководители могут не понимать, что положенные по контракту услуги и продукты часто не предоставляются компании, а счета нередко выставляются с ошибками. Советники и поставщики технологий должны объяснить своим клиентам, что внедрение ИИ для управления данными окупается с лихвой.

Понимание человеческой речи и текста

Понимание человеческой речи – одна из старейших задач, стоящих перед исследователями ИИ, и в последние годы технологии справляются с ней все лучше. Сегодня мы стоим на пороге перехода к разговорной коммерции. Как и в случае с распознаванием изображений, прогресс в основном объясняется совершенствованием технологии глубокого обучения. Подобно тому как мы разбиваем изображение на пиксели, а затем превращаем эти пиксели в массив цифр, позволяя статистической модели распознавать лежащие в его основе закономерности, мы можем разбивать на отдельные элементы и звуковые волны.

Эта технология ИИ уже получила достаточно широкое распространение. Велики шансы, что ею снабжен даже ваш смартфон. Возможно, у вас есть недорогое устройство Amazon Echo или Google Home. Все эти машины используют глубокое обучение, чтобы совершенствовать распознавание речи, причем делают это правильно примерно в 95 % случаев. Эндрю Ын, прежде работавший в Стэнфорде и Google, а теперь возглавляющий исследования ИИ в китайской компании Baidu, сумел повысить точность распознавания речи в устройствах этой компании почти до 99 %. Ын утверждает, что 99 %-ная точность позволит речи стать основным способом нашего взаимодействия с машинами[88].

Применение в бизнес-процессах

Если Ын прав, технология распознавания речи найдет немало применений – как сегодня, так и в будущем. Вот далеко не полный список:

● эксплуатация транспортных средств;

● онлайн- и мобильная торговля;

● потребление музыки и других типов контента;

● эксплуатация промышленного оборудования;

● онлайн-тестирования и оценка полученных знаний в сфере образования;

● заказ потребительских и коммерческих товаров;

● онлайн-поддержка и обслуживание клиентов.

Само собой, успех технологии зависит не только от доступности и точности распознавания речи, но и от способности организаций должным образом структурировать информацию и знания. Например, в сфере поддержки и обслуживания клиентов интеллектуальные агенты должны не только понимать, что нужно клиентам (на основании сформулированных клиентами запросов), но и давать верные ответы. Хотя реклама некоторых поставщиков технологий может натолкнуть на мысль, что технология должна просто «поглотить» документы с правильными ответами, на практике все обычно гораздо сложнее.

Любопытно, что в долгосрочной перспективе ИИ может в некоторой степени понизить ценность этой технологии. По мере повышения интеллектуальности и автономии автомобилей, промышленного оборудования и информационных систем будет снижаться необходимость взаимодействовать с ними и отдавать им приказы. Полагаю, в ближайшем будущем потребность в распознавании речи не исчезнет, однако со временем она станет менее острой.

Организационные последствия

Основной задачей многих сотрудников организации остается взаимодействие с другими людьми при помощи речи – например, в кол-центрах. Некоторые сотрудники таких подразделений, само собой, подвергнутся сокращениям в случае широкого внедрения машинного распознавания речи. Вероятнее всего, работы лишатся сотрудники, которые имеют дело с хорошо структурированной информацией и взаимодействуют с клиентами. Агенты, которые решают сложные проблемы клиентов или деятельность которых требует эмоциональной вовлеченности и проявления эмпатии, скорее всего, сохранят работу.

Конечно же, компании могут перевести сотрудников, освободившихся после внедрения технологии распознавания речи, на другие позиции – скажем, вверив им исходящую коммуникацию с клиентами. Так, датский Danske Bank (с использованием машинного обучения на данных об онлайн-поведении) выявил ряд ситуаций, в которых клиенты хотели получить совет, например при переходе на новую работу с другим уровнем зарплаты и пенсионной программой. Затем банк превентивно связался с этими клиентами, что помогло повысить результаты на 62 % в сравнении с проведением традиционных маркетинговых кампаний. Исходящая коммуникация также используется для снижения оттока клиентов – и тоже демонстрирует немалую эффективность. Банк связался более чем с 20 000 клиентов и снизил отток на 70 %[89].

В некоторых кол-центрах, где проводятся эксперименты с инструментами распознавания речи, также обнаружили, что люди лучше машин справляются с первичной классификацией проблем клиентов. Машинам недостает знаний и владения терминологией, чтобы верно определить, в чем проблема клиента. Как только проблема выявлена и описана в понятных системе терминах, можно передавать клиента машине для решения проблемы.

Преграды для широкого внедрения

Можно выявить три основные преграды на пути к широкому внедрению этой технологии. Первая – это вероятность плохого обслуживания или недовольства клиентов. Компании используют автоматизированное распознавание речи годами (как правило, в форме интерактивных систем голосового ответа, или IVR, в кол-центрах), но многих клиентов не удовлетворяет его качество. Многие из нас быстро нажимают на клавиатуре «0» или кричат: «Соедини меня с человеком». Само собой, повышение качества распознавания речи может помочь клиентам забыть о плохом обслуживании в прошлом, однако на это понадобится время. Любые недостатки систем распознавания речи будут только подтверждать недоверие к ним со стороны многих пользователей.

Помимо низкого качества обслуживания, внедрение систем распознавания речи может быть затруднено или замедлено из-за нежелания клиентов взаимодействовать с ними. Например, такие системы редко используются водителями, хотя ими оснащены многие автомобили. Любая новая система требует, чтобы пользователь освоил новые навыки и научился новым моделям поведения, а некоторые пользователи не готовы инвестировать в это свое время.

Наконец, как я отметил выше, граф знаний семантической (а не статистической) системы распознавания речи пока недостаточно детализирован для стимулирования широкого внедрения технологии. Системам распознавания речи нужно будет предвидеть вопросы пользователей и ориентироваться в используемой ими терминологии, а затем предоставлять нужную поддержку в разнообразных ситуациях. Если системы знаний, лежащие в основе технологии распознавания речи, работают не слишком хо