Вполне логично, что компания, например, не хочет передавать права собственности и пользования на информацию о своих клиентах и продуктах или о собственных технологиях сторонней организации, даже если эта организация может значительно повысить ее ценность. Такая информация представляет собой важный корпоративный актив, поэтому компании должны самостоятельно находить способы повысить ее ценность, делая это одним из ключевых аспектов корпоративной стратегии.
Компании-пользователи (а не поставщики), не имеющие намерений продавать свой граф знаний, часто получают его частично от поставщиков технологий, но в итоге дорабатывают его сами или с помощью консультантов из компаний-поставщиков. Возьмем, к примеру, страховую компанию, которая хочет создать интеллектуального агента для взаимодействия с клиентами. Она может заключить соглашение с IBM Watson, IPSoft Amelia или другим поставщиком для предоставления базового графа знаний или диалогов на английском (шведском, итальянском…) языке. Однако поставщик, вероятно, не станет включать в этот граф все аспекты языка и классификации, которые связаны с конкретными продуктами и процессами страховщика, поэтому перед внедрением граф придется доработать. Один специалист по когнитивным технологиям, работающий над созданием подобного интеллектуального агента в страховой компании, в ходе интервью заметил:
Нам нужно понимать намерения клиента, но для этого необходимо использовать старомодную инженерию знаний. Инженер знаний должен сформировать онтологии, создать отдельные кейсы и текстовые классификации, чтобы каждое взаимодействие рассматривалось с точки зрения намерения – как узел в диалоговом графе. Если истинное намерение клиента не вписывается в рамки тех, которые мы предсказывали, система кажется глупой. Очень важно понимать (как нам, так и клиентам), что область дискуссии очень ограниченна. Если знать это заранее и не завышать свои ожидания, можно получить прекрасный результат.
Кадровая стратегия
Любая организация, запускающая когнитивные проекты, должна понять, где искать людей, способных работать с новыми технологиями. Само собой, организации не впервые сталкиваются с дефицитом кадров: прежде им приходилось обеспечивать свою потребность в квалифицированных специалистах по количественному анализу, а затем в специалистах по обработке данных. Хорошая новость в том, что после появления этих проблем университеты (более 400 в одних только США) стали готовить большое количество специалистов по анализу и обработке данных. Плохая новость в том, что этих специалистов, вероятно, не учили когнитивным технологиям и методам. Лишь немногие университетские преподаватели в достаточной мере знакомы с этими технологиями, чтобы рассказывать о них студентам, а те, кто обладает нужными знаниями, в последние несколько лет уже перешли на работу в технологические компании.
Оценки числа хорошо обученных и опытных специалистов по ИИ-технологиям широко варьируются, но все сходятся во мнении, что их пока недостаточно. Монреальский стартап Element AI дает несколько оценок количества квалифицированных специалистов по ИИ в мире, каждый раз по-разному трактуя слово «квалифицированный». Оценки компании варьируются в диапазоне от 5000 до 90 000 специалистов, но при этом они считают важным наличие докторской степени, хотя я сомневаюсь в ее необходимости. Китайская компания TenCent полагает, что в мире насчитывается от 200 000 до 300 000 экспертов по ИИ и опытных ИИ-профессионалов[72]. Как бы то ни было, большинству компаний сложно найти специалистов по ИИ, хотя они чувствуют необходимость в них.
При выборе кадровой стратегии компании имеют те же три варианта, которыми располагают при поиске других квалифицированных специалистов: их можно «покупать», «растить» или «арендовать». «Покупать» людей – значит нанимать тех, кто уже обладает необходимыми навыками. Это особенно сложно, если ваша компания находится за пределами Нью-Йорка, Бостона и области залива Сан-Франциско, а также не готова платить специалистам огромные вознаграждения, включая опционы на покупку акций. Специалистам также важно понимать, что ваша организация располагает огромным массивом данных для работы и берется за интересные и сложные проекты.
«Растить» людей – значит обучать их необходимым навыкам. Делать это гораздо проще, если кандидаты на обучение уже располагают базовыми аналитическими навыками и навыками управления данными. В частности, машинное обучение представляет собой автоматизированную форму аналитики, хотя и с огромным количеством алгоритмов на выбор. Работающие в этой сфере сотрудники должны понимать, какие алгоритмы лежат в основе технологий, какие данные подходят для машинного обучения, а также каким образом следует осуществлять конструирование признаков или манипулировать переменными и их преобразованиями в моделях, чтобы обеспечить соответствие моделей данным. Если обучение посвящено семантическим технологиям (например, определенным формам обработки естественного языка), сосредоточиться стоит на компьютерной лингвистике, то есть использовании компьютерных программ для осуществления семантической ОЕЯ.
Компании довольно редко организуют обучение или переподготовку сотрудников в сфере обработки данных и когнитивных технологий, но делать это следует чаще. Обучение регулярно проводит компания Cisco Systems. В ней разработали дистанционную учебную программу для многообещающих специалистов по обработке данных из двух университетов. Программа рассчитана на девять месяцев. По ее окончании студенты получают от университета сертификаты об освоении науки о данных. Программу прошли несколько сотен специалистов по обработке данных, которые теперь работают в различных подразделениях Cisco. Кроме того, компания создала двухдневную программу для руководителей, в ходе которой профессора бизнес-школ рассказывают, что такое аналитика, наука о данных и когнитивные технологии, и поясняют, как все это применяется при решении бизнес-задач. В программе также освещаются вопросы управления персоналом, когда в штат входят специалисты по обработке данных, и приводятся оценки эффективности их работы.
Кадры также можно «арендовать», то есть нанимать квалифицированных в сфере когнитивных технологий консультантов и привлекать к сотрудничеству поставщиков услуг и технологий. Такую стратегию часто практикуют компании, которые не располагают штатными специалистами для развития когнитивных проектов. Она приносит успех, когда сотрудники компаний-поставщиков и консалтинговых фирм достаточно квалифицированы (но стоит учитывать, что эти организации также страдают от дефицита кадров и склонны преувеличивать квалификацию своих сотрудников). Если компания заинтересована в осуществлении долгосрочных когнитивных проектов, ей следует формировать рабочие группы из приглашенных специалистов и собственных сотрудников.
Кроме того, можно обратиться к четвертой кадровой стратегии, которая хорошо сочетается со всеми описанными выше: можно уделить первостепенное внимание технологиям, способным подкрепить работу непрофессиональных приверженцев ИИ, порой называемых гражданскими специалистами по обработке данных. Например, это можно сделать при использовании технологии автоматизированного машинного обучения, предлагаемой такими компаниями, как DataRobot (бостонская компания, где я являюсь советником), SAS Viya (в подразделении Autotune) и Google (в форме технологии AutoML, которая в настоящее время находится в стадии альфа-тестирования).
Технология DataRobot проводит масштабную чистку данных, описывает недостающие данные, а затем проводит соревнование между целой сотней различных алгоритмов, чтобы определить, какой из них наиболее эффективен для предсказания конкретного исхода. Компания утверждает, что с помощью автоматизированного машинного обучения новые высокодоходные торговые модели может создать даже балерина – на самом деле сотрудник крупного банка, имеющий социологическое образование и отличающийся любовью к балету. Представитель страховой компании описывает другой положительный эффект использования технологии DataRobot:
[Скотт] Бартон [глава отдела исследований и разработок в Farmers Insurance] сначала использовал платформу, загружая страховые данные и проверяя, сумеет ли она предсказать конкретную стоимость в долларах. В сравнении со стандартным, разработанным вручную статистическим подходом избранная модель демонстрировала на 20 % более низкий коэффициент ошибок. «Впечатляюще. Она дает такой результат почти сразу, достаточно просто нажать на кнопку», – говорит он[73].
Кое-кто задается вопросом, не попадут ли неспециалисты впросак, используя автоматизированное машинное обучение, ведь модели легко «перенасытить» прогнозными переменными, нарушив тем самым статистические допущения. Однако в ходе бесед с представителями нескольких компаний, использующих эту технологию, ни один из них не сообщил мне о серьезных проблемах.
Инструменты автоматизированного машинного обучения в рамках структурированного подхода к внедрению методов машинного обучения на уровне организации использовала и другая компания. Этот проект получил название Embedded Machine Learning, или EML. Он реализуется в принадлежащей Kroger компании 84.51°, которая осуществляет аналитику и разрабатывает ИИ-проекты для ритейлера и его поставщиков. Число в названии обозначает широту, на которой лежит город Цинциннати (там находится головной офис компании, работающей с динамическими данными).
Официальная миссия проекта EML, которым руководит Скотт Кроуфорд, заключается в том, чтобы дать организации возможность наилучшим образом применять технологии машинного обучения, оказать поддержку и поспособствовать внедрению технологий. «Дать организации возможность наилучшим образом применять технологии машинного обучения» – значит обеспечить инфраструктуру для эффективного использования и внедрения этих технологий, включая сервера, программы и интерфейс взаимодействия с источниками данных. «Оказать поддержку» – значит определить лучший набор инструментов машинного обучения, а также найти самых квалифицированных аналитиков и специалистов по обработке данных, которые будут использовать эти инструменты. Оценив более 50 инструментов, 84.51° выбрала в качестве предпочтительных языки R, Python и Julia, а основной площадкой для программного обеспечения назначила платформу автоматизированного машинного обучения DataRobot. «Поспособствовать внедрению технологий» – значит провести работу по мотивированию сотрудников применять инструменты путем демонстрации их преимуществ с помощью нескольких прототипов, совместного использования программ и примеров (через Github) и консультирования.