terprise Miner. Технология SAS также позволяет производить разработку моделей глубокого обучения. Если в вашей компании есть специалисты, имеющие опыт работы с этими инструментами, вам стоит сделать ставку на них.
В целом, если компания планирует положить когнитивные технологии в основу своей деятельности и использовать их в многочисленных проектах, процессах и продуктах, имеет смысл внедрять сразу несколько инструментов (как с закрытым, так и с открытым кодом) и получать опыт работы с ними. Однако, если когнитивные приложения не имеют для компании такой важности или будут применяться ограниченно, лучше использовать для их разработки внешние технологии и привлекать внештатных специалистов.
Подготовка данных
Если это еще не очевидно, важным условием для эффективного развертывания когнитивных технологий является наличие больших объемов качественных данных. Их доступность особенно значима для приложений на основе машинного обучения. Качественные данные должны быть достоверными, непротиворечивыми и общими для всей организации.
Однако крупным компаниям редко удается достичь этого идеала. Организации сталкиваются с серьезными проблемами качества данных, многие из которых возникают в момент введения данных в системы специалистами по работе с клиентами, а надежных технологий для исправления этих ошибок пока не существует. Кроме того, компании часто получают ключевые данные из множества различных источников – либо из-за относительной самостоятельности их бизнес-подразделений, либо из-за поглощения других организаций, имеющих собственные архитектуры и базы данных. Решение этой проблемы всегда отнимает массу времени и сил, поэтому многие организации уже потеряли надежду упорядочить собственные данные.
Долгое время для решения этих проблем использовались в основном иерархические системы управления данными, что изначально называлось информационной инженерией, а в последнее время стало называться управлением мастер-данными. Такие системы определяют ключевые для организации элементы данных и описывают их взаимосвязи с другими элементами. Цель состоит в создании набора «золотых» записей – корректных и непротиворечивых в рамках всей организации. Если, как это обычно случается, компания находит несколько источников данных для ключевых элементов, она приступает к сверке данных, в ходе которой процессоры правил выявляют совпадения данных. Однако часто правил оказывается слишком много, в результате чего автоматическая сверка данных занимает почти столько же времени, сколько и ручная.
Тем не менее на помощь может прийти ИИ – в частности, технология машинного обучения. Опытный разработчик технологий баз данных и недавний лауреат премии Тьюринга (эквивалент Нобелевской премии в сфере информатики) Майк Стоунбрейкер настаивает, что «обнаружение вероятных совпадений» с помощью машинного обучения гораздо продуктивнее использования подходов на основе правил[148]. Другие автоматизированные или полуавтоматизированные технологии помогают в процессе каталогизации данных, отслеживании сведений об источниках информации и обеспечении исполнения правил руководства данными. Все эти инструменты способствуют решению проблемы управления данными, поэтому любой компании, заинтересованной в использовании своих данных в приложениях ИИ, следует рассмотреть возможность их применения.
Само собой, управление данными – особая тема, которая выходит за рамки данной книги (и это к лучшему, потому что писать и читать о ней не слишком интересно). Однако, прежде чем запускать масштабные проекты в сфере ИИ, необходимо обеспечить доступность качественных данных. Я беседовал с несколькими организациями, ИТ-руководители которых не спешили «открывать дорогу ИИ», поскольку у них просто не было данных надлежащего качества. Кроме того, иногда у организаций просто были другие приоритеты, не позволяющие им сосредоточиться на внедрении когнитивных технологий.
Далее я опишу, какую работу две организации провели со своими данными, прежде чем запускать масштабные ИИ-программы. Одна компания, Bank of Montreal, с помощью относительно традиционных методов управления данными создала возможности для использования ИИ в бизнесе. Другая, GlaxoSmithKline, использовала ИИ для интеграции своих исследовательских данных. Их истории показывают, как именно они готовили свои данные для более широкого внедрения ИИ.
BMO Financial Group, более известная как BMO, находится в Торонто и входит в большую пятерку канадских банков, а также в десятку крупнейших банков Северной Америки[149]. Компания также хорошо представлена в США после приобретения ею Harris Bank и ряда других американских банков.
В последние несколько лет BMO запустила несколько проектов по трансформации технологической инфраструктуры под руководством главного специалиста компании по технологиям и операционной деятельности Жан-Мишеля Ареса и директора по обработке данных Франсуа Жанетта. Задачей первостепенной важности, как и в случае с другими крупными банками, было обеспечение соответствия требованиям регуляторов. Банку также необходимо было усовершенствовать базовые процессы хранения данных и предоставления отчетности. Само собой, банк интересовался технологиями обработки данных и когнитивными инструментами, однако для их корректной работы требуются огромные объемы качественных данных, поэтому первым делом нужно было улучшить инфраструктуру.
Многие необходимые изменения были внедрены к 2017 г. В BMO разработали систему Smart Core, которая должна стать основой для будущей аналитики, обработки данных и функционирования когнитивных технологий. Smart Core обеспечивает предоставление данных, хранит справочные данные, осуществляет руководство данными (задействуя 17 точек управления в масштабах банка) и выступает в качестве накопителя метаданных. Банк уже сэкономил более $100 млн на повторном использовании данных и рационализации хранилища данных. К «умным» аспектам Smart Core относятся платформа обработки данных, включающая несколько аналитических песочниц[150] и программное обеспечение с открытым кодом для машинного обучения, а также программы для роботизированной автоматизации процессов.
Если раньше обработка данных в BMO преследовала в основном оборонительные цели (обеспечение соответствия требованиям регуляторов, обеспечение безопасности и минимизация рисков), то теперь она стала ориентироваться на нападение – привлечение новых клиентов и рост[151]. Компания работает над такими проектами, как анализ пути клиента, совершенствование методов работы с потенциальными клиентами и аналитика неструктурированных клиентских данных. Дополнительные доходы банка уже в несколько раз превысили расходы на рационализацию данных.
Что касается когнитивных технологий, банк в первую очередь интересует машинное обучение и роботизированная автоматизация процессов. Машинное обучение используется для точной сегментации клиентов и предотвращения случаев мошенничества. Роботизированная автоматизация процессов, как и в большинстве компаний, применяется для совершенствования хорошо структурированных внутренних процессов, подразумевающих взаимодействие с многочисленными информационными системами. Например, банк внедрил одного робота РАП в сфере высокорисковых расследований: этот робот собирает данные и осуществляет приоритизацию задач для человеческого вмешательства. Классическая РАП поддерживается технологией оптического распознавания символов, превращающей изображения в текст, и машинным обучением, которое читает неструктурированный текст, оценивает и одобряет решения, сопоставляет данные из разных баз и в каждом из случаев направляет дела наиболее квалифицированным сотрудникам.
В BMO видят много возможностей для РАП, однако Арес и Жанетт полагают, что реализация многих из них окажет серьезное влияние на ИТ-инфраструктуру и бизнес-процессы. Поскольку роботы РАП выступают в качестве пользователей множества внутренних систем, изменение этих систем также требует изменения систем РАП. В отсутствие подробной документации взаимосвязей и внимательного управления изменениями архитектура может развалиться. Что касается процессов, РАП дает банку возможность не только автоматизировать существующие процессы, но и усовершенствовать их после внедрения РАП. К счастью, в отличие от большинства компаний, BMO осуществила подробную документацию текущих бизнес-процессов.
Новые компетенции подталкивают руководителей BMO рассмотреть возможность разработки новых организационных структур для обработки данных и использования когнитивных технологий. До сих пор специалисты по аналитике и когнитивным технологиям были разбросаны по бизнес-подразделениям компании, однако их работа становится все более важной для будущего банка, а потому начинаются разговоры о возможности центральной координации их деятельности. Банк вряд ли сформирует центральную группу обработки данных, однако специалисты по обработке данных из разных подразделений могут войти в группу технологий и операций.
Арес и Жанетт с достаточной скромностью рассказывают о внедрении продвинутых аналитических и когнитивных компетенций, однако их подготовительная работа вызывает восхищение. В лаборатории внедрять продвинутые приложения относительно просто, но в консервативной и регламентированной банковской среде со множеством унаследованных систем это гораздо сложнее.
Многие крупные организации в конце концов понимают, что не располагают средами данных, необходимыми для успешной масштабной работы с ИИ[152]. Для исследовательского подразделения GlaxoSmithKline (GSK) этот день настал в начале 2015 г. Патрик Валланс, который в то время возглавлял подразделение, и его старшие коллеги решили оценить, подходят ли качество и уровень интегрированности их среды данных для применения таких инструментов, как машинное обучение, с целью разработки новых лекарств. Они не только изучили ситуацию GSK, но и сравнили ее с ситуацией других компаний, которые уже вступали в конкуренцию, опираясь на свои аналитические и когнитивные компетенции.