Искусство мыслить рационально. Шорткаты в математике и в жизни — страница 42 из 61

В общем случае считается, что, чтобы обучить алгоритм различать разные категории объектов, нужно использовать по 1000 изображений каждой из них. Чтобы создать алгоритм, узнающий кошек, нужно взять 1000 изображений кошек, на которых программа сможет обучаться. Большее количество данных не увеличивает процента правильных ответов стандартных алгоритмов машинного обучения. По-видимому, алгоритмы выходят на плато. Но эффективность более сложных программ глубокого обучения все же возрастает по логарифмическому закону.

Знать, какого количества данных может быть достаточно, важно, когда речь идет, например, о выявлении переменных, которые могут влиять на объем продаж. Может быть, вам кажется, что он изменяется в зависимости от дней недели, погоды или радостных или неприятных новостей. Чтобы понять, что именно влияет на продажи, нужно собрать данные. Нужно взять те переменные, которые, как вы считаете, могут влиять на продажи, и посмотреть, каким бывает объем продаж при разных значениях всех этих переменных.

Чтобы узнать, какое минимальное количество данных требуется, чтобы сделать обоснованные выводы, можно использовать регрессионный анализ и правило одной десятой. Если мы рассматриваем 5 переменных, приблизительно 10 × 5 = 50 единиц информации должно быть достаточно, чтобы получить представление о том, как изменения этих параметров отражаются на продажах.

Но пользоваться такими шорткатами следует с осторожностью, потому что иногда они уводят в сторону. Чтобы получить пользу от коллективного разума, важно, чтобы коллектив был разнообразным; точно так же необходимо обеспечивать и разнообразие данных. Когда компания Amazon пыталась разработать искусственный интеллект, который помогал бы просеивать заявки претендентов на рабочие вакансии, она дала ему в качестве образца для поведения профили уже работающих сотрудников. Казалось бы, вполне разумное решение, учитывая, что до тех пор компанию вполне устраивал уровень ее сотрудников. Но, когда ИИ начал забраковывать все резюме, кроме присланных двадцатилетними белыми мужчинами, компания поняла, что алгоритм дискриминирует множество желающих получить в ней работу.

Выявлением таких алгоритмических шорткатов, которые приводят нас не к новым целям, а лишь к старым предрассудкам, занимается Лига алгоритмической справедливости (Algorithmic Justice League), которую основала Джой Буоламвини.

Также важно не отслеживать одновременно слишком много переменных, потому что чем больше их будет, тем с большей вероятностью в них можно будет найти какие-нибудь паттерны. Опасность работы со слишком большим количеством переменных проявилась, когда установку фМРТ (функциональной магнитно-резонансной томографии) использовали в эксперименте, в котором изучали 8064 области мозга, чтобы понять, какие из них могут быть задействованы, когда подопытному показывают разные выражения человеческого лица. Действительно, в 16 областях была обнаружена статистически значимая реакция. Вот только сканировали при этом мозг крупного атлантического лосося, причем мертвого. Исследователи использовали неодушевленные предметы, чтобы исключить из рассмотрения ложноположительные результаты. Но эта история показывает, как опасно просто проводить слишком много измерений, надеясь найти в результатах какие-нибудь паттерны. Исследователи получили за эту работу Шнобелевскую премию, которую присуждают за достижения, которые «заставляют сначала засмеяться, а потом – задуматься»[103].

Один из соавторов этого исследования, Крейг Беннет, объяснял: «Если вы бросаете дротики, имея 1-процентный шанс попасть в “яблочко”, и вы бросите один дротик, вероятность попадания будет равна одному проценту. Но, если вы бросите 30 000 дротиков, вы, скажем так, вероятно, попадете в цель хотя бы несколько раз. Чем больше у вас возможностей получить результат, тем больше вероятность, что вы его получите, даже если это произойдет случайно».

Сколько вам нужно данных, чтобы принять решение?

Телевизионная игра, которую я описал в начале этой главы, – это на самом деле хорошая модель многих задач, с которыми мы сталкиваемся в жизни. Первый человек, с которым у вас случился роман, может быть человеком прекрасным, но следует ли вам вступать с ним в брак или же вас преследует назойливое ощущение, что вы можете найти и кого-нибудь получше? На нем свет клином не сошелся; может быть, есть на свете кто-то, кто окажется «тем самым». Но, если бросить нынешнего партнера, пути назад, как правило, не будет. В какой же момент следует смириться с неизбежным и удовольствоваться тем, что есть?

Классический пример в этом роде дают поиски жилья. Сколько раз случалось так, что вы с первой же попытки находили превосходную квартиру, но потом вам казалось, что, прежде чем окончательно решиться, нужно посмотреть еще несколько вариантов, – и в результате первая прекрасная квартира от вас ускользала?

Ключом к оптимизации шансов на получение лучшего из возможных призов является второе по популярности в математике число – е = 2,71828… Подобно числу π, самому важному в математике, десятичная запись числа е бесконечна и не повторяется. Это число то и дело возникает в самых разных обстоятельствах. Оно есть и в великолепном уравнение Эйлера, объединяющем пять самых важных в математике чисел; я уже говорил о нем во второй главе. Кроме того, оно тесно связано с начислением процентов на вашем банковском счете.

Но, кроме того, число е оказывается шорткатом к получению наилучших шансов выбрать правильный ящик в нашей гипотетической телевизионной игре. Математика доказывает: чтобы составить некоторое представление о величине денежного приза при наличии N ящиков, нужно собрать данные по N/e из них. 1/e = 0,37… То есть речь идет о 37 процентах всех ящиков. После того, как вы их откроете, следует остановиться на том ящике, который будет лучше всех, уже открытых. Это не гарантирует, что вы получите самый большой приз, но в одном случае из трех у вас окажется наибольшая из возможных сумм. Если вы примете решение по результатам, увиденным в меньшем или большем числе ящиков, эта вероятность уменьшится. 37 процентов – оптимальное количество данных, которые нужно собрать перед принятием решения, идет ли речь о ящиках в телевизионной игре, квартирах, ресторанах или даже спутниках жизни. Хотя, когда речь идет о любви, возможно, будет лучше, если ваши избранники не узнают, насколько вы расчетливы.

Шорткат к шорткатам

Принятию решения о направлении, в котором следует развивать идеи нового проекта, во многих случаях помогает информация о личных предпочтениях. Хотя часто говорят, что данные – это новая нефть, все равно важно знать, сколько именно требуется этого топлива, чтобы идеи работали. В слишком большом количестве данных можно утонуть. Если их будет слишком мало, проект так и не сдвинется с места. Статистические шорткаты показывают, что иногда можно обойтись на удивление небольшой выборкой. Рациональные шорткаты играют очень важную роль и при сборе данных. Как показал Марк Твен, покраска забора в одиночку занимает долгое время, но, когда за работу берутся несколько человек, ее удается закончить гораздо быстрее. Работа коллективного разума помогает рождению новых идей, идет ли речь об организации опроса в Twitter, разработке сетевой игры, из которой можно извлекать данные, или определении популярности веб-сайта по данным Google Analytics.

Пит-стоп: Психотерапия

Когда я впервые рассказал своей жене Шани, что пишу книгу о шорткатах, она пришла в ужас. Она психолог и считает, что глубокую, продолжительную работу, необходимую, чтобы пройти курс психотерапии и заново настроить разум, часто ничем не заменить. И все же Шани признала, что даже в психотерапии найдены шорткаты, помогающие разбираться с огромными проблемами в области психического здоровья, с которыми сталкивается общество.

При мысли о визитах к психотерапевту в воображении предстают многие годы, проведенные на кушетке в рассказах о собственном детстве. Но для некоторых состояний существуют очень сильные методы, создающие шорткаты, которые позволяют обойтись без многолетней терапии. Шани посоветовала мне поговорить с доктором Фионой Кеннеди, которая много лет была практикующим психологом, а сейчас обучает других широкому спектру методов интенсивной терапии, разработанных для борьбы с нарушениями психического здоровья. Эти процедуры могут помочь пациентам, страдающим фобиями, тревожным расстройством, депрессией и посттравматическим стрессом, избавляя их от необходимости лечиться целые годы.

Кеннеди считает, что одной из причин успеха этих методов психотерапии было то, что они основаны на более научном подходе. «Представьте себе, что вам предстоит операция на сердце и у вас есть два хирурга. Первый говорит: “Вот история моих операций на сердце. Вот это методы, которые я использую, а это – доля благополучных исходов”. А второй говорит: “Ну, я-то никаких данных не собираю, но я человек творческий, и меня все любят. Я провел множество операций, и с огромным удовольствием”. Кому из них вы доверите свою операцию?» Хотя доказательный научный подход добрался лишь недавно до области психотерапии, он был ключевым элементом успешного внедрения этих методов в системах здравоохранения всего мира.

Вероятно, самый известный психологический шорткат – это КПТ, или когнитивно-поведенческая терапия. КПТ, которую разработал в конце 1960-х и начале 1970-х годов психиатр Аарон Бек, концентрируется на влиянии мыслей, убеждений и отношений человека на его ощущения и поведение и обучает методам приспособления, помогающим справляться с различными проблемами.

Кеннеди вспоминает, как еще студенткой принимала участие в эксперименте, в котором крысам и студентам давали различные задания: «Крысы побеждали студентов с разгромным счетом. Мы все слишком много думали о том, что происходит». Этот эксперимент показывал, что мыслительный процесс может мешать достижению успешного результата. Бек и другие считали, что важнее всего найти способы изменения мыслительного процесса.