а и оказалась в центре внимания – публика считала ее героиней.
Найтингейл первой из женщин стала членом Королевского статистического общества в 1859 году и почетным членом Американской ассоциации статистиков в 1874-м. Знаменитый статистик и основатель первой в мире кафедры статистики Карл Пирсон назвал Найтингейл «предвестницей» будущего развития прикладной статистики[51].
Грегор Мендель: неудачный пример преподнесения результатов
Гораздо менее удачный пример преподнесения итогов анализа (при этом напоминающий о важности этого этапа) можно найти в биографии Грегора Менделя[52]. Родоначальник учения о наследственности Мендель за несколько месяцев до смерти в 1884 году сказал: «Научные исследования приносили мне огромную радость и удовлетворение, и я совершенно уверен в том, что в скором времени весь мир признает результаты моего труда». Мир действительно признал работы Менделя, но на это потребовалось несколько десятилетий. Возможно, если бы великий генетик лучше умел рассказывать о результатах своих исследований, он добился бы признания намного раньше: возможно, даже и при жизни.
Монах Мендель стал одним из первопроходцев в генетике. На тот момент в биологии господствовала теория о том, что наследственные признаки становятся все менее выраженными у каждого последующего поколения. Исследование Менделя, посвященное наследованию тех или иных отличительных признаков, показало, что этот процесс подчиняется определенным законам (позже получившим его имя). Работы Менделя получили заслуженное признание лишь на рубеже XX века, когда те же результаты были получены независимыми исследователями и сформировалась генетика как наука.
Мендель вывел математические принципы наследования отличительных признаков путем прекрасно разработанного тщательного эксперимента, который он проводил на полях монастыря. Для исследований он выбрал обычный горох, поскольку он занимал мало места, был дешев и давал два урожая в год. Мендель выборочно проводил перекрестное опыление растений, обладавших определенными признаками, и наблюдал их проявление у последующих поколений.
В период 1856–1863 годов исследователь терпеливо проводил опыты по перекрестному опылению, закрывая опыленные растения колпачками, чтобы предотвратить случайное опыление насекомыми. После восьми лет упорного труда Мендель вырастил 12 980 кустов гороха от исходных 225 кустов. Он собрал обширную базу данных об их наследственных признаках, чтобы выявить закономерность их наследования. Он обнаружил доминантные и рецессивные наследственные признаки, которые позже были названы генами.
К сожалению, обнародование результатов исследований оказалось далеко не столь эффективным, как сами исследования. Мендель опубликовал результаты своих экспериментов в малоизвестном моравском научном журнале. Экземпляры журналов были разосланы 130 европейским и американским научным обществам и авторитетным исследователям. Тем не менее большого влияния на научную среду того времени это не оказало, и работа Менделя цитировалась всего лишь три раза в последующие 35 лет. Результаты сложного и скрупулезного труда Менделя не были поняты даже современными ему признанными авторитетами в этой области науки. Если бы Мендель был не монахом, а ученым, то, возможно, добился бы больших успехов в продвижении своего проекта и опубликовал бы работу за рубежом. Он пытался установить контакты с зарубежными учеными, отправил свою статью Дарвину и некоторым другим научным светилам. История сохранила имена примерно дюжины из них. Говорят, что Дарвин даже не разрезал страницы в присланном журнале, чтобы прочесть статью Менделя.
Незадолго до смерти Мендель говорил: «Мое время еще придет», – но трудно сказать с уверенностью, верил ли он сам в эти слова. Он умер, так и не узнав, что его открытия изменят последующую историю человечества.
Хотя работа Менделя была столь же блестящей, сколь и беспрецедентной, ученым-биологам потребовалось более тридцати лет, чтобы оценить ее значимость. Лишь в начале XX века его идеи получили распространение, и биологи признали его приоритет в изучении наследственности. Какой отсюда следует вывод? Если вы не хотите, чтобы ваши выдающиеся исследования постигло столь долгое забвение, вы должны уделить достаточно внимания их презентации.
Современные способы представить результаты
В наше время существует множество способов оформления и обнародования результатов анализа, неизвестных во времена Найтингейл и Менделя. Если вы ограничиваетесь распечаткой или выведением на монитор таблиц и графиков, то вы явно не используете весь арсенал средств, имеющихся в вашем распоряжении. Конечно, выбор подходящего инструментария зависит от обстоятельств, особенностей аудитории, и вряд ли вы станете использовать изображения сексапильных девушек в презентации только потому, что они сексапильны.
Тем не менее визуальная аналитика (известная также как визуализация данных) в последние годы развивается очень быстрыми темпами. Если вы используете только секторальные диаграммы или пиктограммы, вы, видимо, лишь поверхностно знакомы с возможностями визуализации данных. Во вставке «Цели и виды визуализации», возможно, описаны не все возможные варианты ее использования, но по крайней мере это наиболее полный список способов визуализации из тех, что мы знаем[53]. Выбор наиболее подходящего вида графиков или диаграмм для решения конкретной задачи может оказаться делом трудным, но прикладное программное обеспечение для визуальной аналитики может отчасти взять решение этой задачи на себя с учетом выбора переменных для анализа. Например, программа SAS Visual Analytics уже это делает: в нее вмонтирована функция под названием Autochart. Если данные содержат, например, «Одну категорию даты/времени и любое количество других категорий и показателей», программа автоматически генерирует гистограмму[54].
ЕСЛИ ВЫ ХОТИТЕ
Увидеть взаимосвязи между координатами опорных точек:
• точечная диаграмма показывает взаимосвязь между двумя переменными в двумерной системе координат;
• матричная диаграмма показывает взаимосвязи иерархических переменных;
• карта показывает значения переменных на двумерной карте разными цветами;
• сетевая диаграмма показывает наличие и прочность взаимосвязей между объектами.
Сравнить набор значений или частот (как правило, для одной переменной):
• столбиковая диаграмма, где высота столбцов отражает значение показателя;
• гистограмма – разновидность столбиковой диаграммы, в которой высота столбцов отражает частоту попадания переменной в определенный интервал;
• пузырьковая диаграмма показывает набор количественных переменных в виде кругов, площади которых соответствуют значениям переменных.
Показать динамику одного показателя относительно другого (обычно времени):
• линейчатый график показывает график одной переменной или нескольких переменных со стандартизированными значениями на плоскости;
• график с наложением – линейчатый график с прямоугольниками различной длины, указывающими на изменения в значениях переменных; может также указывать на изменения различных категорий данных с помощью различного цвета.
Видеть структуру целого, оценить соотношения различных его частей:
• круговая диаграмма показывает распределение значений одной переменной в виде секторов круга;
• карта дерева – технология визуализации, при которой значения данных показаны в иерархической подчиненности, например: Весь мир – Континенты – Страны – Население каждой страны.
Наложить данные на географическую карту:
• накладывание обобщенных данных на географические карты при помощи цветов, пузырьков или выносов, отражающих значения соответствующих переменных.
Анализировать частоту использования слов в тексте:
• облако тегов – визуальное представление частоты употребления тех или иных слов в тексте, когда более часто встречающиеся слова выделяются более крупным шрифтом;
• сеть фраз показывает частоту комбинаций слов, используемых вместе, когда более употребительные словосочетания показаны более крупным шрифтом.
Способы визуализации, перечисленные в этом списке, статичные. Но в последнее время все чаще применяются их динамичные и интерактивные разновидности. Шведский профессор Ханс Рослинг популяризирует их в своем выпуске видеоконференции TED Talk, где методы визуализации применяются для отражения изменения показателей здоровья развитых и развивающихся стран с течением времени[55]. Рослинг создал сайт Gapminder (www.gapminder.org), где приведено множество аналогичных примеров. Скорее всего, популярность использования интерактивной аналитики для отражения динамики показателей в течение определенного периода будет только расти; тем не менее она подходит далеко не для всех типов данных и далеко не всегда нужна.
Иногда можно найти более эффектные способы визуализации данных, чем графика. Например, маркетолог и специалист по стратегиям Винс Барабба, работающий с несколькими крупными компаниями (в том числе с General Motors, Xerox и Kodak – проблемы у них возникли не из-за него!), весьма креативно подошел к вопросу о том, как лучше всего презентовать результаты маркетинговых исследований. В частности, он знал, что топ-менеджеры General Motors используют трехмерные модели автомобилей для презентаций. В какой-то момент, получив особо важные результаты маркетинговых исследований, он решил разработать их трехмерную графическую модель, по которой топ-менеджеры могли совершить виртуальное путешествие. Возможность своими глазами увидеть пики рыночного спроса и виртуально «потрогать» их сделала данные очень выразительными.