Бизнесхак на каждый день. Экономьте время, деньги и силы — страница 25 из 28

244. Забудьте об абсолютной точности

Не стоит в аналитических и финансовых расчетах (речь, конечно, об управленческой отчетности и внутренних расчетах, а не о бухгалтерии) стремиться к абсолютной точности, к трем-четырем знакам после запятой.

Окажется ли решение более взвешенным, если вы будете знать о росте показателя на 1,247 % вместо того, чтобы знать о его росте на 1,2 %? Стоит ли более точный расчет того времени и внимания, которое на него потратите вы / аналитик / маркетер / кто-либо другой из ваших коллег?

245. Что на что влияет. Находим и интерпретируем корреляцию

Корреляция – это статистический показатель, характеризующий силу статистической связи между двумя случайными величинами (наборами наблюдаемых данных).

Коэффициент корреляции любых величин всегда лежит в диапазоне от – 1 до 1. На данном промежутке можно выделить следующие точки и интервалы:

– 1: детерминированная (неслучайная) отрицательная связь. Одна величина растет – другая падает, и наоборот. Связь строгая, то есть величины связаны напрямую.

от – 1 до – 0,8: сильная отрицательная связь. Вообще чем больше коэффициент корреляции (по модулю) тем сильнее связь.

от – 0,8 до 0: слабая отрицательная связь (значения ближе к нулю, скорее всего, означают полное отсутствие связи – такая корреляция может возникать случайно).

0: полное отсутствие связи.

от 0 до 0,8: слабая положительная связь (значения ближе к нулю, скорее всего, означают полное отсутствие связи – такая корреляция может возникать случайно).

от 0,8 до 1: сильная положительная связь.

1: детерминированная (неслучайная, строгая) положительная связь показателей.



Коэффициент корреляции полезен для определения причинно-следственных связей. При этом связь может быть двусторонней (например, привлекательность соцсети и количество зарегистрировавшихся пользователей – так называемый сетевой эффект). Чем привлекательнее социальная сеть, тем больше в ней регистрируется людей. Верно и в обратную сторону: чем больше зарегистрировавшихся пользователей, тем привлекательнее соцсеть.

Часто встречается односторонняя связь, например сложность пожара и количество пожарных, участвовавших в его тушении. Из наблюдаемой положительной корреляции вряд ли стоит делать вывод, что сложность пожара зависит от количества пожарных, или пытаться снизить сложность пожара, уменьшая количество пожарных в команде. Тем не менее обратная взаимосвязь выглядит разумной. При этом помните, что наличие статистической взаимосвязи не обязательно говорит о причинно-следственной связи. Корреляция бывает ложной. Блогер Дмитрий Чернышев в своем Живом Журнале[58] приводит курьезные примеры, в которых присутствует статистическая связь, но явно отсутствует причинно-следственная. Так, есть сильная корреляция между:

• потреблением моцареллы и количеством докторских степеней (один из самых известных примеров);

• потреблением сметаны и количеством мотоциклистов, погибших в ДТП;

• средним возрастом «Мисс Америка» и количеством людей, погибших от горячего пара, и т. д.


Другой пример ложной корреляции – та, что возникает по причине наличия общего тренда. Например, положительная корреляция между числом выехавших на отдых за рубеж и количеством произведенных турбин. Очевидно, что причинно-следственной связи между показателями нет. Но можно предположить, что оба показателя могут зависеть от экономического роста в стране. Значения коэффициента корреляции, близкие к нулю, необязательно говорят об отсутствии причинно-следственной связи – только об отсутствии линейной зависимости, взаимосвязь между величинами может быть более сложной.

Таким образом, при анализе статистической взаимосвязи в первую очередь нужно опираться на логическую объяснимость направления (положительная или отрицательная) и силы взаимосвязи. Если эмпирический опыт подтверждается корреляцией, можно смело ее использовать. Если статистика не соответствует практике, необходимо использовать ее с осторожностью.

Кстати, и наличие корреляции не означает наличия причинно-следственной связи. Возможно, обе величины связаны с какой-то третьей и поэтому коррелируют, но между ними может не быть причинно-следственной связи.

Для расчета коэффициента корреляции в Google Таблицах и Excel (пример демонстрируется в Google Таблицах) есть функция КОРРЕЛ (CORREL). Ее аргументы – это диапазоны с наблюденными значениями показателей.

В примере в столбцах A и B находятся случайные числа (сгенерированные с помощью функции СЛУЧМЕЖДУ (RANDBETWEEN)). Коэффициент корреляции практически нулевой – что вполне естественно. Между двумя массивами случайных чисел связи нет.



Связь можно анализировать и на диаграммах – хорошо подходит точечная:



В следующем примере мы рассчитываем корреляцию между ценой нефти марки Brent и курсом USD/RUB. Связь весьма сильная: –0,82.



Диаграмма для этих данных:



Функция КОРРЕЛ аналогично работает и в Excel.

246. Масштаб оси на графике меняет все

Мы склонны верить точным цифрам и графикам (возможно, вы слышали о том, что в XIX веке высоту Джомолунгмы преувеличили – вместо 29 тысяч футов указали 29 002, чтобы людям не казалось, что расчеты были примерными). Но и статистика, и графики представляют собой поле для манипуляций.

Так, если на графике немного подкорректировать значения вертикальной оси и отобразить неполный период, то совсем небольшие колебания могут выглядеть как тренд или гигантский скачок.

Представьте, что на графике ниже – ВВП некой страны. Неплохой рывок в конце года, не так ли?



Но на самом деле это не рывок, а незначительный рост. И только в рамках полугодия – относительно первого полугодия же не все так радужно. Все дело в том, что диапазон значений оси на первом графике меньше и на нем нет первого полугодия.



Если вы хотите подробнее ознакомиться со статистическими манипуляциями, прочитайте небольшую книгу Дарелла Хаффа «Как лгать при помощи статистики»[59], где анализируются и объясняются все способы манипулирования данными.

247. Соотношение Data Ink

Не используйте объем, затенение и другие визуальные эффекты, которые лишь мешают восприятию графиков и диаграмм.

Существует формула, разработанная Эдвардом Тафти[60] – главным специалистом по информационному дизайну:



Или, если перевести на русский язык:



В идеале это соотношение должно быть равно единице. Но часто оно гораздо ниже, потому что на графике много дополнительных неинформативных элементов. Сравните, например, следующие две круговые диаграммы, отображающие структуру продаж овощной лавки:




Кстати, круговые диаграммы, даже с хорошим коэффициентом Data-Ink, часто проигрывают линейчатым в простоте восприятия сообщения:



Больше о типах диаграмм можно прочитать в книге Джина Желязны «Говори на языке диаграмм»[61].

Приложения

Приложение 1Как быстро и легко проводить опросы, тесты и собирать обратную связь. Google формы

Google Формы – простой инструмент для планирования мероприятий, проведения опросов, сбора обратной связи после мероприятий, проведения тестирований по итогам обучения.

Для создания формы нужно пройти по ссылке https://docs.google.com/forms/ и нажать на иконку со знаком «+» в правом нижнем углу.

После нажатия на кнопку появится новый пустой шаблон формы:



В верхние поля введите название формы и краткое описание, и можно создавать вопросы. Существует несколько видов вопросов (выпадающий список с вариантами появляется при щелчке на текущий тип).



По умолчанию создается вопрос с возможностью выбора ответа из списка. Этот вариант подойдет для случаев, когда респондент должен выбрать только один вариант. Например, в случае с вопросом «В каком отделе вы работаете?».

Текст (строка) и текст (абзац) это вопросы, на которые опрашиваемый может ответить любым текстом. В двух этих вариантах отличается только размерность поля для ввода текста (строка или несколько строк). Этот вариант подойдет для вопросов типа «Опишите кратко ваше впечатление от мастер-класса» или «Кратко охарактеризуйте спикера».

Несколько из списка – вопрос, на который можно выбрать несколько ответов одновременно. Например, на вопрос «Какие задачи вам помог решить тренинг?» можно выбрать несколько ответов из списка.

Раскрывающийся список – это аналог варианта «Один из списка». На такой вопрос тоже можно ответить только одним из вариантов. Отличие в том, что варианты будут появляться в выпадающем списке, а не отображаться на экране сразу.

Шкала – вопрос, на который можно ответить, выбрав оценку из шкалы. Подойдет для вопроса «Как бы вы оценили прошедший тренинг по пятибалльной шкале?». Вы можете выбрать минимальный и максимальный баллы и сделать подписи к ним, чтобы респондент не путался в том, что значит минимальная и максимальная цифры:



Дата и время – ответы, которые могут быть введены только в соответствующем формате. Подойдут для вопросов вида «В какой день вам удобнее присутствовать на обучении?» (отмечу, что если нужно выбрать только из двух-трех вариантов дат, то лучше все-таки использовать тип «Ответ из списка»).

После выбора типа вопроса вы можете начать вводить варианты ответов:



Обратите внимание, что в вопросах со списком можно добавить вариант «Другое». Тогда, если ни один из предложенных вами вариантов респонденту не подойдет, он сможет ответить текстом.

Чтобы добавить новый вопрос, кликните на иконку с плюсом слева.