Искусство статистики. Как находить ответы в данных — страница 55 из 56

Кроме того, я должен поблагодарить Кейт Булл не только за важные комментарии по тексту, но и за поддержку как в хорошие (когда я писал в пляжной хижине на Гоа), так и в плохие (в сыром феврале под давлением чрезмерного количества обязательств) времена. Также я глубоко признателен Дэвиду и Клаудии Хардинг за финансовую поддержку и постоянное подбадривание, что позволило мне заниматься интересными вещами в последние десять лет.

Наконец, как бы мне ни хотелось возложить вину на кого-нибудь другого, я должен взять всю ответственность на себя за неизбежные оставшиеся в книге недостатки.

КОД ПРИМЕРОВ

Код на языке R и данные для воспроизведения большей части анализов и рисунков можно найти на сайте https://github.com/dspiegel29/ArtofStatistics. Я благодарен за помощь при подготовке этих материалов.

Список иллюстраций

0.1. Возраст и год смерти жертв Гарольда Шипмана

0.2. Время смерти жертв Гарольда Шипмана

0.3. Цикл решения задач PPDAC

1.1. Уровень выживаемости за 30 дней после операции на сердце

1.2. Процентные доли операций на сердце у детей для разных больниц – круговая диаграмма

1.3. Процентные доли операций на сердце у детей для разных больниц – гистограмма

1.4. Риск употребления бутербродов с беконом

2.1. Банка с жевательными драже

2.2. Различные способы показать догадки о количестве драже в банке

2.3. Графическое изображение догадок о числе драже в банке в логарифмическом масштабе

2.4. Сообщенное количество партнеров противоположного пола за всю жизнь

2.5. Показатели выживаемости в зависимости от количества операций на сердце у детей

2.6. Нулевые коэффициенты корреляции Пирсона

2.7. Тренды мирового населения

2.8. Относительный рост населения по странам

2.9. Популярность имени Дэвид во времени

2.10. Инфографика по сексуальным отношениям и образу жизни

3.1. Диаграмма индуктивного умозаключения

3.2. Распределение новорожденных по массе

5.1. Разброс роста сыновей в зависимости от роста их отцов

5.2. Модель логистической регрессии для данных об операциях на сердце

6.1. Надгробие жертвы «Титаника»

6.2. Сводные данные о выживании для пассажиров «Титаника»

6.3. Дерево классификации для данных о «Титанике»

6.4. ROC-кривые для алгоритмов, использованных для тренировочного и тестового наборов данных

6.5. Вероятности выживания при катастрофе «Титаника»

6.6. Дерево классификации для данных о «Титанике», слишком хорошо подогнанное к данным

6.7. Уровни выживаемости после операции для женщин с раком груди

7.1. Эмпирическое распределение числа сексуальных партнеров для разных размеров выборки

7.2. Бутстрэп-выборки из первоначальной выборки размера 50

7.3. Распределение средних значений для бутстрэп-выборок разных размеров

7.4. Регрессионные прямые для данных Гальтона по росту матерей и дочерей

8.1. Компьютерное моделирование вариантов игр шевалье де Мере

8.2. Дерево ожидаемых количеств для подбрасывания двух монет

8.3. Дерево вероятностей для подбрасывания двух монет

8.4. Дерево ожидаемых количеств для скрининга при раке молочной железы

8.5. Наблюдаемое и ожидаемое количество случаев убийства

9.1. Вероятностное распределение левшей

9.2. Воронкообразный график для уровней смертности от колоректального рака

9.3. График данных опросов общественного мнения «Би-би-си» перед всеобщими выборами 2017 года

9.4. Число ежегодных убийств в Англии и Уэльсе

10.1. Данные о соотношении полов при процедуре крещения в Лондоне

10.2. Эмпирическое распределение разницы между долями женщин и мужчин, которые при скрещивании рук поверх кладут правую/левую руку

10.3. Совокупное количество свидетельств о смерти, подписанных Шипманом

10.4. Статистика для последовательного критерия отношения вероятностей для обнаружения удвоения риска смертности

10.5. Ожидаемые количества для результатов 1000 проверок гипотез

11.1. Дерево ожидаемых количеств для задачи про три монеты

11.2. Дерево ожидаемых количеств для задачи о допинге

11.3. «Обращенное» дерево ожидаемых количеств для задачи о допинге

11.4. «Бильярдный» стол Байеса

12.1. Традиционные информационные потоки для статистических сведений

Список таблиц

1.1. Результаты после детских сердечных операций

1.2. Способы выразить риск рака кишечника при ежедневном употреблении сэндвича с беконом

2.1. Характеристики выборки для предположений о числе драже в банке

2.2. Характеристики выборки числа сексуальных партнеров за всю жизнь

4.1. Результаты Исследования защиты сердца

4.2. Иллюстрация парадокса Симпсона

5.1. Данные о росте родителей и их взрослых детей

5.2. Корреляция между ростом взрослых детей и родителей того же пола

5.3. Результаты множественной линейной регрессии для роста взрослых потомков в зависимости от роста их отцов и матерей

6.1. Матрица ошибок для дерева классификации для тренировочных и тестовых данных о «Титанике»

6.2. Вымышленные прогнозы «вероятности осадков»

6.3. Результаты логистической регрессии для данных о выживании пассажиров «Титаника»

6.4. Эффективность различных алгоритмов для тестового набора данных о «Титанике»

6.5. Доля выживаемости женщин с раком молочной железы, определенная с помощью алгоритма Predict 2.1

7.1. Характеристики для числа сексуальных партнеров за всю жизнь, которое указывали мужчины

7.2. Выборочные средние для числа сексуальных партнеров за всю жизнь, которое указывали мужчины

9.1. Сравнение точных доверительных интервалов и для бутстрэппинга

10.1. Таблица сопряженности полов и положения рук

10.2. Наблюдаемые и ожидаемые количества людей, держащих сверху правую или левую руку, в зависимости от пола