Вероятности и неприятности. Математика повседневной жизни — страница 18 из 40

n ≥ (4∙5/7)/(0,01752∙2/7) ≈ 32 000 дождливых дней. Это потребует около 4∙32000/365 ≈ 360 лет непрерывных метеорологических наблюдений, ведь только каждый четвертый день идет дождь или снег. Увы, данных за такой срок нет. Это даже больше, чем время, которое Камчатка находится в составе России, поэтому шансов выяснить, как обстоят дела «на самом деле», у меня нет. Особенно если учесть, что за это время климат успел измениться разительно — из малого ледникового периода природа выходит в очередной оптимум.

Как же австралийским исследователям удалось зафиксировать отклонение температуры в доли градуса и почему имеет смысл всерьез рассматривать это исследование? Дело в том, что они использовали часовые данные температуры, которые не были «прорежены» каким-либо случайным процессом. Таким образом, за 30 лет метеонаблюдений удалось накопить более четверти миллиона отсчетов с нескольких датчиков, что позволяет уменьшить стандартное отклонение среднего в 500 раз по отношению к стандартному суточному отклонению температуры. Этого вполне достаточно, чтобы говорить о точности в десятые доли градуса. Кроме того, авторы использовали еще один красивый метод, подтверждающий наличие временного цикла: случайное перемешивание временного ряда. Такое перемешивание сохраняет статистические свойства, такие как интенсивность потока событий во времени, однако «стирает» временные закономерности, делая процесс истинно пуассоновским. Сравнение множества синтетических рядов и экспериментального позволяет убедиться в том, что замеченные отклонения процесса от пуассоновского значимы. Таким же образом сейсмолог Александр Гусев показал, что землетрясения в каком-либо районе образуют своеобразный самоподобный поток со свойствами кластеризации[22]. Это означает, что землетрясения имеют обыкновение группироваться во времени, образуя весьма неприятные уплотнения потока. Позже выяснилось, что последовательность крупных вулканических извержений обладает тем же свойством.

Беспорядок внутри самих чисел

Конечно, погоду, как и землетрясения, нельзя описывать пуассоновским процессом. Это динамические процессы, в которых текущее состояние оказывается функцией предыдущих. Почему же наши наблюдения за погодой на выходных говорят в пользу простой стохастической модели? Мы отображаем закономерный процесс формирования осадков на множество дней недели, или, говоря на языке математики, на систему вычетов по модулю семь. Этот процесс способен порождать хаос из вполне упорядоченных рядов данных. Отсюда, например, происходит видимая случайность в последовательности цифр десятичной записи большинства вещественных чисел.

Мы уже говорили о рациональных числах, которые выражаются целочисленными дробями. Они имеют внутреннюю структуру, которая определяется двумя числами: числителем и знаменателем. Но при записи в десятичной форме можно наблюдать скачки от регулярности в представлении таких чисел, как 1/2 = 0,5, или 1/3 = 0,3333… = 0,3 до периодичного повторения уже вполне беспорядочных последовательностей в таких числах, как 1/17 = 0,0588235294117647. Иррациональные числа не имеют конечной или периодической записи в десятичной форме, в последовательности цифр чаще всего царит хаос. Но это не значит, что в таких числах нет порядка! Например, √2, одно из первых иррациональных чисел, встретившихся математикам, в десятичной записи порождает хаотический набор цифр. Однако, с другой стороны, это число можно представить в виде бесконечной цепной дроби:

Нетрудно показать, что эта цепочка действительно равна корню из двух, решив уравнение:

Цепные дроби с повторяющимися коэффициентами записывают коротко, подобно периодическим десятичным дробям, например: √2 = [1;2], √3 = [1;12]. Знаменитое золотое сечение в этом смысле представляет собой проще всего устроенное иррациональное число: φ = [1;1]. Все рациональные числа представляются в виде конечных цепных дробей; часть иррациональных — в виде бесконечных, но периодических, такие числа называют алгебраическими; те же, что не имеют конечной записи даже в такой форме, — трансцендентными. Самое, пожалуй, знаменитое из них — число π, оно порождает хаос как в десятичной записи, так и в виде цепной дроби: π = [3;7,15,1,292,1,1,1,2,1,2,1,14,2,1,…]. А вот число Эйлера e, будучи трансцендентным, в форме цепной дроби проявляет внутреннюю структуру, скрытую в десятичной записи: e = [2;1,2,1,1,4,1,1,6,1,1,8,1,1,10,…].

Наверное, не один математик подозревал мир в коварстве, обнаруживая, что такое нужное, такое фундаментальное число π имеет столь неуловимо сложную хаотичную структуру. Конечно, его можно представить в виде более или менее изящных сумм, произведений, вложенных корней, но все эти ряды, в отличие, например, от цепных дробей, не универсальны и не характеризуют каких-либо особых классов чисел.

Я верю, что математикам будущего откроется какое-нибудь новое фундаментальное представление чисел — столь же универсальное, как цепные дроби, — которое позволит выявить строгий порядок, скрытый природой в числе π, и найти ему подобные.

* * *

Результаты этой главы по большей части отрицательные. И, как автор, желающий удивить читателя скрытыми закономерностями и неожиданными открытиями, я сомневался, стоит ли включать ее в книгу. Но наш разговор о погоде ушел в очень важную тему — о ценности и осмысленности естественнонаучного подхода.

Одна мудрая девочка, Соня Шаталова, глядя на мир сквозь призму аутизма, в десятилетнем возрасте дала очень лаконичное и точное определение: «Наука — это система знаний, основанных на сомнении». Реальный мир зыбок и норовит спрятаться за сложностью, видимой случайностью и ненадежностью измерений. Сомнение в естественных науках неизбежно. Математика представляется царством определенности, в котором, кажется, можно забыть о сомнении. И очень заманчиво спрятаться за его стенами; рассматривать вместо труднопознаваемого мира модели, которые можно исследовать досконально; считать и вычислять, благо формулы готовы переварить что угодно. Но все же математика — наука, и сомнение в ней отражает глубокую внутреннюю честность, не дающую покоя до тех пор, пока математическое построение не очистится от дополнительных предположений и лишних гипотез. В царстве математики говорят на сложном, но стройном языке, пригодном для рассуждений о реальном мире. Именно поэтому так важно хоть немного познакомиться с этим языком, чтобы не позволять цифрам выдавать себя за статистику, фактам — притворяться знанием, а невежеству и манипуляциям противопоставлять настоящую науку.

Глава 5. Закон арбузной корки и нормальность ненормальности

Глядя новости или читая комментарии к ним, мы порой недоумеваем: «Есть в этом мире нормальные люди?!» Вроде должны быть, ведь нас много и в среднем мы наверняка нормальны. Но при этом мудрецы говорят, что каждый из нас уникален. А подростки уверены, что они-то уж точно отличаются от серой массы «нормальных людей» и ни на кого не похожи.

Небольшое отступление о том, что такое «в среднем». Часто можно услышать шутливые фразы о «средней температуре по больнице» или «средней зарплате», не отражающей действительное распределение. В статистике встречаются несколько разных средних. Чаще всего применяются три вида — выборочное среднее (или просто среднее), выборочная медиана и мода.

Пусть у нас есть выборка X = (x1,…,xn). Тогда выборочное среднее — обычное среднее арифметическое (x1+…+xn)/n. Когда мы говорим о среднем росте или средней оценке в школе, обычно подразумеваем именно это.

Однако бывают случаи, когда выборочное среднее не отражает «нужную среднесть». Представьте, что вы считаете средний доход в городе. Если там живет Билл Гейтс, то вы получите завышенный результат с точки зрения любой практической задачи. Для исправления ситуации можно использовать, например, медиану.

Возьмем ту же выборку и упорядочим числа по возрастанию: x(1)x(2)≤…≤x(n). Такое представление называется вариационным рядом. Здесь x(1) — наименьшее число в выборке, x(2) — второе по величине и т. д. Выборочная медиана — среднее по номеру число в вариационном ряду. Если в нем нечетное число элементов (n = 2k + 1), то медиана — элемент x(k+1), а если четное (n = 2k), то медианой обычно считают полусумму двух средних элементов вариационного ряда (x(k) + x(k+1))/2. Иными словами, медиана — такое число, справа и слева от которого в вариационном ряду поровну элементов. Для оценки дохода (а также во всех иных случаях, когда в выборке могут быть значительные выбросы вверх и вниз) медиана подходит гораздо лучше: если в выборку добавить большое (или маленькое) число, то среднее арифметическое изменится сильно, а медиана гораздо слабее.

Наконец, мода — просто самое частое значение в нашей выборке. Приведем простой пример. Представим себе маленькую компанию, в которой работают пять человек. Директор получает 200 тысяч рублей, его заместитель — 100 тысяч, бухгалтер — 50 тысяч, а два рядовых работника — по 20 тысяч. Тогда выборочное среднее (200 000 + 100 000 + 50 000 + 20 000 + 20 000) / 5 = 78 000. Медиана — 50 000 (есть две зарплаты больше этого числа и две меньше). Мода — 20 000 (это значение встречается два раза — чаще других вариантов). Если компания будет зазывать новых работников и утверждать, что средняя зарплата в ней равна 78 000, то это будет формально верно, а на деле надувательство. Здесь нужно ориентироваться на моду: раз вас зовут, то, надо думать, рядовыми работниками, а не директорами.

В этой главе мы поговорим о средних значениях и их репрезентативности. До сих пор мы рассматривали