, дополнив его мнимой единицей. И вот, пожалуйста, невозможное стало возможным. Так в чем проблема с делением на ноль?
Дело в том, что и рациональные, и вещественные, и комплексные числа построены так, что все они образуют поля, при этом вся арифметика в них согласована. Но если искусственно ввести нетривиальные делители нуля, то получится иная арифметика, своеобразная и не согласующаяся с привычной нам со школы алгеброй полей. Алгебраическая структура, на которой определены сложение и умножение, а также своеобразное деление для всех элементов, включая ноль, называется колесом[20]. И деление в этой структуре определяется не как бинарная операция x/y, обратная умножению, а как унарный оператор /y, подобный y–1. Таким образом, деление определяется как произведение x∙/y. Кроме того, алгебраическая система дополняется символами /0 и 0/0, которые иногда обозначаются как ∞ и ⊥. Они имеют особенные свойства и не равны ни одному другому элементу системы.
Непротиворечивая система аксиом колеса кроме коммутативности, ассоциативности сложения с умножением содержит следующие правила:
0∙0 = 0
//x = x
/(xy) = /y/x
xz + yz = (x + y)z + 0z
(x + yz)/y = x/y + z + 0y
(x + 0y)z = xz + 0y
/(x + 0y) = /x + 0y
0/0 + x = 0/0
Из этих аксиом неизбежно следует, что в общем случае:
0x ≠ 0, x — x ≠ 0, x/x ≠ 1
Увы, групповые свойства сложения в такой системе нарушаются, поскольку не для всех элементов x выполняется тождество x + 0 = x.
Так что «просто добавить» делители нуля и обратный ему элемент не получится, нужно перестраивать всю систему ради ее непротиворечивости. Подобные трудности возникнут и при попытке искусственно ввести вторую мнимую единицу: согласованную алгебру с двумя единицами создать не получится, а вот с тремя все работает. Так строится кольцо кватернионов. Они широко используются для моделирования вращений в трехмерном пространстве, например в компьютерных играх и симуляциях реальности. Увеличивая число дополнительных мнимых единиц, мы в следующий раз получим «хорошую» самосогласованную алгебру, когда их будет семь; она называется алгеброй октонионов. На нее возлагаются надежды как на способ соединить квантовую теорию и гравитацию, получив «священный Грааль» физики: Теорию Всего. А больше можно? Формально да: при 15 дополнительных единицах строится алгебра седенионов. И — о чудо! — в алгебре седенионов уже есть нетривиальные делители нуля, но сама она, похоже, теряет ценность как алгебраическая система! Так что мы не можем просто придумать что-то новое в математике, если оно как-то не согласуется с существующими, повсеместно используемыми понятиями. Допустимо построить непротиворечивую систему, изучить ее свойства и пользоваться ими для моделирования либо реального мира, либо других систем.
Вернемся к мере. Ее неотрицательность необходима, иначе можно нарушить третье из свойств мер, перечисленных выше: «Мера подмножества не превышает меры множества» (вклад штата Калифорния превысил общий рост по всей стране). Кроме того, при этом теряется польза от аддитивности и становится затруднительно вычислить меру для объединения подмножеств; таким образом, само это понятие теряет свою полезность. Число рабочих мест — полноценная мера (как количественная характеристика конечного множества), а вот рост числа рабочих мест — нет, это уже изменение меры.
Может возникнуть вопрос: а каков же на самом деле был вклад правительства штата Висконсин в борьбу с безработицей? Он имеет смысл, поскольку если бы не было этого вклада, то общий результат по стране был бы заметно меньшим. Корректно ответить несложно. Мы можем рассматривать как меру отдельно положительные и отрицательные вклады и таким образом говорить о том, что Висконсин предоставил 27 % от общего числа новых рабочих мест (результат простого суммирования всех новых работников по стране). В свою очередь, из всех новых безработных 23 % пришлось на жителей штата Миссури.
Измеряем нашу доверчивость
Вернемся к статистике. Из множества разнообразных ее задач мы рассмотрим здесь только одну: проверку статистических гипотез. Для тех, кто уже связал свою жизнь с естественными или социальными науками, в этих примерах не будет чего-то ошеломительно нового. Но это хорошая задача, показывающая ход математической мысли и не уводящая в дебри технических деталей.
Предположим, мы многократно измеряем случайную величину X, имеющую среднее значение μ и стандартное отклонение σ. Согласно центральной предельной теореме, распределение наблюдаемого среднего значения будет близким к нормальному. Из закона больших чисел следует, что его среднее будет стремиться к μ, а из свойств нормального распределения — что после n измерений наблюдаемая дисперсия среднего будет уменьшаться как σ/√n. Стандартное отклонение можно рассматривать как абсолютную погрешность измерения среднего, относительная погрешность при этом будет равна δ = σ/(μ√n). Это общие выводы, не зависящие для достаточно больших значений n от конкретной формы распределения случайной величины X. Из них следуют два полезных правила (не закона).
1. Минимальное число испытаний n должно диктоваться желаемой относительной погрешностью δ. При этом если
то вероятность того, что наблюдаемое среднее останется в пределах заданной погрешности, будет не менее 95 %. При μ, близком к нулю, относительную погрешность лучше заменить на абсолютную.
2. Пусть нулевой гипотезой будет предположение, что наблюдаемое среднее значение равно μ. Тогда, если наблюдаемое среднее не выходит за пределы μ±2σ/√n, вероятность того, что нулевая гипотеза верна, будет не менее 95 %.
При использовании этих правил неизвестное σ можно оценить в первой серии экспериментов при относительно небольших значениях n, после чего уточнить необходимое число экспериментов. Зачастую, если у нас есть предположение о законе распределения, значение σ можно однозначно вывести из значения μ.
Если заменить в этих правилах 2σ на 3σ, степень уверенности вырастет до 99,7 %. Это очень сильное правило, которое в физических науках отделяет предположения от экспериментально установленного факта. В атомной физике критерий истинности — еще более сильное правило 5σ.
Для нас полезно будет рассмотреть приложение этих правил к распределению Бернулли с параметром, которое описывает случайную величину, принимающую ровно два значения, условно «успех» и «неудача», с вероятностью успеха p и неудачи 1 — p. В этом случае μ = p и σ = p(1 — p), так что для необходимого числа экспериментов и доверительного интервала получим такие выражения:
В главе 2 мы упомянули результат, опубликованный Перси Диаконисом и говорящий о принципиальной, хоть и небольшой, нечестности процесса подбрасывания монеты. Напомню: вероятность того, что она выпадет той же стороной, которая была сверху при подбрасывании, оказалась равна 51 %. Насколько велико такое отклонение? Можно ли его заметить в экспериментах?
Примем скучную нулевую гипотезу: монета, подбрасываемая человеком, выпадает совершенно случайно, и результат эксперимента независим от ее начального положения. Что нам нужно для того, чтобы опровергнуть это предположение? Нас интересует точность до второго знака после запятой, которой соответствует абсолютная погрешность, равная 0,005, или относительная: 0,005 / 0,5 = 0,01. Отсюда имеем оценку для n: (2 / 0,01)2 = 40 000. Выделив по секунде на бросок и регистрацию результата, мы обречем себя на полсуток подбрасывания монеты без единого перерыва. Это нижняя оценка; если же мы захотим увеличить абсолютную точность на порядок, нам потребуется в сто раз больше испытаний: либо задействовать сто экспериментаторов, либо три месяца непрерывно бросать монету.
На рисунке показаны результаты 40 000 испытаний для двух «монеток»: идеальной (с 50 %-й вероятностью обоих исходов) и слегка неидеальной (в которой выпадение орла имеет вероятность 55 %), проводимых с целью вычислить вероятность выпадения орла. Слово «монетка» взято в кавычки, потому что на самом деле использовался генератор случайных чисел, подчиняющихся распределению Бернулли. Видно, что только после 2000 испытаний «облака» наблюдаемых значений среднего начинают отчетливо разделяться. Для простоты можно считать, что монетка — неплохой генератор случайного выбора из двух равновероятных вариантов (рис. 4.1).
Рис. 4.1. Эксперименты с подбрасыванием идеальной и слегка неидеальной монетки с целью зафиксировать ее неидеальность
Правило 2σ для распределения Бернулли можно использовать в определении доверительного интервала при построении гистограмм. По сути, каждый столбик гистограммы представляет случайную величину с двумя значениями «попал» — «не попал», где вероятность попадания в выделенный интервал соответствует моделируемой функции вероятности. В качестве демонстрации сгенерируем множество выборок для трех распределений: равномерного, геометрического и нормального, — после чего сравним оценки разброса наблюдаемых данных с наблюдаемым разбросом. И здесь мы вновь видим отголоски центральной предельной теоремы, проявляющиеся в том, что распределение данных вокруг средних значений в гистограммах близко к нормальному. Однако вблизи нуля характер разброса изменяется, распределение точек становится близким к другому, часто встречающемуся