1) ρ(x,y) = 0 тогда и только тогда, когда x = y (аксиома тождества: расстояние между точками равно нулю, если эти точки совпадают);
2) ρ(x,y) = ρ(y,x) (аксиома симметрии: расстояние в обе стороны одинаково);
3) ρ(x,z) ≤ ρ(x,y) + ρ(y,z) (неравенство треугольника — аналог знакомого утверждения из курса геометрии: окружной путь не может быть короче прямого).
Множество X с введенной метрикой называется метрическим пространством. Из приведенных аксиом следует, что метрика — неотрицательная функция. Рассмотрим неравенство треугольника для случая x = z:
0= ρ(x,x) ≤ ρ(x,y)+ ρ(y,x) = 2ρ(x,x), откуда ρ(x,x) ≥ 0.
Понятие метрики позволяет вводить аналог расстояния (или степени близости) в совсем неочевидных случаях, например на бесконечномерном пространстве функций, между строками текста или изображениями; наконец, между распределениями случайных величин. Введение метрики не решает всех проблем, но в отсутствие внятной и корректной метрики легко увязнуть в бесконечном, бурном и бессмысленном споре, который в околокомпьютерной среде известен как «холивар» (от англ. holy war — священная война). Увы, жаркие споры возникают чаще всего уже на этапе выбора метрик, поскольку они сами образуют некое множество, на котором тоже нужно определять отношение порядка «лучше / хуже». Впрочем, можно предложить вполне осмысленный способ рассуждений о сравнимости многомерных объектов, например людей.
В многомерном пространстве параметров каждый объект может быть представлен вектором — набором чисел, определяющих значения критериев, которые его характеризуют. Рассматривая ансамбль векторов (например, человеческое общество), мы увидим, что какие-то из них окажутся сонаправлены или по крайней мере близки по направлениям; вот их-то уже вполне можно сравнивать по длине. В то же время какие-то векторы ортогональны (в геометрическом смысле — перпендикулярны, в более широком — независимы), и соответствующие им люди попросту друг другу непонятны: они по ряду параметров в сопряженных пространствах, как пресловутые физики и лирики. Нет смысла рассуждать о том, что хороший поэт в чем-то лучше либо хуже талантливого инженера или одаренного природой спортсмена. Единственное, о чём можно судить, — о длине вектора, то есть степени одаренности, расстоянии от среднего.
В связи с этим может возникнуть любопытный вопрос: а какая доля случайных векторов в пространстве заданной размерности будет сонаправленной, а какая ортогональной? Как много удастся найти единомышленников или хотя бы тех, с кем можно себя сравнить?
В двумерном мире каждому вектору соответствует одномерное пространство коллинеарных (сонаправленных) и одномерное пространство ортогональных векторов. Если мы рассмотрим «почти» сонаправленные и «почти» ортогональные векторы, то они образуют секторы одинаковой меры (неважно, площади или угла) при одинаковом выборе допустимого отклонения. Иначе говоря, похожих и непохожих объектов при рассмотрении двух критериев будет одинаковое количество (под количеством мы опять понимаем меру на множестве этих критериев, рис. 5.5).
В трехмерном мире картина поменяется. Сонаправленные векторы всё так же образуют одномерное пространство, а вот ортогональные уже заполняют плоскость, двумерное пространство. С точки зрения ортогональных векторов мера сонаправленных уже равна нулю, но все же позволим векторам немного отклониться от курса. Фиксируя их длину R и допуская небольшое отклонение от идеальных направлений на угол Δφ, можно количество почти сонаправленных векторов сопоставить с площадью круговых областей вокруг полюсов 2πR2Δφ2, а число почти ортогональных — с площадью полосы вокруг экватора: 4πR2Δφ. Их отношение 2/Δφ растет неограниченно при уменьшении отклонения Δφ.
В четырехмерном мире ортогональные векторы образуют уже трехмерное пространство, тогда как сонаправленные всё еще лежат в одномерном, и разница в их количестве растет уже пропорционально квадрату отклонения от идеала. Но на этом этапе лучше обратиться к теории вероятностей и выяснить, каковы шансы получить ортогональные или сонаправленные векторы, взяв наугад два вектора из пространства размерности m. Об этом нам расскажет распределение углов между случайными векторами (рис. 5.6). К счастью, рассуждая о площадях многомерных сфер, распределение можно вычислить аналитически и даже представить в конечной форме:
Здесь Γ(x) — гамма-функция, обобщение факториала на вещественные (и даже комплексные) числа. Ее основное свойство: Γ(x + 1) = xΓ(x).
Рис. 5.6. Распределения углов случайных векторов в пространствах различных размерностей
Для двумерного пространства углы распределяются равномерно, для трехмерного — пропорционально синусоидальной функции. Свойства синуса приводят к тому, что плотность вероятности в нуле для m>2 в точности равна нулю. Это согласуется с нашими рассуждениями о том, что сонаправленные векторы образуют множества нулевой меры. Для всех размерностей выше двух мода распределения приходится на 90°, и доля взаимно ортогональных векторов увеличивается по мере роста числа параметров. Самое же главное наблюдение — сонаправленных векторов (имеющих угол около 0° или 180°) практически не остается при достаточно высокой размерности пространства. Если считать более или менее похожими (сонаправленными, сравнимыми) векторы, имеющие угол менее 30°, то при сравнении по двум критериям похожей на какой-то выделенный вектор окажется треть всех случайных векторов, а при увеличении размерности пространства на единицу доля сравнимых векторов будет уменьшаться практически вдвое. Таким образом, мы приходим к векторной формулировке закона арбузной корки:
Или эквивалентно: на вкус и цвет товарищей нет.
Этот странный закольцованный мир
По мере повышения размерности распределение углов становится похожим на нормальное. Однако это не оно, несмотря на характерную колоколообразную форму. Нормальное распределение определено для всей вещественной числовой оси, в нашем же случае значение угла зациклено в пределах от 0 до 180°. Мы попали из поля вещественных чисел на кольцо вычетов — математическую структуру, подобную циферблату на часах, дням недели или остаткам от деления. Применяя привычные нам операции в этом кольцевом мире, нужно быть аккуратным, даже выполняя простые расчеты. Скажем, чему равно среднее значение для двух углов: 30 и 350°? Простое сложение даст ответ 190°, тогда как чертеж покажет, что правильным ответом будет 10°. А чему равно среднее значение равномерного распределения на всей окружности? Оно не определено, хотя площадь под кривой распределения конечна. Даже простое вычисление среднего для набора измеренных углов уже становится нетривиальной задачей, требующей перехода на плоскость (декартову или комплексную). Представьте себе, что вы исследуете зависимость числа обращений граждан в полицию от времени суток и получили гистограмму, показанную на рисунке слева (рис. 5.7).
Рис. 5.7. Гистограмма, показывающая распределение числа событий по времени суток, не отражает цикличности времени и не дает возможности правильно найти среднее значение
Попытка вычислить математическое ожидание для самого неспокойного времени с помощью среднего арифметического даст невнятный результат. Он показан на рисунке вертикальной линией. Правильно будет изобразить нашу гистограмму в полярных координатах и там уже найти математическое ожидание, вычислив угловую координату положения центра масс получившейся фигуры. Ее можно визуализировать, построив из центра координат луч, проходящий через центр масс.
Привычные распределения вероятностей с хорошо известными свойствами на кольцах вычетов «зацикливаются» и становятся своеобразными. На рисунке 5.8 показано, как можно построить аналоги некоторых распределений на окружности. Числовая ось как бы наматывается на окружность, при этом каждый слой спирали суммируется, и в результате мы получаем циклический аналог распределения, имеющий единичную площадь.
Рис. 5.8. Построение циклических экспоненциального (слева) и нормального (справа) распределений (показаны тонкой линией). Тут же приведены графики функций плотности для обыкновенных (линейных) распределений (показаны жирными линиями)
Например, циклическое экспоненциальное распределение (рис. 5.9) описывает случайное положительное отклонение от заданного угла с заданным средним значением. С его помощью можно описать время суток, в которое ожидается появление пуассоновского события. Циклическое нормальное распределение допустимо использовать для описания погрешностей в измерении углов. Хотя, если быть точным, они будут подчиняться другому распределению, но об этом чуть позже. Циклические распределения, хоть они и выглядят несколько однообразно, важны при анализе данных на земном шаре, если их дисперсии сравнимы с длиной экватора, а это характерно для широкого класса задач геофизики, климатологии и других наук о Земле.
Рис. 5.9. Циклический аналог распределения Коши
Любопытно, что при зацикливании свойства распределения могут поменяться радикально. Например, относительная погрешность при измерении нулевой величины описывается распределением Коши. Оно примечательно тем, что ее функция плотности вероятности имеет бесконечную площадь под кривой, так что для этого распределения невозможно вычислить значения среднего и дисперсии: они, в отличие от моды и медианы, для распределения Коши прос