KURT = переменная, задающая эксцесс,
четвертый момент распределения;
SCALE = переменная, задающая ширину, второй момент распределения;
SKEW= переменная, задающая асимметрию, третий момент распределения;
sign() = функция знака, число 1 или -1. Знак Х рассчитывается как X/ ABS(X) для X, не равного 0. Если Х равно нулю, знак будет считаться положительным;
Рисунки 4-8 и 4-9 показывают действие переменной асимметрии на распределение. Отметим несколько важных особенностей параметров LOC, SCALE, SKEW и KURT. За исключением переменной LOC (которая выражена как число стандартных значений для смещения распределения), другие три
Рисунок4-6LOC=0, SCALE =0,5, SKEW = 0, KURT=2
Рисунок4-7LOC=0, SCALE = 2, SKEW = 0, KURT=2,
Рисунок4-8LOC=0, SCALE =1, SKEW =-0,5, KURT = 2.
Рисунок 4-9 LOG = 0, SCALE = 1, SKEW = +0,5, KURT = 2.
переменные являются безразмерными, то есть их значения являются числами, которые характеризуют форму распределения и относятся только к этому распределению. Значения параметров будут другими, если вы примените стандартные измерительные методы, детально описанные в разделе «Величины, описывающие распределения» главы 3. Например, если вы определите один из коэффициентов асимметрии Пирсона на наборе данных, он будет отличаться от значения переменной SKEW для распределений, рассматриваемых здесь. Значения четырех переменных уникальны для рассматриваемого распределения и имеют смысл только в данном контексте. Крайне важен интервал возможных значений этих переменных. Переменная SCALE всегда должна быть положительной, кроме того, она не ограничена сверху. То же самое верно для переменной KURT. На практике, однако, лучше использовать значения от 0,5 до 3, в крайнем случае, от 0,05 до 5. Вы можете использовать значения и за пределами этих крайних точек при условии, что они больше нуля.
Переменная LOC может быть положительной, отрицательной или нулем. Параметр SKEW должен быть больше или равен -1, и меньше или равен +1. Когда SKEW равен +1, вся правая сторона распределения (справа от пика) равна пику. Когда SKEW равен -1, пику равна вся левая сторона распределения. Интервалы значений переменных в общем виде таковы:
(4.08) - бесконечность < LOC < + бесконечность
(4.09) SCALE > 0
(4.10) -1<=SKEW<=+1
(4.11) KURT > О
Рисунки с 4-2 по 4-9 показывают, как легко изменяется распределение. Мы можем подогнать эти четыре параметра таким образом, чтобы получившееся в результате распределение было похоже на любое другое распределение.
Подгонка параметров распределения
Как и в процедуре, описанной в главе 3, по поиску оптимального f при нормальном распределении, мы должны преобразовать необработанные торговые данные в стандартные единицы. Сначала мы вычтем среднее из каждой сделки, а затем разделим полученное значение на стандартное отклонение. Далее мы будем работать с данными в стандартных единицах. После того как
мы приведем сделки к стандартным значениям, можно отсортировать их в порядке возрастания. На основе полученных данных мы сможем провести тест К-С. Нашей целью является поиск таких значений LOC, SCALE, SKEW и KURT, которые наилучшим образом подходят для фактического распределения сделок. Для определения «наилучшего приближения» мы полагаемся на тест К-С. Рассчитаем значения параметров, используя «метод грубой силы двадцатого века». Мы просчитаем каждую комбинацию для KURT от 3 до 0,5 с шагом -0,1 (мы можем также взять интервал от 0,5 до 3 с шагом 0,1, так как направление не имеет значения). Далее просчитаем каждую комбинацию для SCALE от 3 до 0,5 с шагом -0,1. Пока оставим LOC и SKEW равными 0. Таким образом, нам надо обработать следующие комбинации:
LOC | SCALE | SKEW | KURT |
0 | 3 | 0 | 3 |
о | 3 | 0 | 2,9 |
о | 3 | 0 | 2,8 |
о | 3 | 0 | 2,7 |
о | 3 | 0 | 2,6 |
о | 3 | 0 | 2,5 |
о | 3 | 0 | 2,4 |
о | 3 | 0 | 2,3 |
о | 3 | 0 | 2,2 |
о | 3 | 0 | 2,1 |
о | 3 | 0 | 2 |
о | 3 | 0 | 1,9 |
* | * | * | * |
* | * | * | * |
* | * | * | * |
о | 2,9 | 0 | 3 |
о | 2,9 | 0 | 2,9 |
* | * | * | * |
* | * | * | * |
* | * | * | * |
о | 0,5 | 0 | 0,6 |
о | 0,5 | 0 | 0,5 |
Для каждой комбинации проведем тест К-С. Комбинацию, которая даст наименьшую статистику К-С, будем считать оптимальной для параметров SKALE и KURT (на данный момент). Чтобы провести тест К-С для каждой комбинации, нам необходимо как фактическое распределение, так и теоретическое распределение (определяемое параметрами тестируемого характеристического распределения). Мы уже знаем, как создать функцию распределения вероятности X/N, где N является общим числом сделок, а Х является рангом (от 1 до N) данной сделки. Теперь нам надо рассчитать ФРВ для теоретического распределения при данных значениях параметров LOC, SCALE, SKEW и KURT. У нас есть характеристическая функция регулируемого распределения, она задается уравнением (4.06). Чтобы получить ФРВ из характеристической функции, необходимо найти интеграл характеристической функции. Мы обозначаем интеграл, т.е. площадь под кривой характеристической функции в точке X, как N(X). Таким образом, так как уравнение (4.06) дает первую производную интеграла, мы обозначим уравнение (4.06) как N'(X). В большинстве случаев вы не сможете вывести интеграл функции, даже если вы опытный математик. Поэтому вместо интегрирования функции (4.06) мы будем использовать другой метод. Этот метод потребует больших усилий, но он применим к любой функции.
Вероятность для любой точки на графике характеристической функции можно оценить, если распределение представить себе как последовательность узких прямоугольников. Тогда для любого данного прямоугольника в распределении вы можете рассчитать вероятность, ассоциированную с этим прямоугольником, как отношение суммы площадей всех прямоугольников слева от вашего прямоугольника (включая площадь вашего прямоугольника) к сумме площадей всех прямоугольников в распределении. Чем больше прямоугольников вы используете, тем более точными будут полученные вероятности. Если бы вы использовали бесконечное число прямоугольников, то ваш расчет был бы точным. Рассмотрим процедуру поиска площадей под кривой характеристического распределения на примере. Допустим, мы хотим найти вероятности, ассоциированные с каждым отрезком длиной 0,1 в интервале от -3 до +3 сигма. Отметьте, что в таблице (с. 183) рассмотрен интервал от -5 до +5 сигма. Дело в том, что лучше выйти на 2 сигмы за ограничительные параметры (-3 и +3 сигма в нашем случае), чтобы получить более точные результаты. Отметьте, что Х — это число стандартных единиц, на которое мы смещены от среднего значения. Далее идут значения четырех параметров. Следующий столбец — это столбец N'(X), который отражает высоту кривой в точке Х при этих значениях параметров. N'(X) рассчитывается из уравнения (4.06). Воспользуемся уравнением (4.06). Допустим, нам надо рассчитать N'(X) для Х= -3 со значениями параметров 0,02, 2,76, 0 и 1,78 для LOC, SCALE, SKEW и KURT соответственно. Сначала рассчитаем показатель асимметрии для уравнения (4.06). Формула для расчета С задается уравнением (4.07):
Х | LOG | SCALE | SKEW | KURT | N'(X) Ур. (4.06) | Накопленная сумма | N(X) |
-5,0 | 0,02 | 2,76 | 0 | 1,78 | 0,0092026741 | 0,0092026741 | 0,000388 |
-4,9 | 0,02 | 2,76 | 0 | 1,78 | 0,0095350519 | 0,018737726 | 0,001178 |
-4,8 | 0,02 | 2,76 | 0 | 1,78 | 0,0098865117 | 0,0286242377 | 0,001997 |
-4,7 | 0,02 | 2,76 | 0 | 1,78 | 0,01025857 | 0,0388828077 | 0,002847 |
-4,6 | 0,02 | 2,76 | 0 | 1,78 | 0,0106528988 | 0,0495357065 | 0,003729 |
-4,5 | 0,02 | 2,76 | 0 | 1,78 | 0,0110713449 | 0,0606070514 | 0,004645 |
-4,4 | 0,02 | 2,76 | 0 | 1,78 | 0,0115159524 | 0,0721230038 | 0,005598 |
-4,3 | 0,02 | 2,76 | 0 | 1,78 | 0,0119889887 | 0,0841119925 | 0,006590 |
-4,2 | 0,02 | 2,76 | 0 | 1,78 | 0,0124929748 | 0,0966049673 | 0,007622 |
-4,1 | 0,02 | 2,76 | 0 | 1,78 | 0,0130307203 | 0,1096356876 | 0,008699 |
-4,0 | 0,02 | 2,76 | 0 | 1,78 | 0,0136053639 | 0,1232410515 | 0,009823 |
-3,9 | 0,02 | 2,76 | 0 | 1,78 | 0,0142204209 | 0,1374614724 | 0,010996 |
-3,8 | 0,02 | 2,76 | 0 | 1,78 | 0,0148798398 | 0,1523413122 | 0,012224 |
-3,7 |