Чтобы избежать этого, мы проанализировали динамику изменений составляющих элементов преимущества по ФР для каждого из наших попарных сравнений за соответствующие периоды времени. В приведенных ниже таблицах приводятся процентные доли от общего числа наблюдений по всей выборке для каждой сравниваемой пары, которые соответствуют общим цифрам за весь рассматриваемый период.
Например, если мы посмотрим на обобщенную статистику для «чудотворцев» и «стайеров» по всем девяти сравнениям, мы увидим, что в среднем в течение 87 % времени преимущество по годовой валовой прибыли имело тот же знак, что и преимущество по валовой прибыли за весь период сравнения «чудотворцев» со «стайерами». Если рассматривать отдельно периоды относительно высокой рентабельности, это значение возрастает до 90 %, а в периоды относительно низкой рентабельности оно уменьшается до 81 %. Медианное значение в целом и в периоды относительно высокой рентабельности составляет 100 %, то есть это максимальное значение, которое может иметь наш параметр соответствия, и это означает, что не менее половины всего времени имеет место идеальное соответствие между знаком годового значения и средним значением за период.
Рассматривая конкретные попарные сравнения, например Linear Technology с Micropac Industries, мы видим, что средний процент преимущества по ФР, обусловленного преимуществом по валовой прибыли, равен 25,7 %, медианное значение равно 25 %, межквартильный размах (МКР) равен 9,7 %, а соответствие составляет 100 %.
Ниже приведены обобщенные статистические данные для всех трех типов попарных сравнений и для всех 27 попарных сравнений, так что вы сами сможете решить, является ли разброс элементов преимущества за периоды времени, выявленный с помощью наших статистических методов, достаточно малым, чтобы оправдать наши поиски устойчивых различий в поведении за те же периоды.
Обобщенный уровень: попарные сравнения для всей выборки
Обобщенные статистические данные для выборки
«Чудотворцы» и «стайеры»
«Чудотворцы» и «середнячки»
«Стайеры» и «середнячки»
Обобщенная статистика для всех попарных сравнений
Linear Technology – Micropac Industries[8]
Linear Technology – International Rectifier
Micropac Industries – International Rectifier
Medtronic – Stryker
Medtronic – Invacare
Stryker – Invacare
Thomas & Betts – Hubbell
Thomas & Betts – Emrise
Hubbell – Emrise
Abercrombie & Fitch – Finish Line
Abercrombie & Fitch – Syms
Finish Line – Syms
Wm. Wrigley Jr. Company – Tootsie Roll Industries
Wm. Wrigley Jr. Company – Rocky Mountain Chocolate Factory
Tootsie Roll Industries – Rocky Mountain Chocolate Factory
Weis Markets – Publix Super Markets
Weis Markets – Whole Foods Market
Publix Super Markets – Whole Foods Market
Merck & Co. – Eli Lilly & Co.
Merck & Co. – KV Pharmaceutical
Eli Lilly & Co. – KV Pharmaceutical
Heartland Express – Werner Enterprises
Heartland Express – P.A.M. Transportation Services
Werner Enterprises – P.A.M. Transportation Services
Maytag – HMI Industries
Maytag – Whirlpool
HMI Industries – Whirlpool
Приложение G. Статистический анализ малых выборок
Многие из нас знакомы с тем, что иногда называют «поваренной книгой статистики»: это нормальное распределение, среднее значение и стандартное отклонение, t-тесты на значимость. В нашем анализе эти методы редко оказывались полезными. В своей крупномасштабной работе для учета особенностей ФР и природы явлений, которые мы пытались оценить количественно, мы использовали ряд непараметрических методов, таких как квантильная регрессия и локально-линейная (LOESS) регрессия.
Поскольку размер массива данных для исследования конкретных компаний у нас гораздо меньше, нам пришлось использовать другие методы, что отразилось на надежности выводов, которые мы сделали из этого анализа.
Чтобы вам было легче понять наш подход к этой проблеме, ниже мы приводим в сокращенном виде таблицу 6 из главы 3, в которой оценивается вероятность связи между относительной конкурентной позицией и относительной рентабельностью в наших выборках с использованием попарных сравнений (в таблице 6 мы рассматриваем наши тройки как целое, и поэтому в каждой из них одна компания занимает «промежуточную» конкурентную позицию; при попарных сравнениях можно сравнивать только ценовые и неценовые позиции).
При сравнении «чудотворцев» с «середнячками» легко видеть, что семь «чудотворцев» имеют неценовую конкурентную позицию, и два имеют ценовую позицию. В каждом случае между «чудотворцами» и «середнячками» имеются определенные различия.
Эта выборка из 9 попарных сравнений составляет 5,2 % от нашей группы из 174 «чудотворцев», и возможные ложноотрицательные результаты здесь не учитываются. Если бы наша выборка была абсолютно репрезентативной по отношению к нашей группе в целом, мы могли бы с полным основанием сделать вывод, что «чудотворцы» имеют неценовые конкурентные позиции относительно «середнячков» в течение 78 % рассматриваемого времени, то есть в подавляющем большинстве случаев, и это убедительно доказывало бы наличие сильной связи между выдающейся рентабельностью и неценовыми конкурентными позициями.
Таблица 51. Относительные конкурентные позиции при попарном сравнении
Источник: анализ, выполненный авторами.
При ссылках на нашу «группу» из «чудотворцев» и «стайеров» мы игнорируем проблему возможных ложноотрицательных результатов.
Однако наша выборка, скорее всего, не вполне репрезентативна, прежде всего – из-за ее небольшого размера. Получить экстремальный результат в небольшой выборке гораздо легче, чем в большой. В обычном случае можно было бы рассчитать доверительный интервал для нашей оценки 78 %, но для малых выборок этот метод непригоден. Вместо этого мы намереваемся проверить вероятность того, что наша выборка могла быть получена из распределения, в котором равновероятными являются три возможных результата. Так, если мы предположим, что компания-«чудотворец» с одинаковой вероятностью может иметь неценовую, ценовую и такую же относительную конкурентную позицию, как и «середнячок», мы сможем оценить вероятность получения выборки, которую мы фактически получили.
Если использовать аналогию, это можно уподобить оценке вероятности того, что монета действительно симметрична, по результатам определенного числа бросков. Если предполагается, что монета симметрична, и если из 10 бросаний выпадает 6 орлов, то вероятность несимметричности монеты с повышением частоты выпадения орлов равна вероятности выпадения 6 и более орлов из 10 бросаний, то есть 38 %. На этом этапе оценка становится субъективной. Означает ли это, что вероятность того, что монета симметрична, составляет только 38 %? Или это означает, что монета, вероятно, симметрична? Если бы это было возможно, вы собрали бы больше данных. Если вы не можете собрать больше данных, необходимо сделать вывод на основании имеющихся данных или вообще воздержаться от выводов.
При тестировании моделей со множеством ячеек, как в приведенной выше таблице, обычно ищут значимую кластеризацию в таблицах сопряженности признаков с помощью так называемой статистики хи-квадрат. Однако для малых выборок (например, когда N< 30) и для случаев, когда ожидаемое число ячеек меньше 5 более чем для 20 % ячеек, этот метод непригоден. Например, если у нас 9 компаний в столбце или строке, то следует ожидать, что число компаний в каждой ячейке будет равно 9/3, что меньше 5.
С учетом этого мы продолжим аналогию с моделированием. Предположим, что мы бросаем гипотетическую «симметричную» трехстороннюю монету k раз, где k – число компаний в строке или столбце. Затем мы оцениваем вероятность попадания m или более смоделированных компаний в одну и ту же ячейку. Мы повторяем этот процесс 10 миллионов раз, вычисляя процент времени, в течение которого m или более моделируемых компаний из k попадают в одну ячейку.
Таким образом, на самом деле мы проверяем, можно ли ожидать, что не меньше чем m компаний из k могут собраться вместе в любой из трех ячеек в строке (или столбце) случайным образом. Итак, приведенные выше значения в % – это вероятности того, что наблюдаемая кластеризация не является случайной («случайной» означает, что все фирмы имеют одинаковую вероятность [p = ⅓] попадания в каждую ячейку). Однако мы не утверждаем, что вся группа выглядит как наша выборка. Скорее мы утверждаем, что судя по нашей выборке, чтобы сделать выгодное вложение, нужно учитывать наличие систематических связей между относительной конкурентной позицией и результатами попарных сравнений.
Так, если у «чудотворцев» при сравнениях со «стайерами» неценовая конкурентная позиция обнаруживается в 6 раз чаще, чем ценовая, то мы не утверждаем, что так обстоят дела и во всей группе. Но мы утверждаем, что вероятность появления соотношения 6:1 в совокупности с равномерным распределением взаимоисключающих вариантов очень мала, и поэтому «чудотворцы» с большей вероятностью должны иметь неценовые конкурентные позиции, нежели ценовые. Это как если бы мы тестировали монету в предположении, что она симметрична, а у нас в семи бросаниях выпало шесть орлов. Вероятность того, что наша «монета» не смещена в сторону неценовой конкурентной позиции, при этом составляет 1,6 %. Мы не можем с уверенностью сказать, что она не имеет такого смещения, но не стали бы держать пари против этого.