Как думают великие компании: три правила — страница 54 из 55

Чтобы избежать этого, мы проанализировали динамику изменений составляющих элементов преимущества по ФР для каждого из наших попарных сравнений за соответствующие периоды времени. В приведенных ниже таблицах приводятся процентные доли от общего числа наблюдений по всей выборке для каждой сравниваемой пары, которые соответствуют общим цифрам за весь рассматриваемый период.

Например, если мы посмотрим на обобщенную статистику для «чудотворцев» и «стайеров» по всем девяти сравнениям, мы увидим, что в среднем в течение 87 % времени преимущество по годовой валовой прибыли имело тот же знак, что и преимущество по валовой прибыли за весь период сравнения «чудотворцев» со «стайерами». Если рассматривать отдельно периоды относительно высокой рентабельности, это значение возрастает до 90 %, а в периоды относительно низкой рентабельности оно уменьшается до 81 %. Медианное значение в целом и в периоды относительно высокой рентабельности составляет 100 %, то есть это максимальное значение, которое может иметь наш параметр соответствия, и это означает, что не менее половины всего времени имеет место идеальное соответствие между знаком годового значения и средним значением за период.

Рассматривая конкретные попарные сравнения, например Linear Technology с Micropac Industries, мы видим, что средний процент преимущества по ФР, обусловленного преимуществом по валовой прибыли, равен 25,7 %, медианное значение равно 25 %, межквартильный размах (МКР) равен 9,7 %, а соответствие составляет 100 %.

Ниже приведены обобщенные статистические данные для всех трех типов попарных сравнений и для всех 27 попарных сравнений, так что вы сами сможете решить, является ли разброс элементов преимущества за периоды времени, выявленный с помощью наших статистических методов, достаточно малым, чтобы оправдать наши поиски устойчивых различий в поведении за те же периоды.


Обобщенный уровень: попарные сравнения для всей выборки

Обобщенные статистические данные для выборки


«Чудотворцы» и «стайеры»


«Чудотворцы» и «середнячки»


«Стайеры» и «середнячки»


Обобщенная статистика для всех попарных сравнений

Полупроводники

Linear Technology – Micropac Industries[8]


Linear Technology – International Rectifier


Micropac Industries – International Rectifier

Медицинское оборудование

Medtronic – Stryker


Medtronic – Invacare


Stryker – Invacare

Электропроводка

Thomas & Betts – Hubbell


Thomas & Betts – Emrise


Hubbell – Emrise

Одежда

Abercrombie & Fitch – Finish Line


Abercrombie & Fitch – Syms


Finish Line – Syms

Кондитерские изделия

Wm. Wrigley Jr. Company – Tootsie Roll Industries


Wm. Wrigley Jr. Company – Rocky Mountain Chocolate Factory


Tootsie Roll Industries – Rocky Mountain Chocolate Factory

Продовольственные товары

Weis Markets – Publix Super Markets


Weis Markets – Whole Foods Market


Publix Super Markets – Whole Foods Market

Фармацевтика

Merck & Co. – Eli Lilly & Co.


Merck & Co. – KV Pharmaceutical


Eli Lilly & Co. – KV Pharmaceutical

Автомобильные грузоперевозки

Heartland Express – Werner Enterprises


Heartland Express – P.A.M. Transportation Services


Werner Enterprises – P.A.M. Transportation Services

Бытовая техника

Maytag – HMI Industries


Maytag – Whirlpool


HMI Industries – Whirlpool

Приложение G. Статистический анализ малых выборок

Многие из нас знакомы с тем, что иногда называют «поваренной книгой статистики»: это нормальное распределение, среднее значение и стандартное отклонение, t-тесты на значимость. В нашем анализе эти методы редко оказывались полезными. В своей крупномасштабной работе для учета особенностей ФР и природы явлений, которые мы пытались оценить количественно, мы использовали ряд непараметрических методов, таких как квантильная регрессия и локально-линейная (LOESS) регрессия.

Поскольку размер массива данных для исследования конкретных компаний у нас гораздо меньше, нам пришлось использовать другие методы, что отразилось на надежности выводов, которые мы сделали из этого анализа.

Чтобы вам было легче понять наш подход к этой проблеме, ниже мы приводим в сокращенном виде таблицу 6 из главы 3, в которой оценивается вероятность связи между относительной конкурентной позицией и относительной рентабельностью в наших выборках с использованием попарных сравнений (в таблице 6 мы рассматриваем наши тройки как целое, и поэтому в каждой из них одна компания занимает «промежуточную» конкурентную позицию; при попарных сравнениях можно сравнивать только ценовые и неценовые позиции).

При сравнении «чудотворцев» с «середнячками» легко видеть, что семь «чудотворцев» имеют неценовую конкурентную позицию, и два имеют ценовую позицию. В каждом случае между «чудотворцами» и «середнячками» имеются определенные различия.

Эта выборка из 9 попарных сравнений составляет 5,2 % от нашей группы из 174 «чудотворцев», и возможные ложноотрицательные результаты здесь не учитываются. Если бы наша выборка была абсолютно репрезентативной по отношению к нашей группе в целом, мы могли бы с полным основанием сделать вывод, что «чудотворцы» имеют неценовые конкурентные позиции относительно «середнячков» в течение 78 % рассматриваемого времени, то есть в подавляющем большинстве случаев, и это убедительно доказывало бы наличие сильной связи между выдающейся рентабельностью и неценовыми конкурентными позициями.


Таблица 51. Относительные конкурентные позиции при попарном сравнении

Источник: анализ, выполненный авторами.

При ссылках на нашу «группу» из «чудотворцев» и «стайеров» мы игнорируем проблему возможных ложноотрицательных результатов.


Однако наша выборка, скорее всего, не вполне репрезентативна, прежде всего – из-за ее небольшого размера. Получить экстремальный результат в небольшой выборке гораздо легче, чем в большой. В обычном случае можно было бы рассчитать доверительный интервал для нашей оценки 78 %, но для малых выборок этот метод непригоден. Вместо этого мы намереваемся проверить вероятность того, что наша выборка могла быть получена из распределения, в котором равновероятными являются три возможных результата. Так, если мы предположим, что компания-«чудотворец» с одинаковой вероятностью может иметь неценовую, ценовую и такую же относительную конкурентную позицию, как и «середнячок», мы сможем оценить вероятность получения выборки, которую мы фактически получили.

Если использовать аналогию, это можно уподобить оценке вероятности того, что монета действительно симметрична, по результатам определенного числа бросков. Если предполагается, что монета симметрична, и если из 10 бросаний выпадает 6 орлов, то вероятность несимметричности монеты с повышением частоты выпадения орлов равна вероятности выпадения 6 и более орлов из 10 бросаний, то есть 38 %. На этом этапе оценка становится субъективной. Означает ли это, что вероятность того, что монета симметрична, составляет только 38 %? Или это означает, что монета, вероятно, симметрична? Если бы это было возможно, вы собрали бы больше данных. Если вы не можете собрать больше данных, необходимо сделать вывод на основании имеющихся данных или вообще воздержаться от выводов.

При тестировании моделей со множеством ячеек, как в приведенной выше таблице, обычно ищут значимую кластеризацию в таблицах сопряженности признаков с помощью так называемой статистики хи-квадрат. Однако для малых выборок (например, когда N< 30) и для случаев, когда ожидаемое число ячеек меньше 5 более чем для 20 % ячеек, этот метод непригоден. Например, если у нас 9 компаний в столбце или строке, то следует ожидать, что число компаний в каждой ячейке будет равно 9/3, что меньше 5.

С учетом этого мы продолжим аналогию с моделированием. Предположим, что мы бросаем гипотетическую «симметричную» трехстороннюю монету k раз, где k – число компаний в строке или столбце. Затем мы оцениваем вероятность попадания m или более смоделированных компаний в одну и ту же ячейку. Мы повторяем этот процесс 10 миллионов раз, вычисляя процент времени, в течение которого m или более моделируемых компаний из k попадают в одну ячейку.

Таким образом, на самом деле мы проверяем, можно ли ожидать, что не меньше чем m компаний из k могут собраться вместе в любой из трех ячеек в строке (или столбце) случайным образом. Итак, приведенные выше значения в % – это вероятности того, что наблюдаемая кластеризация не является случайной («случайной» означает, что все фирмы имеют одинаковую вероятность [p = ⅓] попадания в каждую ячейку). Однако мы не утверждаем, что вся группа выглядит как наша выборка. Скорее мы утверждаем, что судя по нашей выборке, чтобы сделать выгодное вложение, нужно учитывать наличие систематических связей между относительной конкурентной позицией и результатами попарных сравнений.

Так, если у «чудотворцев» при сравнениях со «стайерами» неценовая конкурентная позиция обнаруживается в 6 раз чаще, чем ценовая, то мы не утверждаем, что так обстоят дела и во всей группе. Но мы утверждаем, что вероятность появления соотношения 6:1 в совокупности с равномерным распределением взаимоисключающих вариантов очень мала, и поэтому «чудотворцы» с большей вероятностью должны иметь неценовые конкурентные позиции, нежели ценовые. Это как если бы мы тестировали монету в предположении, что она симметрична, а у нас в семи бросаниях выпало шесть орлов. Вероятность того, что наша «монета» не смещена в сторону неценовой конкурентной позиции, при этом составляет 1,6 %. Мы не можем с уверенностью сказать, что она не имеет такого смещения, но не стали бы держать пари против этого.