Таким образом, чтобы предотвратить появление вневыборочных ошибок, необходимо заранее предпринимать соответствующие меры по их предотвращению.
Анализ данных начинается с преобразования исходных данных (введение в компьютер, проверка на наличие ошибок, кодирование и др.).
Данные действия необходимо проводить для того, чтобы перевести массу необработанных данных в правильную информацию. Далее проводится статистический анализ (рассчитываются средние величины, частоты, коэффициенты регрессии и корреляции, осуществляется анализ трендов и т. д.).
После проведенного отчета готовится заключительный отчет. Вся структура заключительного отчета должна соответствовать особым требованиям заказчика, однако отчет можно разделить на три части: вводную, основную, заключительную.
43. Стратифицированная выборка
Простая случайная выборка составляется из списка (основы выборки), представляющего совокупность. Часто для повышения эффективности выборки используют определенную информацию относительно подгрупп, которые существуют в ее основе. При использовании стратифицированной выборки эффективность повышается в связи с тем, что точность растет более высокими темпами, нежели стоимость. Темпы роста как стоимости, так и затрат зависят от использованной для формирования групп выборки и силы связи между интересующим показателем (отношением) и этой переменной.
Пример: предположим, что необходима информация об отношении студентов к плану организации нового спортивного объекта в здании университета. Допускается существование трех групп студентов:
1) проживающих за пределами кампуса;
2) проживающих в общежитии и проживающих в домах;
3) принадлежащих студенческому сообществу.
Также предположим, что отношение последних к новому спортивному объекту однородно (т. е. разброс, или дисперсия, их мнений низок). Мнения проживающих в общежитии студентов менее однородны, а мнения студентов, проживающих за пределами кампуса, варьируются еще сильнее. В подобной ситуации вместо того чтобы формировать выборку из трех групп по случайному признаку, разумнее взять меньше студентов, проживающих в домах, принадлежащих студенческому сообществу, и больше – проживающих за пределами кампуса. Таким образом, следует разделить список всех студентов на три группы и сформировать простую случайную выборку из каждой группы. В результате получится стратифицированная выборка. Размер выборки, набираемой из каждой группы, будет зависеть от двух факторов. Во-первых, от степени разброса мнений внутри каждой группы. Чем больше будет этот разброс, тем больше выборка. Во-вторых, размер выборки обычно обратно пропорционален стоимости ее формирования.
При разработке плана выборки необходимо выявить естественные подгруппы, которые будут более однородными, нежели совокупность в целом. Подобные подгруппы называются стратами . Таким образом, степень однородности внутри страты будет больше, нежели между ними. Фактически точность стратифицированной выборки увеличивается, если существуют различия между группами и схожесть внутри них – по признаку интересующего показателя.
Основные различия между разными типами стратифицированной выборки заключаются в механизме определения размера выборки внутри каждой группы.
Типы стратифицированной выборки:
1) пропорциональная стратифицированная выборка;
2) прямо пропорциональная стратифицированная выборка;
3) обратно пропорциональная стратифицированная выборка;
4) непропорциональная стратифицированная выборка;
5) кластерная выборка;
6) систематическая выборка.
44. Многоэтапный план
При разработке выборки используют многоэтапный план. Наиболее часто встречающимся примером в данном случае является территориальная выборка – т. е. когда набирают выборку по какой-либо территории.
Пример: предположим, необходимо сформировать выборку по штату Калифорния. В данном случае на первом этапе нужно разработать кластерную выборку из округов штата. Вероятность того, что округ попадает в выборку, пропорциональна численности его населения. Таким образом, самый большой округ – округ Лос-Анджелес – попадает в выборку со значительно большей вероятностью, нежели какой-либо другой. Второй шаг – формирование кластерной выборки городов в каждом из отобранных округов. Вероятность выбора каждого города пропорциональна его населению. На третьем этапе формируется кластерная выборка кварталов по числу домов.
На заключительном этапе формируется систематическая выборка домов в каждом квартале, после чего берется случайная выборка жителей каждого дома. В результате получается случайная территориальная выборка, и каждый дом имеет одинаковую вероятность попасть в нее. Следует отметить, что люди, проживающие в индивидуальных домах, имеют более высокую вероятность попадания в выборку, нежели жильцы многоквартирных домов.
При использовании случайной выборки теория вероятностей позволяет исследователю определить характер и масштабы любых изменений оценок и показать, в какой степени разброс этих оценок определяется процедурой формирования выборки. Для этого требуется основа выборки – список единиц совокупности для выборки, либо процедура, которая позволяет определить вероятность достижения того или иного респондента.
При использовании неслучайных выборок устраняются проблемы, связанные с разработкой основ выборки, и снижаются издержки. Однако они могут содержать скрытые искажения и неоднозначности, и от полученной информации будет больше вреда, чем пользы. В связи с этим, специалисты в области статистики предпочитают избегать неслучайных выборок. Тем не менее такие выборки можно использовать вполне эффективно :
1) на поисковой стадии исследовательского проекта;
2) при предварительном тестировании анкеты;
3) при работе с однородной совокупностью;
4) если у исследователя нет необходимых знаний в области статистики;
5) для обеспечения простоты исследования.
Следует различать четыре типа неслучайной выборки :
1) типовая;
2) выборка методом снежного кома. Этот метод применяется к относительно небольшим генеральным совокупностям;
3) «удобная»;
4) квотированная.
Одна из проблем состоит в том, что тот, кто ведет более активный образ жизни, имеет более высокую вероятность попадания в выборку.
45. «Удобная» выборка
Для быстрого и недорогого сбора информации можно использовать «удобную» выборку .
Процедура состоит в том, что контакт устанавливается с «удобными» единицами выборки – с группой активистов церкви, с группой студентов, с первыми 50 получателями почтовой анкеты или с несколькими друзьями и соседями.
Следует помнить, что информация должна оцениваться не в «абсолютном выражении», а в контексте принимаемого решения. Если необходимо быстро получить информацию о реакции людей на концепцию новой услуги, чтобы определить, следует ли эту концепцию разрабатывать далее, такая выборка вполне подойдет. Очевидно, что полагаться на нее было бы глупо в случае, если искажение результатов может привести к серьезным экономическим последствиям (конечно, при условии, что эти искажения невозможно определить). «Удобная» выборка часто используется для предварительного тестирования анкеты.
Также данная выборка включает обзвон. Обычной ошибкой здесь является опрос тех, кто подходит к телефону. Несмотря на то что уже выбраны половозрастные квоты, удобная выборка не имеет связи со случайным отбором.
Происходит смещение в области занятости и деятельности, так как опросу чаще подвергаются те, кто в дневное время находится дома (домоседы, больные, работники со сложным графиком). Еще возникает сложность в случаях, когда конкретно нужный человек отсутствует и опрос приходится переносить на более поздние сроки.
Имеют значение как формальное соблюдение пола и возраста, так и дата со временем проведения выборки, любые другие несложные процедуры. Это содействует снижению вероятности непредсказуемого смещения выборки, и она может оказаться представительной.
Каждая возрастная и профессиональная группа опрашиваемых отличается собственной достижимостью.
Сложнее опросить молодое население, как правило их не бывает дома. Но по методу Гессе в целях избежания смещения выборки следует опрашивать сначала молодых, затем людей среднего возраста и уж потом пожилое население.
46. Квотированная выборка
Квотированная выборка – это типовая выборка, которая имеет ограничение: минимальное число представителей каждой группы совокупности. Предположим, что необходимо сформировать выборку из жителей города численностью 1 тыс. человек (население делится по географическому признаку). Интервьюеры могут попросить взять 100 интервью в восточной части, 300 – в северной и т. д.
Квотированные выборки часто основываются на таких демографических характеристиках, как географическое месторасположение, возраст, пол, образование, доход. В результате исследователь знает, что выборка соответствует совокупности по этим демографическим характеристикам. Этот факт позволяет устранить некоторые серьезные искажения, свойственные типовой выборке; тем не менее некоторые искажения взять под контроль не удается.
Интервьюеры вступают в контакт с теми, кого им проще всего найти. Вследствие этого возникают искажения. Однако при использовании случайной выборки, если при этом отказы составляют 15–25 %, также присутствуют искажения.
Исследователю иногда трудно следовать квоте, вследствие чего он может выполнить требования по отдельным частотам и не суметь этого сделать по перекрестным. Предположим, что нефтеперерабатывающей компании нужно найти женщин, которые в семье отвечают за содержание автомобиля. Компания собирается провести интервью с женщинами в возрасте до 35 лет, а также с теми, кому 35 лет уже исполнилось. Следует также проинтервьюировать работающих и неработающих женщин.