Одним из критериев выбора определенного подхода к сбору данных является величина вневыборочной ошибки, которая включает в свой состав :
1) все типы ошибок, при которых ответили не все респонденты;
2) ошибки сбора данных;
3) ошибки обращения с приобретенными данными;
4) ошибки анализа составленных данных;
5) ошибки интерпретации приобретенных результатов.
Бывают ошибки, определенные неясным выявлением проблем, использованием неоднозначных терминов и т. п.
Вневыборочные ошибки классифицируются на ошибки лиц, осуществляющих сбор данных, и респондентов. Кроме того, вневыборочные ошибки подразделяются на преднамеренные и на непреднамеренные.
Преднамеренные ошибки лица, собирающего информацию, случаются, когда оно намеренно нарушает установленные исследователем требования к сбору данных. Известны виды преднамеренных ошибок респондентов. Первый вид обусловлен умением респондента фальсифицировать свои ответы вследствие определенного замешательства, нежелания отвечать на индивидуальные вопросы, из-за подозрения, что интервьюер преследует какие-то свои цели.
Второй вид обусловлен отказом респондента отвечать на вопросы из-за своей занятости, нежелания открывать личные аспекты своей жизни, предубежденности к опросам.
Контроль за преднамеренными ошибками интервьюеров ведется двумя методами :
1) надзор за их работой;
2) проверка реализованной работы.
Надзор осуществляется с помощью тайного подключения к телефонной линии, по которой берется интервью. При устном интервьюировании интервьюера может сопровождать проверяющее лицо.
Цель проверки проведенного опроса заключается в выявлении случаев дезинформации и фальсификации со стороны интервьюеров.
Существуют три типа ошибок , определенных нежеланием респондента отвечать на вопросы: из-за несогласия вообще участвовать в обследовании; из-за прекращения участия и из-за несогласия отвечать на определенные вопросы.
51. Анализ данных
Первый этап анализа – перевод «сырых» данных в обдуманную информацию, введение в компьютер, проверка на предмет ошибок, кодирование, представление в матричной форме (табулирование). Данный процесс называется преобразованием исходных данных.
Далее проводится статистический анализ , т. е. рассчитываются средние величины, частоты, корреляционные и регрессионные соотношения, проводится анализ трендов. Основные виды статистического анализа:
1) дескриптивный анализ. В его основе лежит применение двух групп статистических мер:
а) «центральной тенденции», или мер, которые характеризуют типичного респондента или типичный ответ;
б) вариации, или меры, которые определяют схожесть или несхожесть респондентов или ответов;
2) выводной анализ применяется в статистических процедурах (например, проверка гипотез) для обобщения полученных результатов на всю совокупность;
3) анализ различий. Используется для поиска степени реального различия в поведении двух групп (двух рыночных сегментов), реакции на одну и ту же рекламу и т. п.;
4) анализ связей. Используют для определения систематических связей (их направленности и силы) переменных. Например, предметом анализа может быть определение того, как повышение затрат на рекламу изменяет рост сбыта;
5) предсказательный анализ. Используется для прогнозирования развития событий в будущем. Например, путем анализа временных рядов.
Понимание принципов анализа данных необходимо по нескольким причинам :
1) дает возможность получать нужную информацию;
2) позволяет специалисту избежать ошибочных суждений и заключений;
3) дает опыт, который позволяет интерпретировать и понимать результаты анализа, проведенного другими;
4) знание больших возможностей методов анализа данных может положительно повлиять на качество разработки задач исследования.
Анализ данных может в значительной степени способствовать получению полезных знаний, однако он не допускает некачественного планирования маркетинговых исследований. Если цель исследования не определена соответствующим образом, вопросы исследования нерелевантные, гипотезы не могут быть проверены или являются бессмысленными, то на исследование придется потратить большое количество денег.
Полученные в результате опроса необработанные данные должны пройти предварительную подготовку, прежде чем для их анализа можно будет использовать статистические методы. Качество результатов, полученных посредством использования статистических методов, и их последующая интерпретация в значительной степени будут зависеть от того, насколько хорошо были подготовлены данные для анализа.
52. Редактирование данных
Задача редактирования данных заключается в том, чтобы правильно выявить пропуски, неоднозначности и неточности в ответах. Редактирование должно осуществляться как самим интервьюером и его руководителем в ходе сбора данных, так и аналитиком непосредственно перед их анализом. Среди проблем, которые должны выявляться, можно перечислить следующие :
1) ошибки интервьюера. Часто допускаемая ошибка – интервьюер не предоставил респонденту необходимые инструкции;
2) пропуски. Респондент не ответил на какой-либо вопрос – преднамеренно или из-за неспособности ответить;
3) неоднозначности. Ответ оказался неприемлемым или нечетким (непонятно, в каком из квадратиков поставлен значок при выборе из нескольких вариантов);
4) непоследовательность. Иногда нарушена логика в последовательности ответов (респондент, который является адвокатом, может отметить квадратик, показывающий, что он не окончил среднюю школу);
5) недостаток сотрудничества. Если анкета длинная и содержит сотни вопросов, респондент может «взбунтоваться» и отметить один и тот же вариант в длинной серии вопросов;
6) не соответствующий требованиям респондент, который попал в выборку (если выборка состоит только из женщин старше 18 лет, все остальные должны быть исключены).
Для решения подобных проблем существует несколько вариантов действий. Лучше всего попытаться еще раз связаться с респондентом, особенно если вопросы, о которых идет речь, очень важны. Следующий вариант – просто не учитывать данную анкету (если очевидно, что респондент либо не понял, как отвечать на анкету, либо не пожелал сотрудничать).
Менее экстремальный вариант – исключить лишь проблемные вопросы, сохранив баланс остальных: респонденты могут пропускать некоторые вопросы, связанные с возрастом или доходом, при этом нормально отвечая на остальные. В той части анализа, которая связана с доходом или возрастом, будут учитываться лишь те респонденты, которые на эти вопросы ответили, однако для остального анализа можно использовать данные, полученные от всех участников. Еще один подход – кодировать все не соответствующие требованиям или пропущенные ответы как «не знаю» или «нет мнения». Такая методика может упростить анализ данных без существенных искажений в их интерпретации.
Характерным для процесса редактирования является то, что оценивается работа интервьюера и ему даются соответствующие наставления. Если интервьюер постоянно допускает одну и ту же ошибку, то это выявляется в процессе редактирования.
53. Кодирование
Вопрос может быть закрытым или открытым, соответственно – кодирование вопросов с закрытым ответом и кодирование вопросов с открытым ответом.
Кодирование вопросов с закрытым ответом – достаточно простой процесс, поскольку в данном случае обсуждаются конкретные варианты ответов. В таблице для краткого описания каждого вопроса предусмотрен отдельный столбец, а диапазон допустимых значений предоставляет основную информацию по тому, какие значения могут соответствовать тому или иному вопросу.
После того как значения ответов введены в компьютерный файл, для получения необходимой информации можно использовать компьютерную статистическую программу. Однако перед тем как проводить анализ данных, их проверят на предмет выявления ошибок, которые могли произойти в процессе ввода. После того как ошибки устранены, можно проводить статистическую корректировку данных.
Открытые вопросы – это вопросы с произвольным вариантом ответов, поэтому они очень полезны в поисковых исследованиях.
Кодирование вопросов с открытым ответом значительно сложнее. Вообще недостатком открытых вопросов является большая зависимость ответов от объективности и опыта интервьюера.
Обычно составляют длинный список возможных ответов, после чего каждому ответу респондента ставят в соответствие один из элементов этого списка. Если ответ респондента не соответствует ни одному из элементов списка, эта операция требует субъективного решения.
К недостаткам открытых вопросов относятся также сложность и дороговизна кодирования ответов, так как процедуры кодирования предусматривают обобщение ответов в таком формате, который может быть доступным только для статистического анализа и интерпретации. Таким образом, открытые вопросы как бы увеличивают значимость мнения респондентов, более ясно выражающих свои мысли. Открытые вопросы также не очень удобны при использовании самостоятельно заполняемых анкет (почта, CAPI, электронная почта, Internet), так как письменные ответы короче по сравнению с устными.
Чтобы избежать некоторых недостатков открытых вопросов, используют предварительное кодирование.
Ожидаемые ответы записываются в формате вопросов с выбором ответов, хотя вопросы представляются как открытые. Основываясь на ответе респондента, интервьюер выбирает соответствующую категорию. Этот подход используется, когда респондент быстро формулирует ответ и легко может представить возможные варианты ответов, так как их количество ограничено. Например, этот подход успешно применяется и в исследовании на промышленном рынке.