В отличие от ошибок выборки вне выборочные ошибки не могут быть измерены. Поэтому важным является заранее выяснить возможные причины вне выборочных ошибок и предпринять соответствующие меры по их предотвращению.
Одним из критериев выбора определенного подхода к сбору данных является величина вне выборочной ошибки. Вне выборочная ошибка включает в свой состав:
1) все типы ошибок, обусловленные тем, что не все респонденты дали ответы;
2) ошибки сбора данных;
3) ошибки обращения с полученными данными;
4) ошибки анализа собранных данных;
5) ошибки интерпретации полученных результатов.
Кроме того, существуют ошибки, обусловленные нечетким выявлением проблем, использованием неоднозначных терминов и т.п.
Вне выборочные ошибки можно классифицировать на ошибки: лиц, осуществляющих сбор данных, и респондентов. Кроме того, вне выборочные ошибки подразделяются на преднамеренные и на непреднамеренные.
Преднамеренные ошибки лица, собирающего информацию, имеют место, когда оно сознательно нарушает установленные исследователем требования к сбору данных.
Такое нарушение может носить характер обмана (например, сам заполнил анкеты) и стремления склонить респондента к определенному ответу путем использования особых слов, интонации, мимики, жестов, подсказки определенных ответов и т.п.
Непреднамеренная ошибка лица, собирающего информацию, главным образом определяется неправильным пониманием со стороны интервьюера отдельных аспектов сбора данных, изложенных в различных инструкциях, хотя ему и кажется, что он все делает правильно. Часто такая ошибка обусловлена существенным разрывом в уровне образования у исследователя и у интервьюера.
Кроме того, причиной непреднамеренной ошибки может быть усталость лица, собирающего информацию, особенно когда в течение рабочего дня было опрошено достаточно большое число респондентов. По этой причине может быть ослаблен контроль заполнения анкет; приглашение принять участие в опросе произносится усталым, раздражительным голосом, в результате чего потенциальный респондент откажется принять участие в опросе, и т.п.
Существуют два вида преднамеренных ошибок респондентов.
Первый вид обусловлен стремлением респондента фальсифицировать свои ответы вследствие определенного замешательства, нежелания отвечать на персональные вопросы (об уровне дохода, о национальности, возрасте, семейном положении и т.п.), из-за подозрения, что интервьюер преследует какие-то свои цели.
Второй вид обусловлен отказом респондента отвечать на вопросы из-за своей занятости, нежелания открывать личные аспекты своей жизни, предубежденности к опросам.
Непреднамеренная ошибка респондента возникает в случае, когда респондент, думая, что говорит правду, на самом деле дает ошибочный ответ. Это обусловлено плохим пониманием вопросов и/или инструкции по заполнению анкет, использованием предположений вместо точных знаний (вследствие плохого знания предмета исследования, недостаточно хорошей памяти и т.п.). Далее следует выделить недостаток внимания при ответах на вопросы из-за отсутствия мотивации, отвлечения от ответов на вопросы (телефонный звонок, крик ребенка и т.п.), усталости респондента, желания скорее ответить на вопросы.
Контроль за преднамеренными ошибками интервьюеров осуществляется двумя способами: путем надзора за их работой и путем проверки выполненной работы. Надзор осуществляется, например, путем незаметного подключения к телефонной линии, по которой берется интервью. При устном интервьюировании интервьюера может сопровождать проверяющее лицо.
Цель проверки проведенного опроса заключается в выявлении случаев обмана и фальсификации со стороны интервьюеров.
Для этого можно установить повторный контакт с рядом ранее опрошенных респондентов и узнать, принимали ли они участие в опросе, и проверить выборочно их ответы на вопросы. Кроме того, опытный проверяющий, просматривая заполненные ответы, может обнаружить какие-то несоответствия. Например, очень молодой человек оказался отцом многодетной семьи.
Уменьшение непреднамеренной ошибки интервьюеров осуществляется путем проведения ориентационных сессий и путем разыгрывания ролей. В первом случае производится ознакомление интервьюеров с целям] обследования, с вопросником, с инструкцией по его заполнению. Разыгрывание ролей предполагает пробное заполнение анкет, когда одни и: участников сессии исполняют роли интервьюеров, а другие — респондентов.
Контроль за преднамеренными ошибками респондентов направлен т снижение числа случаев лжи и отказа участвовать в обследовании. Для этого прежде всего необходимо сохранять анонимность и конфиденциальность (данные личного характера не будут разглашаться). Далее, используются различные меры стимулирования участия респондентов в обследовании (денежная оплата, подарки, сувениры). Проверка достоверности ответов заключается в поиске ложных ответов путем их просмотра. Например, может быть обнаружено, что выглядящий немолодым респондент называет молодой возраст, потрепанно одетый — укажет высокий заработок. В ряде случаев для преодоления нежелания правдиво отвечать на вопросы последние задаются от третьего лица. Например, мужчине средних лет может быть задан вопрос: «Как вы думаете, будет ли использовать человек вроде вас данное средство от облысения?»
Контроль за непреднамеренными ошибками респондентов осуществляется в различных формах. Необходимо тщательно составлять вопросники и инструкции к ним, использовать разнонаправленные шкалы измерений. Для уменьшения числа ответов-предположений в шкалы вводятся такие градации, как «не имею мнения», «не могу вспомнить», «не уверен». Нецелесообразно в шкалах для всех вопросов располагать с одной стороны негативные оценки, а с другой — только положительные. Надо менять полярность вопросов, что повышает внимательность респондентов, заставляет их больше думать над ответами. Наконец, в вопросниках для поддержания внимания респондентов и доведения обследования до конца могут использоваться такие фразы, как «Опрос близится к концу», «Вы ответили на самые трудные вопросы».
Можно выделить три типа ошибок, обусловленных нежеланием респондента отвечать на вопросы: из-за отказа вообще принять участие в обследовании, из-за прекращения участия и из-за отказа отвечать на определенные вопросы.
Так, респондент может отказаться от участия в опросе из-за отсутствия интереса к данному обследованию или принципиальной отрицательной позиции по отношению к любому обследованию подобного рода, из-за своей занятости, ему может не понравиться голос интервьюера, манера задавания вопросов и т.п.
Причины прекращения ответов на вопросы также являются весьма различными. Возможно, что ответы потребовали больших затрат времени, чем ожидалось; некоторые вопросы носят чрезмерно личностный характер; пояснения к ответу на ряд вопросов оказались непонятными; ответы прервал телефонный звонок, возвращение из школы ребенка и т.п.
Наконец, респондент просто может не ответить только на некоторые вопросы — чрезмерно личностного характера или вызывающие неприятие по тем или иным причинам. Поэтому в шкалу в ряде случаев специально вводят градацию «отказываюсь отвечать».
Для уменьшения ошибки, обусловленной отказом отвечать на вопросы, необходимо прежде всего ее измерить. Если величина ошибки является существенной, то надо предпринять меры для ее уменьшения. Для этого используются два метода: взвешенных средних и формирования выборки больших размеров.
Первый метод предполагает использование весов для точного представления отдельных подгрупп изучаемой совокупности. Таким путем учитывается разное число «отказников» для разных подгрупп. Взвешенная средняя рассчитывается по следующей формуле:
х = (хa Wa + (хb Wb) +...+ (хm Wm),
где х — взвешенная средняя оценка для выборки;
ха хb... — средние оценки для разных подгрупп выборки;
Wa Wb.. — веса отдельных подгрупп, характеризующие долю каждой подгруппы в совокупности.
Например, изучается мнение потребителей относительно крема для загара определенной марки. Демографические данные говорят о том, что целевой рынок включает 50% мужчин и 50% женщин. Однако на вопросы почтового опроса ответило 25% мужчин и 75% женщин. В этом случае возможно уточнение полученных данных путем введения весов, характеризующих пропорцию 50 : 50. На вопрос анкеты: «Сколько бы вы заплатили за флакон крема?» — мужчины в среднем ответили 2 доллара, а женщины — 3 доллара. В этом случае средняя оценка (пропорция 25 : 75) составит 2,75 доллара. Однако если использовать истинную пропорцию 50 : 50, то средняя цена составит 2,50 доллара.
Второй метод заключается в сознательном формировании выборки больших размеров, чем требуется для анализа. Из этой выборки выбираются подгруппы, по размерам соответствующие представлениям о структуре целевой выборки.
Перед тем как табулировать и анализировать данные проведенного обследования, целесообразно провести их предварительную проверку и выявить ошибки респондентов.
Для этого прежде всего следует проверить анкеты на полноту и точность их заполнения, выявить возможную ненадежность (разные подходы к ответам на подобные вопросы) и односторонность ответов (например, только «да», «нет», «нет мнения»). Осуществляется это на систематической и несистематической основе. В первом случае анкеты выбираются случайным образом и осуществляется их проверка на основе выборочных процедур; во втором — анкеты для проверки отбираются произвольным образом.
Если такие ошибки являются весьма существенными, то анкеты изымаются из дальнейшего анализа. Если возможно, то производится уточнение ответов. Жестких правил в данной области не существует, и они основан на традициях, опыте и т.п., т.е. на неформальных подходах к определению какие анкеты пригодны для последующего анализа, а какие — нет. Поэтому лучше ужесточить контроль сбора данных, уменьшив таким образом проблемы предварительной оценки собранных данных.
Анализ данных начинается с перевода «сырых» данных в осмысленную информацию и включает их введение в компьютер, проверку на предмет ошибок, кодирование, представление в матричной форме (табулирование) Все это называется преобразованием исходных данных. При анализе по лученных данных наиболее часто используются следующие пакеты прикладных программ: SPSS, ДА — система 4.0, STATISTICA 4.3.
Далее проводится статистический анализ, т.е. определяются средние величины, частоты, корреляционные и регрессионные соотношения, осуществляется анализ трендов.
Преобразование данных.После сбора данных необходимо их преобразовать, т.е. привести к более сжатому виду, удобному для анализа и обладающему достаточной для заказчика информацией. Обычно закодированные исходные данные представляются в виде матрицы, столбцы которой содержат ответы на различные вопросы анкеты, а ряды — респондентов или изучаемые ситуации. Преобразование заключается в описании данных матрицы на языке ограниченного числа мер, характеризующих собранные данные. Табулирование помогает исследователю понять, что означают собранные данные. Одновременный анализ двух и более категорий опрашиваемых называется перекрестной табуляцией.
Исследователь, осуществляя преобразование, старается найти зависимости среди собранных данных и в то же время достигнуть наиболее высокого уровня обобщения.
Выделяют, по крайней мере, следующие четыре функции преобразования данных: обобщение, определение концепции (концептуализация), перевод результатов статистического анализа на понятный для менеджера язык (коммуникация), определение степени соответствия полученных результатов всей совокупности (экстраполяция).
Из-за неспособности человека анализировать большие массивы информации необходимо исходные собранные данные представить в удобном для осмысления виде, т.е. их необходимо обобщить, выразить через ограниченное число понятных параметров.
Большинство статистических мер основано на конкретных предположениях, которые определяют базу анализа собранных данных. Концептуализация направлена на оценку результатов обобщения. Например, слабый разброс оценок определенной марки продукта вырабатывает у исследователя одно суждение (концепцию), сильный — другое (см. ниже про корреляцию).
Коммуникация предполагает при интерпретации полученных результатов использование понятных для заказчика категорий. Например, если для него понятна такая статистическая мера, как «мода», то она используется при представлении полученных результатов, если нет, то результаты описываются на общепринятом языке.
Экстраполяция в данном случае предполагает определение, в какой степени данные выборки можно обобщить на всю совокупность.
Выделяют пять основных видов статистического анализа, используемых при проведении маркетинговых исследований: дескриптивный анализ, выводной анализ, анализ различий, анализ связей и предсказательный анализ. Иногда эти виды анализа используются по отдельности, иногда — совместно.
В основе дескриптивного анализа лежит использование таких статистических мер, как средняя величина (средняя), мода, среднее квадратическое отклонение, размах или амплитуда вариации.
Анализ, в основе которого лежит использование статистических процедур (например, проверка гипотез) с целью обобщения полученных результатов на всю совокупность, называется выводным анализом.
Анализ различий используется для сравнения результатов исследования двух групп (двух рыночных сегментов) для определения степени реального отличия в их поведении, в реакции на одну и ту же рекламу и т.п.
Анализ связей направлен на определение систематических связей (их направленности и силы) переменных. Например, определение, как увеличение затрат на рекламу влияет на увеличение сбыта.
Предсказательный анализ используется в целях прогнозирования развития событий в будущем, например путем анализа временных рядов.
Инструменты дескриптивного анализа. Для описания информации, полученной на основе выборочных измерений, широко используются две группы мер. Первая включает меры «центральной тенденции», или меры, которые описывают типичного респондента или типичный ответ. Вторая включает меры вариации, или меры, описывающие степень схожести или несхожести респондентов или ответов с «типичными» респондентами или ответами.
Существуют и другие описательные меры, например меры асимметрии (насколько найденные кривые распределения отличаются от нормальных кривых распределения). Однако они используются не столь часто, как вышеупомянутые, и не представляют особого интереса для заказчика.
Ниже дается только краткая характеристика указанных мер. К числу мер центральной тенденции относятся мода, медиана и средняя.
Мода характеризует величину признака, появляющуюся наиболее часто по сравнению с другими величинами данного признака. Мода носит относительный характер, и необязательно, чтобы большинство респондентов указало именно эту величину признака.
Медиана характеризует значение признака, занимающее срединное место в упорядоченном ряду значений данного признака.
Третьей мерой центральной тенденции является средняя величина, которая чаще всего рассчитывается как средняя арифметическая величина. При ее вычислении общий объем признака поровну распределяется между всеми единицами совокупности.
Видно, что степень информативности средней величины больше, чем медианы, а медианы — моды.
Однако рассмотренные меры не характеризуют вариацию ответов на какой-то вопрос или, говоря другими словами, несходство, различие респондентов или измеренных характеристик. Очевидно, что помимо знания величин мер центральной тенденции важно установить, насколько близко к этим величинам расположены остальные полученные оценки. Обычно используют три меры вариации: распределение частот, размах вариации и среднее квадратическое отклонение.
Распределение частот представляет в табличной или графической форме число случаев появления каждого значения измеренной характеристики (признака) в каждом выбранном диапазоне ее значений. Распределение частот позволяет быстро сделать выводы о степени подробности результатов измерений.
Размах вариации определяет абсолютную разность между максимальным и минимальным значениями измеренного признака. Говоря другими словами, это разница между конечными точками в распределении упорядоченных величин измеренного признака. Данная мера определяет интервал распределения значений признака.
Среднее квадратическое отклонение является обобщающей статистической характеристикой вариации значений признака. Если эта мера мала, то кривая распределения имеет узкую, сжатую форму (результаты измерений обладают высокой степенью схожести); если мера велика, то кривая распределения имеет широкий, растянутый вид (велика степень различия оценок).
Ранее было отмечено, что выбор шкалы измерений, а следовательно, типа вопросов в опросном листе предопределяет количество получаемой информации. Подобным образом количество информации, получаемой при использовании рассмотренных выше мер, является различным. Общим правилом является то, что статистические меры дают возможность получить больше информации при применении наиболее информативных шкал измерений. Выбор шкалы измерений предопределяет выбор статистических мер. Например, один из вопросов демографического исследования, при проведении которого использовалась шкала наименований, касался национальности. Русским был присвоен код 1, украинцам — 2, татарам — 3 и т.д. В данном случае, конечно, можно вычислить среднее значение. Но как интерпретировать среднюю национальность, равную, скажем, 5,67? Для вычисления средних надо использовать интервальную шкалу или шкалу отношений. Однако в нашем примере можно использовать моду.
Что касается мер вариации, то при использовании номинальной шкалы применяется распределение частот, при использовании шкалы порядков — кумулятивное распределение частот, а при использовании интервальной шкалы и шкалы отношений — среднее квадратическое отклонение.
Статистический вывод. Вывод является видом логического анализа, направленного на получение общих заключений о всей совокупности на основе наблюдений за малой группой единиц данной совокупности.
Выводы делаются на основе анализа малого числа фактов. Например, если два ваших товарища, имеющих одну и ту же марку автомобиля, жалуются на его качество, то вы можете сделать вывод о низком качестве данной марки автомобиля в целом.
Статистический же вывод основан на статистическом анализе результатов выборочных исследований и направлен на оценку параметров совокупности в целом. В данном случае результаты выборочных исследований являются только отправной точкой для получения общих выводов.