Тема 15. Описательные методы анализа...

39
369 Тема 15. Описательные методы анализа количественных данных 15.1. Общие условия и подходы. Дескриптивные методы для всех уровней измерения 15.2. Доли, проценты, пропорции 15.3.Анализ данных интервального и относительного уровня измерений 15.4.Упрощенное представление нескольких дескриптивных мер 15.1.Общие условия и подходы. Дескриптивные методы для всех уров- ней измерения Когда данные собраны, начинается их анализ, т.е. организация данных, изучение и применение статистических критериев. В предыдущих главах рассматривались четыре уровня измерения: номи- нальный, порядковый, интервальный и отношений. Уровни измерения и соответствующие им статистические методы Таблица 9. Уровни измерений Описательный метод ана- лиза данных Номинальный Порядковый Интервальный Отношений Распределение частот + + + + Доля + + + + Процент + + + + Пропорция + + + + Мода + + + + Медиана + + + Среднее + + Примечание: В таблице 1 обобщаются типы описательных статистик, соответствующих каждому их уровней измерения. Эта таблица иллюстрирует два важнейших ас- пекта взаимосвязи между уровнем измерения и анализом данных: Для более низких уровней измерения имеется меньшее количество применяемых методов анализа данных. К данным на более высоких уровнях измерения применимы все ме- тоды, используемые на низших уровнях измерения.

Transcript of Тема 15. Описательные методы анализа...

Page 1: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

369

Тема 15. Описательные методы анализа количественных данных

15.1. Общие условия и подходы. Дескриптивные методы для всех уровней

измерения

15.2. Доли, проценты, пропорции

15.3.Анализ данных интервального и относительного уровня измерений

15.4.Упрощенное представление нескольких дескриптивных мер

15.1.Общие условия и подходы. Дескриптивные методы для всех уров-

ней измерения

Когда данные собраны, начинается их анализ, т.е. организация данных,

изучение и применение статистических критериев.

В предыдущих главах рассматривались четыре уровня измерения: номи-

нальный, порядковый, интервальный и отношений.

Уровни измерения и соответствующие им статистические методы

Таблица 9.

Уровни измерений

Описательный метод ана-

лиза данных

Номинальный Порядковый Интервальный Отношений

Распределение частот + + + +

Доля + + + +

Процент + + + +

Пропорция + + + +

Мода + + + +

Медиана + + +

Среднее + +

Примечание:

В таблице 1 обобщаются типы описательных статистик, соответствующих

каждому их уровней измерения. Эта таблица иллюстрирует два важнейших ас-

пекта взаимосвязи между уровнем измерения и анализом данных:

Для более низких уровней измерения имеется меньшее количество

применяемых методов анализа данных.

К данным на более высоких уровнях измерения применимы все ме-

тоды, используемые на низших уровнях измерения.

Page 2: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

370

Далее в рамках этой темы рассматриваются методы описательного (де-

скриптивного) анализа данных: 1) методы для любого типа данных; 2) методы,

применимые только для данных на уровне интервальной шкалы и шкалы от-

ношений.

Дескриптивные методы для всех уровней измерения

Данные на любом из уровней измерения можно описывать в терминах:

1)распределения частот, 2)долей, 3)процентов и 4)пропорций.

Распределение частот

Приведем пример простейшего демографического вопроса: Укажите свое нынешнее семейное положение (ПРОЧИТАЙТЕ ВСЕ ПУНКТЫ)

Не женат (не замужем) и никогда не был (а) женат (замужем) _______(1)

Официально женат (замужем) , не живем вместе _______(2)

Не женат (не замужем), разведен (а) _______(3)

Не женат (не замужем), вдовец (вдова) _______(4)

Женат (замужем) _______(5)

Первым шагом построения распределения частот для этого (или любого

другого) вопроса является отнесение каждого ответа к одной из категорий шка-

лы. При этом мы можем ставить отметку (например, штрих) возле той катего-

рии, к которой отнесли ответ.

Окончательный результат подсчета числа ответов по каждой категорий

называется распределением частот. Подсчет ответов и построение распреде-

ления частот можно выполнить вручную или на компьютере.

Распределение частот для данных, собранных с помощью этого демогра-

фического вопроса, может выглядеть таким образом:

Категория ответа Количество ответов

Не женат (не замужем) и никогда не был (а) женат (замужем) 5

Официально женат (замужем) , не живем вместе 10

Не женат (не замужем), разведен (а) 6

Не женат (не замужем), вдовец (вдова) 1

Женат (замужем) 28

ВСЕГО 50

Page 3: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

371

Примечание: как показывает эта таблица, исходное распределение частот

представляет данные в той форме, в которой они были собраны с помощью во-

проса анкеты.

Имея такое распределение, вы можете затем выполнить объединение кате-

горий, в результате чего не будет прямого соответствия первоначальным кате-

гориям. В этом случае исходные категории ответов логически группируются,

а их частоты складываются.

Вопрос о семейном положении подразделяет «неженатых (незамужних)»

на данный момент респондентов на четыре класса: тех, кто никогда не был же-

нат (замужем); официально состоящих в браке, но не живущих вместе, разве-

денных и вдовцов (вдов). Вы можете сгруппировать вместе всех «неженатых

(незамужних)» участников выборки, чтобы узнать количество состоящих и ко-

личество не состоящих в браке. В этом случае распределение частот будет вы-

глядеть таким образом: Нынешнее семейное положение Количество ответов

Состоят в браке 22

Не состоят в браке 28

ВСЕГО 50

Аналогичным образом вы можете перегруппировать данные, чтобы уста-

новить количество респондентов, который когда-либо состояли в браке, и чис-

ло тех, кто никогда не состоял в браке:

Нынешнее семейное положение Количество ответов

Когда-либо состояли в браке 45

Никогда не состояли в браке 5

ВСЕГО 50

Примечание: подобная перегруппировка данных дает возможность рас-

сматривать семейное положение совокупности респондентов под разным углом

зрения.

15.2. Доли, проценты, пропорции

Построив распределение частот, вы должны выбрать один из трех типов

анализа, который способствовал бы более глубокому пониманию свойств соб-

ранных вами данных. К этим трем типам анализа относятся: доли, проценты и

пропорции.

Page 4: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

372

Доли. Доля отражает относительную частоту ответов в категории. Она

вычисляется делением числа ответов в конкретной категории на общее число

ответов по всем категориям.

Рассмотрим распределение частот ответов на вопрос о семейном положении.

От 50 респондентов получено 50 ответов на вопрос. 28 участников ответили, что

они в настоящий момент женаты (замужем). Доля женатых (замужних) респон-

дентов в выборке составляет 0,56. Вычисляется она следующим образом:

Пропорция женатых (замужних) = Число женатых (замужних)

= Общее число участников выборки =28/ 50 = 0,56

В приведенной ниже таблице представлены доли (относительные частоты) для

вопроса о семейном положении. Каждый столбец содержит необходимый компонент

таблицы: категории ответов четко обозначены, также вычислены и представлены в

таблице исходные частоты для каждой категории и доли выборки. (Заметим, что сум-

ма в столбце долей равна «1», подчеркивая, что сумма всех частей дает единое целое).

Нынешнее семейное положение Частота Доля

Не женат (не замужем) и никогда не был (а) женат (замужем) 5 0,1

Официально женат (замужем) , не живем вместе 10 0,2

Не женат (не замужем), разведен (а) 6 0,12

Не женат (не замужем), вдовец (вдова) 1 0,02

Женат (замужем) 28 0,56

ВСЕГО 50 1,00

Но необходимо заметить, что доли – эффективный, но не слишком распро-

страненный способ представления относительных размеров групп.

Проценты. Более распространенным способом обобщенного представления

данных служит процентное распределение. Оно вычисляется путем деления коли-

чества ответов в каждой категории на общее количество ответов и умножением ча-

стного на 100 (это все равно, что умножить долю на 100). Так, процент женатых

(замужних) респондентов в выборке будет составлять 56%, и подсчитывается так:

Процент женатых (замужних)= [ Число женатых (замужних)] = [Общее чис-

ло участников выборки] *100 =Процент женатых (замужних) = 28/ 50 * 100 = 56%

Page 5: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

373

В приведенной ниже таблице представлено распределение частот и про-

центов для вопроса о семейном положении. Подобно таблице долей, таблица

процентного распределения включает три основных элемента: метки катего-

рий, частоты и проценты выборки по каждой их категорий. (Обратите внима-

ние, что общая сумма в столбце процентов составляет 100).

Нынешнее семейное положение Частота Проц.

Не женат (не замужем) и никогда не был (а) женат (замужем) 5 10

Официально женат (замужем) , не живем вместе 10 20

Не женат (не замужем), разведен (а) 6 12

Не женат (не замужем), вдовец, вдова 1 2

Женат (замужем) 28 56

ВСЕГО 50 100

Подсчет процентов для данных на номинальном, интервальном и относи-

тельном уровне измерения очень прост.

Процент представляет частоту в одной конкретной категории, деленную на

сумму частот всех категорий. Этот подход к вычислению процентов несколько

отличается от порядковых данных. При вычислении процентов для данных на

порядковом уровне измерения каждый из пунктов рассматривается как незави-

симая единица. Порядковые шкалы, такие как вопросы на ранжирование, пред-

лагают респонденту несколько объектов или свойств с просьбой упорядочить в

соответствии с определенным критерием. Приведенный ниже пример – типич-

ный вопрос на ранжирование:

Вы только что увидели три рекламных ролика. Каждому из роликов было дано назва-

ние до того, как вы их просмотрели. Ниже ролики перечислены в порядке, в котором вы их

увидели. Пожалуйста, дайте оценку каждому из рекламных роликов, указав степень своего

доверия к их содержанию. Поставьте «1» напротив названия ролика, который показался вам

наиболее правдоподобным, «2» - напротив менее правдоподобного ролика, а «3» поставьте

напротив ролика, показавшегося вам наименее правдоподобным. Каждая из оценок от «1» до

«3» ставится только один раз. Повторения не допускаются.

«Ученый нового столетия» __________

«Мама нового столетия» __________

«Окружающая среда в новом столетии» __________

Page 6: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

374

Первым шагом анализа ранжированных данных является построение рас-

пределения частот, показывающего, сколько раз каждому из пунктов был при-

своен определенный ранг. Распределение частот для 50 респондентов, ранжи-

ровавших эти три рекламных ролика, может выглядеть таким образом:

Частота рангов

каждого рекламного

ролика на уровне

Рекламный ролик

«Ученый»

Рекламный ролик

«Мама»

Рекламный ролик

«Окружающая сре-

да»

1 38 10 2

2 8 24 18

3 4 16 30

Сумма частот 50 50 50

Как видно из таблицы, 38 респондентов присвоили рекламному ролику

под названием «Ученый» ранг «1», 8 участников – ранг «2», а 4 участника -

ранг «3».

Следующим шагом анализа и представления ранжированных данных явля-

ется преобразование распределения частот в распределение процентов для ка-

ждого из ранжированных объектов. В данном случае распределения будут вы-

глядеть таким образом:

Частота рангов

каждого рекламного

ролика на уровне

Рекламный ролик

«Ученый», %

Рекламный ролик

«Мама», %

Рекламный ролик

«Окружающая сре-

да», %

1 76 20 4

2 16 48 36

3 8 32 60

Итого 100 100 100

Анализ данных по столбцам (сверху вниз) указывает на то, что большая

часть участников присвоила:

Рекламному ролику под названием «Ученый» - ранг «1» (76%), затем

– «2» (16%);

Рекламному ролику под названием «Мама» - ранг «2» (48%), а рек-

ламному ролику под названием «Окружающая среда» - «3» (60%).

Page 7: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

375

Распределение процентов для порядковых данных также можно читать по

строке. Данные в первой строке предыдущей таблицы указывают на то, что

рекламный ролик «Ученый» получил наибольшее число рангов «1» (76%), на-

много превысив число рангов «1», полученными рекламными роликами «Ма-

ма» (20%) и «Окружающая среда» (4%).

В общем, процесс вычисления и представления таблиц и графиков рас-

пределения долей и процентов довольно прост. Но при этом необходимо при-

держиваться двух основных правил:

во-первых, всегда указывайте в таблице и на графике общее число

наблюдений. Тем самым вы предоставляете своей аудитории воз-

можность оценить объем выборки, для которой построено распреде-

ление;

во-вторых, избегайте подсчета долей и процентов, если общее число

наблюдений менее 50. Если объем выборки намного меньше этого

числа, случайные отклонения данных могут вызвать значительные

изменения долей и процентов, сообщающих об отдельной категории

ответа.

Пропорции. Третий путь суммирования данных на всех уровнях измере-

ния – использование пропорции. Пропорция одного числа Х в отношении дру-

гого числа Y определяется как X деленное на Y.

Слова по отношению к – важная составляющая этого определения. Число,

предваряющее по отношению к (в данном случае число Х), ставится в числи-

тель дроби, тогда как число после слов по отношению к ставится в знамена-

тель дроби.

Пропорции, как следует из этой математической формулы, дают возмож-

ность отчетливо видеть соотношения между относительным размером двух ка-

тегорий, использованных в анкетном опросе.

Что касается данных о семейном положении, мы видим, что пропорция не со-

стоящих в браке респондентов по отношению к состоящим в браке составляет 22/28

Page 8: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

376

или 22:28. Однако понять соотношение будет легче, если наименьший член

пропорции представить равным единице. В этом случае пропорция представ-

ляет два числа Х и Y , деленные на наименьшее из них. Таким образом, про-

порцию не состоящих в браке респондентов по отношению к состоящим в бра-

ке можно также выразить как 1:1,27. (Обратите внимание, как использование

пропорции сразу делает очевидным относительный объем этих групп).

15.3. Анализ данных интервального и относительного уровня измерений

Интервальные и относительные шкалы обладают всеми характерными

особенностями, присущими номинальным и порядковым шкалам, а также осо-

быми свойствами, не характерными для этих не столь мощных уровней изме-

рения. Следовательно, все количественные и графические методы, используе-

мые для описания и презентации номинальных и порядковых данных, могут

быть применены для описания и представления интервальных и относитель-

ных данных. Но сила данных интервального и относительного уровней позво-

ляет осуществить дополнительный анализ, невозможный на номинальном и

порядковом уровне. Характер и количество шагов, которые следует предпри-

нять перед применением этих дополнительных методов анализа, зависят от то-

го, являются ли полученные данные дискретными или непрерывными.

Дискретные данные

Рассмотрим следующий вопрос для оценки.

Пожалуйста, дайте оценку рекламному ролику, который вы только что ви-

дели. Для выражения своего согласия или несогласия с утверждением «Этот

рекламный ролик рассчитан именно на таких людей, как я» воспользуйтесь

приведенной ниже шкалой.

Абсолютно согласен ___________(1)

Скорее согласен, чем нет ___________ (2)

Не могу сказать определенно ___________ (3)

Скорее не согласен ___________ (4)

Абсолютно не согласен ___________ (5)

Page 9: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

377

Данные, полученные с помощью этого вопроса, являются дискретными.

Дискретные данные содержат ответы, ограниченные конкретным набором це-

лых чисел, отделенных друг от друга одинаковыми интервалами. Этот вопрос

дает возможность собрать дискретные данные, так как респондент должен вы-

брать один из вариантов ответа (ограниченный набор), представленных кодами

«1», «2» и т.д. (фиксированный и одинаковый шаг между уровнями ответов).

Для применения описательных методов анализа дискретных данных можно не

предпринимать каких-либо промежуточных шагов.

Непрерывные данные

Непрерывные данные предоставляют такую возможность для ответа, при

которой значения, во крайней мере, теоретически, могут быть как угодно близ-

ко расположены друг к другу на числовой шкале. Например, с помощью вопро-

са «Сколько вам лет?» собираются непрерывные данные. Респондент может

ответить, что ему 40, 40 и 1/2, 41, 42 и 1/3 и т.п. Поскольку вопросы для сбора

непрерывных данных не предполагают наличия каких-либо заранее установ-

ленных и предварительно закодированных категорий, данные перед вычисле-

нием распределения процентов и построением столбиковых или круговых диа-

грамм следует определенным образом организовать. Организация непрерыв-

ных данных называется группировкой (или организацией). Процесс группировки

осуществляется в определенной последовательности.

Данные упорядочиваются.

Определяются число и ширина интервалов категорий.

Строится распределение частот.

Упорядочение данных. Представим, что на предыдущий вопрос о возрасте

ответили 100 участников опроса. Первым шагом группировки непрерывных дан-

ных будет упорядочивание данных. Результат упорядочивания называется не

сгруппированным рядом и его можно сравнить с построением учеников класса по

росту или размещением маслин по размеру. Несгруппированный ряд, включаю-

щий 100 ответов на вопросы о возрасте, воспроизведен ниже (см. табл.10)

Page 10: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

378

Несгруппированный ряд ответов на вопрос «Сколько вам лет?»

Таблица 10 7 28 39 53

9 28 39 53

9 33 39 54

12 34 41 54

12 34 41 54

13 34 41 54

13 34 41 55

13 34 41 57

13 35 41 58

14 36 41 58

16 36 43 58

16 36 43 63

17 36 43 64

19 37 43 64

19 37 44 64

20 37 44 64

21 37 44 68

21 37 44 69

21 37 44 69

21 37 44 73

21 37 44 73

21 37 47 73

26 39 47 75

27 39 52 75

27 39 53 75

Определение количества и ширины интервалов и категорий. Следую-

щий шаг предполагает определение числа и ширины интервалов категорий. От

этого зависит способ группировки данных. По каким критериям группируются

данные о возрасте и сколько их – 5 или 25?

Твердо установленных правил для проведения границ между категориями

не существует. Но при определении ширины интервалов и границ между кате-

гориями все же следует иметь ввиду, что:

группировки должны отражать характер данных. Если размах дан-

ных (т.е. разность между наибольшим и наименьшим значениями)

большой, тогда и ширина интервалов категорий, скорее всего, будет

также большой. Данные, изменяющиеся в более узком диапазоне,

лучше обобщать с ипользованием относительно меньших категорий;

Page 11: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

379

количество групп не должно быть настолько большим, чтобы скрыть

наиболее важные особенности данных, и не столь малым, чтобы ли-

шить систему категорий смысла;

ширина интервала должна быть целым числом и, по возможности,

делиться на удобное число , например на 2, 10, 25, 100 и т.;

интервалы для всех категорий должны быть, по возможности, оди-

наковой ширины.

Руководствуясь этими рекомендациями, вы можете попробовать различ-

ные схемы группировки. Например, данные о возрасте могут быть сгруппиро-

ваны любым из приведенных ниже способов изменения ширины интервала для

каждой из групп.

5 категорий 8 категорий 16 категорий

1 - 15 1 - 9 1 - 4

16 - 30 10 - 19 5 - 9

31- 45 20 - 29 10 - 14

46 - 60 30 - 39 15 - 19

70 - 79 40 - 49 20 - 24

50 - 59 25 - 29

60 - 69 30 - 34

70 - 79 35 - 39

40 - 44

45 - 49

50 - 54

55 - 59

60 - 64

65 - 69

70 - 74

75 - 79

Page 12: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

380

Описательные статистики

Среднее и меры изменчивости. Среднее и среднее арифметическое - по-

жалуй, наиболее распространенная статистика свертки для совокупности ин-

тервальных и относительных данных. Понятие среднего балла нам уже хорошо

знакомо, поскольку мы часто сами вычисляем это значение, например, при

подсчете среднего баллов трех экзаменов в виде теста или при определении

среднего балла аттестата. В этих и подобных случаях мы вычисляем среднее,

складывая все значения чисел и затем деля полученную сумму на общее их ко-

личество. Например, средним для чисел 2,3,7,8, 10 будет число 6 (30 : 5). Мате-

матически это выражается формулой:

Средняя величина = Х =N

Xn

i

i

1

Если число ответов невелико или данные не сгруппированы, среднее лег-

ко вычислить, сложив сырые баллы и поделив полученную сумму на общее

число баллов. Большие массивы данных и сгруппированные данные требуют

другого метода для вычисления среднего ряда данных. В этом случае подход

будет таким же, но математические вычисления другими.

При вычислении среднего ряда сгруппированных данных предполагается ,

что все ответы одной категории сконцентрированы посередине интервала.

(Обратите внимание: результатом такого предположения является то, что сред-

нее, вычисляемое на основе сгруппированных данных, будет отличаться от

среднего, вычисляемого на основе несгруппированного, исходного ряда. Учи-

тывая это предположение, при вычислении среднего сгруппированных данных

следует придерживаться следующих четырех шагов (см. табл.11. ):

Page 13: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

381

Вычисление среднего сгруппированных данных Таблица 11.

Первый шаг: вы-

числение середины

интервала

Второй шаг: умножение середины интер-

вала на частоту

Возрастная группа Середина интервала Частота Произведение сере-

дины интервала на

частоту

0 - 9 4,5 3 13,5

10 - 19 14,5 12 174

20 - 29 24,5 12 294,0

30 - 39 34,5 26 897,0

40 - 49 44,5 20 890,0

50 - 59 54,5 13 708,5

60 - 69 64,5 8 516,0

70 - 79 74,5 6 447,0

Всего 100 3940

Третий шаг: сложение произведений

Четвертый шаг: деление суммы произведений на общее число наблюдений

= 3940 / 100 = 39,4 = X

Во-первых, найдите середину каждого интервала группировки,

суммируя наименьшее и наибольшее значения и деля полученный

результат на два. Например, серединной точкой категории респон-

дентов в возрасте от 20 лет до 29 лет будет 24,5 (20 + 29 : 2).

Во-вторых, умножьте середину интервала каждой категории на час-

тоту категории (т.е. на количество наблюдений в этой категории).

В-третьих, сложите все произведения, полученные на предыдущем

шаге.

В-четвертых, разделите сумму, полученную на третьем шаге, на об-

щее число ответов.

( Математически это выражается формулой: N

fimi

i

i

X 1

, которая оз-

начает, что «среднее )(X равно сумме ()произведений серединной

точки (mi) каждой группировки от первой (i =1) до последней (1) на

ее частоту (fi), деленной на общее число наблюдений (N).

Page 14: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

382

(Среднее ряда данных можно привести в таблице распределения час-

тот и процентов, а также в графиках. Это мы рассматривали выше).

Среднее является очень мощной статистикой. Оно дает возможность

представить одним числом множество ответов на вопрос анкеты. Однако, ис-

пользуя среднее, вы должны быть уверены, что усредненный балл действи-

тельно представляет тот ряд ответов, на основе которого он был вычислен.

Приведенная ниже таблица № 12. иллюстрирует гипотетический ряд

данных о намерении приобрести товар, сложившемся после просмотра одного

из рекламных роликов.

Данные о намерении приобрести товар Таблица12.

Я бы купил рекла-

мируемый товар

Рекламный ролик 1:

«Ультра» %

Рекламный ролик 2:

«Власть» %

Рекламный ролик 3:

«Дети» %

Абсолютно согласен

(1)

20 50 5

Скорее согласен, чем

нет (2)

20 0 15

Не могу сказать оп-

ределенно (3)

20 0 60

Скорее не согласен

(4)

20 0 15

Абсолютно не согла-

сен (5)

20 50 5

Среднее 3,0 3,0 3,0

Значения средних намерения купить, сложившегося после просмотра ка-

ждого рекламного ролика, совпадают, несмотря на то, что лежащие в основе

распределения ответов значительно отличаются друг от друга. Ответы после

просмотра рекламного ролика 1 под названием «Ультра» равномерно распреде-

лились по всем пяти категориям, тогда ответы на ролик 2 («Власть») приходят-

ся исключительно на края шкалы. Распределение реакций на рекламный ролик

3 («Дети») напоминают то, что мы зачастую называем колоколообразной кри-

вой нормального распределения – большинство ответов расположены в центре

распределения, и процент ответов уменьшается к краям шкалы. Изучение

Page 15: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

383

этого распределения иллюстрирует важнейший аспект среднего: среднее ста-

новится тем менее репрезентативным по отношению к распределению, на ос-

нове которого оно вычисляется, чем больше распределение отличается от

нормальной кривой.

Несмотря на то, что среднее намерения купить товар равняется 3,0 для

всех трех роликов, это значение более репрезентативно для распределения ре-

акций на ролик 3 по сравнению с реакциями на ролики 1 и 2. Нельзя утвер-

ждать, что среднее ответов после просмотра рекламного ролика 2 составляет

3,0 или определять его как нейтральное, так как , в сущности, ни один из рес-

пондентов не дал ему подобной оценки.

Таким образом, если вы вычисляете средний балл, важно определить, на-

сколько хорошо среднее представляет распределение ответов, на основе кото-

рого оно вычислялось, Это можно сделать, визуально изучив распределение

баллов и приняв субъективное решение о представительности среднего или

воспользовавшись статистиками для описания этого диапазона. В последнем

случае вы вычисляете и изучаете дисперсию и стандартное отклонение, кото-

рые могут подсчитываться как для сгруппированных, так и для не сгруппиро-

ванных данных, являются вычисляемыми показателями рассеивания значений

баллов относительно среднего.

Дисперсия (обозначаемая символом s2 ) вычисляется таким образом: вы-

числяется сумма квадратов отклонений каждого наблюдения (Xi) от среднего

(Х), которая делится затем на общее число наблюдений минус один (N – 1).

Математически это выражается формулой:

S2 =

1

)(1

2

N

XXm

i

i

(Поэтапная процедура вычисления дисперсии ряда данных (сгруппиро-

ванных и несгруппированных) приведена ниже в табл. _5_ )

Хотя дисперсия – хорошая мера рассеивания данных, все же ее использо-

вание имеет один недостаток. Дисперсия выражается в квадратах единиц из-

мерения, а не в исходных единицах. Например, дисперсия для данных табл.5

Page 16: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

384

представляет квадраты оценок. Следовательно, трудно соотнести числовое зна-

чение дисперсии с числовым значением среднего.

Эта проблема решается благодаря использованию стандартного отклоне-

ния. Стандартное отклонение равно корню квадратному из дисперсии и вы-

числяется с помощью формулы:

S = 1

)(1

2

N

XXm

i

i

Таким образом, стандартное отклонение как квадратный корень из дис-

персии выражается в тех же единицах, что и результаты первоначального из-

мерения. В итоге несложно соотнести величину стандартного отклонения со

средним.

Если просто руководствоваться интуицией, становится ясно, то что чем

больше разброс ряда данных, тем больше дисперсия и стандартное отклонение.

Если разброс отсутствует и каждое значение равняется среднему, тогда все от-

клонения будут равняться нулю, а значит дисперсия (основанная на сумме

квадратов этих отклонений) и стандартное отклонение тоже будут равняться

нулю. (Вы можете это самостоятельно доказать. Вычислите дисперсию и стан-

дартное отклонение для ряда, состоящего из десяти одинаковых баллов. Значе-

ние баллов не играет роли). При возрастании разброса в ряду данных, отклоне-

ния от выборочного среднего также имеют тенденцию возрастать, как и сумма

квадратов этих отклонений. Следовательно, если две выборки респондентов

отвечают на один и тот же вопрос, большее значение дисперсии указывает на

большее рассеивание баллов.

Page 17: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

385

Вычисление дисперсии стандартного отклонения на основе несгруп-

пированных и сгруппированных данных Таблица 13.

1.Сгруппированные данные:

Первый шаг: вычислите среднее = [(15 * 1) + (45*3) + (30*4) + (70*5):200] = 695 : 200 = 3,48

Количество

респондентов

Значение отве-

та

Отклонение от

среднего

Квадраты от-

клонения

Квадраты от-

клонения *

частота

15 1 -2,48 6,15 92,25

45 2 -1,48 2,19 98,55

40 3 -0,4 0,23 9,20

30 4 +0,52 0,27 8,10

70 5 +1,52 2,31 161,70

Итого = 200

Второй шаг:

вычислите от-

клонения от

среднего

Третий шаг:

возведите в

квадрат откло-

нения от сред-

него

Четвертый шаг: сложите произ-

ведения квадратов отклонений

на частоту

Пятый шаг: дисперсия = сумма квадратов отклонений : (число респондентов – 1) =

369,8 : 199 = 1,86

Шестой шаг: стандартное отклонение = дисперсия = 1,86 = 1,36

Page 18: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

386

2.Несгруппированные данные:

Первый шаг: вычислите среднее = (2+1+4+5+5+4+4+5+5+5) : 10 = 40 : 10 = 4,0

Номер рес-

пондента

Значение от-

вета

Второй шаг: вычислите

отклонения от среднего

Отклонения от среднего

Третий шаг: возведите

отклонения в квадрат

Квадраты отклонений

1 2 - 2 4

2 1 - 3 9

3 4 0 0

4 5 + 1 1

5 5 + 1 1

6 4 0 0

7 4 0 0

8 5 + 1 1

9 5 + 1 1

10 5 + 1 1

Всего = 18

Четвертый шаг : найдите сумму квадратов отклонений

Пятый шаг: дисперсия = сумма квадратов отклонений : (число респондентов – 1) =

18:9= 2,0

Шестой шаг : стандартное отклонение = дисперсия = 2,0 = 1,42

Медиана. Среднее является часто используемой мерой центральной тенден-

ции ряда данных. Дисперсия и стандартное отклонение указывают на разброс

значений вокруг среднего, что позволят сделать вывод о том, насколько хорошо

среднее описывает совокупность данных. Помимо среднего существуют еще две

меры центральной тенденции: медиана и мода. ( Причем следует обратить вни-

мание, что использование среднего, медианы и моды зависит от уровня измере-

ния данных. Среднее вычисляется только для интервальных и относительных

данных, медиана – для порядковых, интервальных и относительных данных. Мо-

да используется для свертки данных на всех уровнях измерения).

Медианой называется значение, располагающее посередине ранжирован-

ного ряда данных. Медиана делит ряд данных пополам таким образом, что 50%

значений меньше медианы. При нечетном количестве значений медиана

Page 19: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

387

определяется как вариант, расположенный в самом центре распределения.

Медиану в этом случае легко установить визуально по формуле:

Позиция медианы = Общее число единиц совокупности + 1

2

Если же ряд содержит четное число значений, медиана определяется как

среднее двух центральных значений в ранжированном ряду.

Что использовать – среднее или медиану? Определение среднего и ме-

дианы ряда значений важно и полезно для более глубокого понимания особен-

ностей данных. В целом, среднее является более предпочтительной мерой в си-

лу своих математических свойств и возможности лучше оценивать среднее ге-

неральной совокупности на основе выборочного среднего. Вместе с тем, суще-

ствуют две ситуации, когда следует предпочесть медиану.

Первая ситуация - когда ряд данных содержит одно или несколько экс-

тремальных значений (так называемых «выбросов» - необычно малых или

больших значений). Определять медиану в таких случаях предпочтительнее,

поскольку значение среднего чрезвычайно чувствительно к наличию выбро-

сов, тогда как медианы – нет. Если имеются экстремальные значения, среднее

можно представить очень искаженную картину.

Например, предположим, что вы хотите описать уровень доходов целевой

аудитории целевой аудитории нового товара. Вы представляете концепцию

нового товара репрезентативной выборке и отмечаете уровни доходов тех, кто

сильно или умеренно заинтересован в приобретении товара. Допустим, уро-

вень доходов тех, кто сильно и умеренно заинтересован, был таким:

Доход Частота

10 000 9

12 000 10

17 000 7

20 000 8

747 000 1

Среднее доходов части выборки, заинтересованной в новом товаре, со-

ставляет 35 314 долл. Это среднее не отражает реальной картины всей

Page 20: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

388

совокупности. Оно искусственно завышено, так как ряд содержит одно экстре-

мальное значение, что может повлечь за собой принятие неверного решения.

Медиана, которая в данном случае составляет 12 тыс. долл., гораздо луч-

ше описывает данную совокупность.

Второй ситуацией, когда следует отдать предпочтение медиане, является

наличие открытых категорий в группировке данных. Группировка по возрасту,

описанная выше в этой главе, состоит из полностью закрытых групп. Это озна-

чает, что каждая возрастная категория имеет верхнюю и нижнюю границу.

Однако для некоторых группировок используются открытые категории.

Например, одной из категорий группировки данных о доходах может быть

пункт «более 100 тыс. долл.». Среднюю точку этой группы определить невоз-

можно, так как не установлена верхняя граница. Следовательно, в этой ситуа-

ции необходимо использовать медиану, поскольку без серединной точки вы-

числить среднее сгруппированных данных невозможно.

Мода. Еще одной мерой центральной тенденции служит мода. Она опре-

деляется как наиболее часто встречающееся значение в ряду данных. Описан-

ные выше шкалы, отражающие намерение купить, имеют различные моды.

Распределение по рекламному ролику 1 под названием «Ультра» многомодаль-

но, так как существует более двух значений, которые встречаются, которые

встречаются чаще всего. Распределение рекламного ролика под названием

«Власть» бимодально, так как чаще других встречаются два значения. Распре-

деление рекламного ролика под названием «Дети» имеет одну моду, равную

трем, так как это значение встречается чаще других.

Соотношение среднего, моды и медианы. Среднее, мода и медиана дают

различное видение характеристик ряда. Распределение будет симметричным,

если среднее, медиана и мода совпадают. (См. ниже на рис.9.)

Page 21: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

389

1 2 3 4 5

Среднее

Медиана

Мода

Рис.9. Симметричное распределение

В таких случаях распределение справа от среднего, медианы или моды -

это зеркальное отображение распределения слева от этих величин и большин-

ство наблюдений приходится на центр распределения. В этой ситуации сред-

нее служит точной и предпочитаемой мерой центральной тенденции распреде-

ления.

Многие распределения не являются симметричными. Распределение, в

котором мода меньше медианы, а медиана в свою очередь, меньше среднего,

скошена влево. Это распределение имеет целый ряд значений, с низкой часто-

той в верхней части. (См. на рис. 10.):

Мода Медиана Средн.

Рис.10. Нессиметричное распределение – влево

1

2

3 4 5

Page 22: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

390

Распределение, в котором мода больше медианы, а медиана больше сред-

него, скошено вправо. (См. на рис.11 ниже).

В зависимости от скошенности распределения и диапазона значений в

качестве меры центральной тенденции выбирается или медиана, или мода.

1 2 3 4 5

Среднее Медиана Мода

Рис.11. Нессиметричное распределение – вправо

15.4.Упрощенное представление нескольких дескриптивных мер

С помощью дескриптивных мер обобщаются тенденции, лежащие в основе

данных. Тем не менее, бывают случаи, когда многочисленные дескриптивные меры

конечным пользователям результатов исследований не предоставляются. Ценность

проведенных исследований при этом значительно падает, так как конечный поль-

зователь не видит широкой картины полученных результатов исследования, и по-

этому не может установить их значимость для принятия необходимых решений.

Подобной ситуации следует всячески избегать. Для упрощенного пред-

ставления большого количества мер используются несколько различных ана-

литических приемов. Выбор подхода зависит от уровня измерения данных.

Номинальный уровень данных: организация представления и вы-

числение «совокупного» процента.

Рассмотрим следующий вопрос-меню: Вы только что просмотрели рекламный ролик. Поставьте свою отметку напротив ут-

верждения, если вы считаете, что оно отражает именно те чувства, которые вызвал у вас про-

смотр рекламного ролика. Вы можете отметить сколько угодно утверждений (или вообще не

отмечать) в зависимости от чувств, испытанных вами от просмотра рекламного ролика

Было скучно _______

Я кое-что узнал(а), просмотрев рекламный ролик _______

Page 23: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

391

Рекламный ролик рассчитан на таких людей, как я _______

Я видел(а) такие рекламные ролики прежде _______

Лицам, участвующим в рекламном ролике, можно верить _______

Рекламный ролик вызвал у меня замешательство _______

Я скажу своим друзьям, что этот рекламный ролик стоит посмотреть _______

Музыкальное сопровождение прекрасно подобрано _______

Лицу, рекламирующему товар, можно верить _______

Рекламный ролик не интересен _______

Мне не нравятся рекламные ролики такого рода _______

Лицо, рекламирующее товар, вызывает раздражение _______

Хотел(а) бы снова увидеть этот рекламный ролик _______

Ответы на этот вопрос можно представить в виде таблицы (См. ниже

табл.14. ). Отдельные пункты могут располагаться в порядке, представленном

в анкете (пример А) или в порядке убывания процента выраженного согласия

(пример Б). К сожалению, оба формата представляют данные в таком виде, что

трудно будет сообщать основные закономерности реакции респондентов.

Способы представления ответов на вопросы меню

Таблица 14.

Респонденты, выразившие согласие, %

Пример А: порядок пунктов в соответствии с анкетой

Было скучно 23

Я кое-что узнал(а), просмотрев рекламный ролик 74

Рекламный ролик рассчитан на таких людей, как я 87

Я видел(а) такие ролики прежде 25

Лицам, участвующим в рекламном ролике, можно верить 31

Рекламный ролик вызвал у меня замешательство 26

Я скажу свои друзьям, что этот ролик стоит посмотреть 24

Музыкальное сопровождение прекрасно подобрано 83

Лицу, рекламирующему товар, можно верить 84

Рекламный ролик не интересен 28

Мне не нравятся рекламные ролики такого рода 22

Лицо, рекламирующее товар, вызывает раздражение 26

Хотел(а) бы снова увидеть этот рекламный ролик 78

Page 24: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

392

Респонденты, выразившие согласие, %

Пример Б: упорядочено по убыванию степени согласия

Рекламный ролик рассчитан на таких людей, как я 87

Лицу, рекламирующему товар, можно верить 84

Музыкальное сопровождение прекрасно подобрано 83

Хотел(а) бы снова увидеть этот рекламный ролик 78

Я кое-что узнал(а), просмотрев рекламный ролик 74

Лицам, участвующим в рекламном ролике, можно верить 31

Рекламный ролик не интересен 28

Рекламный ролик вызвал у меня замешательство 26

Лицо, рекламирующее товар, вызывает раздражение 26

Я видел(а) такие ролики прежде 25

Я скажу свои друзьям, что этот ролик стоит посмотреть 24

Было скучно 23

Мне не нравятся рекламные ролики такого рода 22

Закономерность ответов на этот вопрос можно сделать более ясной, если

придерживаться следующих действий:

Во-первых, определите о чем данные будут говорить, т.е. установите,

что вы хотите получить – общую картину положительных или отрица-

тельных откликов, или реакцию на исполнение ролика в сравнении с

реакцией на рекламное обращение. (В этом примере мы концентриру-

ем внимание на положительных и отрицательных реакциях).

Во-вторых, сгруппируйте утверждения в соответствии с целью пред-

ставления данных. Исходя из поставленной цели, отдельно группиру-

ются все положительные утверждения и отдельно – отрицательные.

В – третьих, дайте название каждой из группировок. В нашем случае

одна группировка будет называться «Положительные реакции», а

вторая – «Отрицательные реакции».

В- четвертых, рассчитайте совокупный процент для каждой группы

суждений. Этот процент характеризует долю респондентов, выбрав-

ших, по крайней мере, один из пунктов группировки. *

Следующая

Page 25: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

393

таблица 15. (см. ниже) демонстрирует указанный подход к представле-

нию номинальных данных. Когда данные организованы так, как пока-

зано в таблице, сразу становятся очевидными следующие выводы:

Почти всем респондентам что-либо понравилось в рекламном ролике

(учитывая высокий совокупный процент группировки положитель-

ных утверждений).

Большинство потребителей согласились с тем, что рекламный ролик –

именно то, что нужно («рассчитан на таких людей, как я»), а личность,

рекламирующая товар, была достаточно убедительной, хотя и вызвала

некоторое раздражение.

Отрицательные ответы отражают мнение лишь нескольких респондентов

(учитывая низкий совокупный процент группировки негативных утвержде-

ний), причем каждому из них не нравится почти все в рекламном ролике.

Представление ответов на вопросы-меню: группировка пунктов

Таблица 15 Респонденты, выразившие согласие, %

Положительные суждения – совокупный процент 97

Рекламный ролик рассчитан на таких людей, как я 87

Лицу, рекламирующему товар, можно верить 84

Музыкальное сопровождение прекрасно подобрано 83

Хотел(а) бы снова увидеть этот рекламный ролик 78

Я кое-что узнал(а), просмотрев рекламный ролик 74

Лицам, участвующим в рекламном ролике, можно верить 31

Я скажу свои друзьям, что этот ролик стоит посмотреть 24

Отрицательные суждения – совокупный процент 31

Рекламный ролик не интересен 28

Рекламный ролик вызвал у меня замешательство 26

Лицо, рекламирующее товар, вызывает раздражение 26

Я видел(а) такие ролики прежде 25

Было скучно 23

Мне не нравятся рекламные ролики такого рода 22

Page 26: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

394

Интервальные и относительные данные: объединение связанных по

смыслу шкал. Очень часто для оценки индивидуального отношения и поведе-

ния используют набор школьных вопросов. Использование серии шкал обычно

обеспечивает многостороннее понимание интересующей области. Например,

рекламист, занимающийся репозиционированием товара с целью подчеркнуть

его свойства, благотворно влияющие на здоровье человека, сперва может оце-

нить мнение целевой аудитории о рекламировании товаров, благотворно

влияющих на здоровье человека, и ее отношение к компаниям, финансирую-

щим такую рекламу. Для этой цели могли быть использованы следующие ут-

верждения:

1. Товар, рекламируемый как «легкий» и «обезжиренный», действи-

тельно полезнее для здоровья.

2. Реклама, которая настойчиво подчеркивает свойства товара, благо-

творно влияющие на здоровье человека, чаще всего простой обман.

3. Корпорации, которые рекламируют свойства товара, благотворно

влияющие на здоровье человека, искренне заботятся о потребителе.

4. Реклама, которая настойчиво подчеркивает свойства товара, благо-

творно влияющие на здоровье человека, эксплуатирует потребности

людей.

5. Большинство роликов, которые рекламируют товары, как благо-

творно влияющие на здоровье человека, малоправдоподобно.

6. Корпорации, которые призывают к потреблению товаров, благо-

творно влияющих на здоровье человека, стремятся лишь заработать

побольше денег.

7. Многие корпорации намеренно преувеличивают свойства своих то-

варов, представляя их как благотворно влияющие на здоровье чело-

века.

В этой серии утверждения 1,2,4 и 5оценивают отношение потребителей к

рекламе товаров, благотворно влияющих на здоровье человека, тогда как

Page 27: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

395

утверждения 3,6 и 7 оценивают отношение к компаниям, которые платят за по-

добную рекламу.

Реакцию на эти семь утверждений можно представить в виде таблицы 16.

«Ответы на утверждения, выражающие отношение» (См.ниже). Хотя такой

подход представляет все необходимые данные о наиболее важных в данном ис-

следовании подгруппах респондентов, аудитория, изучающая эту таблицу, мо-

жет запутаться в обилии данных, в результате чего важные выводы и заключе-

ния будут утеряны.

Ответы на утверждения, выражающие отношение

Таблица 16.

Утверждение Вся выборка Взрослое

население

18-25 лет

Мужчины

26-54 лет

Женщины

26-54 лет

Товар, рекламируемый как «лег-

кий» и «обезжиренный», действи-

тельно полезнее для здоровья.

3,3 3,2 2,9 3,7

Реклама, которая настойчиво под-

черкивает свойства товара, благо-

творно влияющие на здоровье че-

ловека, чаще всего простой обман.

4,4 4,6 4,2 4,4

Корпорации, которые рекламиру-

ют свойства товара, благотворно

влияющие на здоровье человека,

искренне заботятся о потребителе

4,1 4,3 3,9 4,1

Реклама, которая настойчиво под-

черкивает свойства товара, благо-

творно влияющие на здоровье че-

ловека, играет на слабостях людей

4,5 4,7 4,0 4,8

Это ключевая идея утверждения. Шкалы некоторых утверждений перевернуты для обеспечения единообразия

интерпретации значений. Большие величины указывают на большую степень согласия и более отрицательное

отношение.

Page 28: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

396

Утверждение Вся выборка Взрослое

население

18-25 лет

Мужчины

26-54 лет

Женщины

26-54 лет

Большинство роликов, которые

рекламируют товары, как благо-

творно влияющие на здоровье че-

ловека, малоправдоподобно

4,3 4,7 3,9 4,3

Корпорации, которые призывают к

потреблению товаров, благотворно

влияющих на здоровье человека,

стремятся лишь заработать по-

больше денег.

4,3 4,4 4,2 4,3

Многие корпорации намеренно

преувеличивают свойства своих

товаров, представляя их как благо-

творно влияющие на здоровье че-

ловека

4,5 4,7 4,2 4,6

Важные результаты лучше всего представить, сперва организовав утверждения,

как показано в таблице 16 (См.выше), а затем осуществив дополнительные вычисле-

ния. Сначала, как и в случае с вопросами-меню, логически связанные пункты груп-

пируются, и группе присваивается название. Далее вычисляется среднее для каждой

группы шкал. Эта обобщающая информация, когда она добавляется в исходную таб-

лицу (См. ниже следующую таблицу 17. «Сгруппированные утверждения, выра-

жающие отношение»), делает очевидными и наглядными различия между подгруп-

пами в отношении рекламы и производителей товаров, преподносимых как благо-

творно влияющие на здоровье человека.

Сгруппированные утверждения, выражающие отношение»

Таблица 17.

Это ключевая идея утверждения. Шкалы некоторых утверждений перевернуты для обеспечения единообразия

интерпретации значений. Большие величины указывают на большую степень согласия и более отрицательное

отношение.

Page 29: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

397

Утверждение Вся выборка Взрослое

население

18-25 лет

Мужчины

26-54 лет

Женщины

26-54 лет

Отношение к рекламированию товара

Общее отношение 4,1 4,3 3,8 4,2

Товар, рекламируемый как «лег-

кий» продукт, ничуть не лучше для

здоровья.

3,3 3,2 2,9 3,7

Реклама, которая настойчиво под-

черкивает свойства товара, благо-

творно влияющие на здоровье че-

ловека, чаще всего простой обман.

4,4 4,6 4,2 4,4

Реклама, которая настойчиво под-

черкивает свойства товара, благо-

творно влияющие на здоровье че-

ловека, играет на слабостях людей

4,5 4,7 4,0 4,8

Большинство роликов, которые

рекламируют товары, как благо-

творно влияющие на здоровье че-

ловека, малоправдоподобно

4,3 4,7 3,9 4,3

Отношение к корпорациям

Общее отношение 4,3 4,5 4,1 4,3

Корпорации, которые рекламиру-

ют свойства товара, благотворно

влияющие на здоровье человека,

на самом деле не заботятся о по-

требителе

4,1 4,3 3,9 4,1

Корпорации, которые призывают к

потреблению товаров, благотворно

влияющих на здоровье человека,

стремятся лишь заработать по-

больше денег.

4,3 4,4 4,2 4,3

Многие корпорации намеренно

преувеличивают свойства своих

товаров, представляя их как благо-

творно влияющие на здоровье че-

ловека

4,5 4,7 4,2 4,6

Далее надо иметь ввиду, что усреднение ответов на логически взаимосвя-

занные шкалы – интуитивно обоснованный метод обобщения информации. Од-

нако для того, чтобы вычисление среднего было осмысленной операцией, вы

должны прежде убедиться в том, что шкалы содержательно связаны между

собой. Затем следует вычислить коэффициент альфа, который отражает внут-

Page 30: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

398

реннюю согласованность набора шкал (См. ниже табл. 18. «Вычисление коэф-

фициента альфа»), иллюстрирующую процесс вычисления коэффициента).

Среднее арифметической для набора вопросов рекомендуется вычислять толь-

ко в том случае, если коэффициент альфа для него составляет не менее 0,80.

Вычисление коэффициента альфа Таблица 18.

Первый шаг: получите корреляционную матрицу для переменных из набора

Переменная 1 Переменная 2 Переменная 3 Переменная 4

Переменная 1 - - - -

Переменная 2 0,876 - - -

Переменная 3 0,768 0,769 - -

Переменная 4 0,963 0,976 0,787 -

Второй шаг: найдите среднее интеркорреляций

Среднее интеркорреляций = (0,876 + 0,768 + 0,963 + 0,769 + 0,787) : 6 = 5,139 : 6 = 0,857

Третий шаг: подставьте числа в формулу

Коэффициент альфа = )1)((1

*

Np

pN,

Где N – это число шкал и p – среднее арифметическое интеркорреляций.

Коэффициент альфа в этом примере составит 0,960, а вычисляется он таким образом:

Коэффициент альфа = )14)(857.0(1

857.0*4

Анализ данных и компьютеры

Методы описательной статистики, рассмотренные в этом разделе учеб-

ного курса, несложны для вычисления, - можно обойтись и обычным калькуля-

тором. Но существуют и методы математико - статистического вывода, тре-

бующие значительно более сложных вычислений.

Статистические программы, разработанные для персональных компьюте-

ров, сокращают (а часто и устраняют) необходимость вычисления вручную.

Такие программы, как Minitab и SPSS, дают возможность быстро и эффективно

исследовать и анализировать данные. В данном учебном курсе эти программы

и методы не рассматриваются.

Резюме

Page 31: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

399

Анализ данных помогает исследователю обнаружить закономерности и

тенденции в ответах на вопросы анкеты. Тип анализа, наиболее подходящий

для конкретного вопроса, определяется уровнем измерения вопроса.

Все данные, независимо от уровня измерения могут анализироваться с по-

мощью частот, долей, процентов и пропорций. Эти сводные данные могут быть

представлены как в виде таблиц, так и в виде графиков.

Для данных, измеренных в шкалах интервалов и отношений, можно ис-

пользовать дополнительные статистические выводы.

Среднее или среднее арифметическое, медиана, мода, дисперсия и стан-

дартное отклонение вычисляются для данных интервального и относитель-

ного уровней.

Среднее характеризует наиболее типичное значение распределения чисел.

Дисперсия и стандартное отклонение – показатели степени рассеивания

распределения, которые помогают определить, насколько хорошо среднее

представляет распределение.

Определение медианы (значения, располагающегося в центре распределе-

ния) и моды (наиболее часто встречающегося значения) способствует более

глубокому пониманию особенностей распределения для определения того, на-

сколько хорошо среднее представляет распределение.

Вопросы к теме

1. Что такое подсчет ответов?

2. Что такое распределение частот?

3. Какова зависимость между подсчетом и распределением частот?

4. Что представляет собой доля? Как она вычисляется?

5. В чем заключается связь между распределением частот, долей и

процентов?

6. Что легче воспринимается для представления данных: доля или

процент? Чем это объяснить?

Page 32: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

400

7. Что лучше всего определить при малом объеме выборки: распреде-

ление частот, долей или процентов?

8. Что такое пропорция? Как она вычисляется?

9. Что представляет собой распределение частот данных ранжирова-

ния? В чем его сходство, а в чем отличие от распределения частот

номинальных данных?

10. Что представляет собой распределение процентов для ранжирования

данных? В чем его сходство, а в чем отличие от распределения час-

тот номинальных данных?

11. Что такое дискретные данные? Чем они отличаются от непрерывных

данных?

12. Что такое группировка и когда ее следует использовать?

13. Назовите три шага группировки данных. Дайте краткое описание

каждому шагу.

14. Какими основными правилами следует руководствоваться при соз-

дании категорий непрерывных данных?

15. Что представляет собой среднее или среднее арифметическое ряда

чисел?

16. Какие обстоятельства определяют меру репрезентативности средне-

го данным, на которых оно вычислялось?

17. Что такое дисперсия? Как она вычисляется?

18. Какая существует зависимость между дисперсией и стандартным от-

клонением?

19. Что такое медиана? Как она определяется?

20. При каких обстоятельствах медиана по сравнению со средним более

предпочтительна как описательная мера для набора данных?

21. Что такое мода?

22. Какое соотношение существует между средним, медианой и модой

при колоколообразном и ассиметричном распределении?

Page 33: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

401

23. Какие три шага следует проделать для упрощенного представления

номинальных данных?

24. Что такое совокупный процент и как он вычисляется?

25. Какие три шага следует проделать для упрощенного представления

интервальных и относительных данных?

26. Что такое коэффициент альфа и что он говорит о наборе вопросов?

27. Как вычисляется коэффициент альфа?

Практикум

Компания «Собачья радость» создала четыре новых ролика для рекла-

мирования своей линии по производству ароматизированных собачьих бискви-

тов. Перед тем как выбрать для производства один из рекламных роликов, ком-

пания провела исследование реакции целевой аудитории на каждый ролик, а

также реакции на те конкретные рекламные утверждения о товаре, которые нес

каждый ролик.

Сбор данных осуществлялся методом интервью в торговом пассаже.

Посетители, прошедшие отборочную процедуру и согласившиеся участвовать

в исследовании, приглашались в специальное помещение для проведения ин-

тервью и просмотра рекламных роликов. После просмотра всех трех роликов

профессиональный интервьюер проводил с каждым респондентом двадцати-

минутное интервью.

Интервью было довольно обширным. Вот некоторые основные вопро-

сы, которые задавались каждому из респондентов:

Вопрос 1. Пол

ЗАПИШИТЕ НЕ СПРАШИВАЯ

Мужской ______ (1)

Женский _______(2)

Вопрос 2. Возраст

Укажите свой полный возраст ___________________

Вы просмотрели рекламные ролики компании «Собачья радость». А сейчас я хотел

бы узнать ваше мнение о том, понравятся или не понравятся вашей собаке эти бисквиты.

Page 34: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

402

Будьте добры, прослушайте каждую фразу, которую я сейчас вам прочитаю. После каждой

услышанной фразы отметьте на шкале этой карточки ( НА КАРТОЧКЕ – ПЯТЬ ПУНКТОВ:

ОТ «АБСОЛЮТНО СОГЛАСЕН» (1) ДО «АБСОЛЮТНО НЕ СОГЛАСЕН»(5) степень

вашего согласия или несогласия с каждой из услышанных фраз.

a) Я думаю, что моей собаке эти бисквиты понравятся больше, чем те, которые я

даю ей сейчас.

b) Я думаю, что моя собака будет вести себя намного лучше, если давать ей эти би-

сквиты в качестве вознаграждения за хорошее поведение.

Вопрос 9. Преимущества товара.

В роликах упоминались несколько преимуществ собачьих бисквитов компании «Со-

бачья радость». Я хотел бы, чтобы вы отметили относительную важность этих преимуществ

для вас и вашей собаки, присвоив каждому из них определенное количество очков. У вас

есть 100 очков, которые вы можете распределить между приведенными ниже четырьмя пре-

имуществами. Вы можете присвоить меньше или больше очков, или же не присвпаивать ни

одного очка. Чем больше очков вы присвоите какому-либо из преимуществ, тем большее

значение оно имеет для вас. Убедитесь, что общая сумма присвоенных вами очков равняет-

ся 100. ПЕРЕДАЙТЕ АНКЕТУ РЕСПОНДЕНТУ. ПОСЛЕ ЗАПОЛНЕНИЯ СОБЕРИТЕ АН-

КЕТЫ. УБЕДИТЕСЬ В ТОМ, ЧТО ОБЩАЯ СУММА ПОСТАВЛЕННЫХ РЕСПОНДЕНТОВ

ОЧКОВ РАВНЯЕТСЯ 100.

Очищает зубы _________

Предупреждает появление кариеса __________

Освежает дыхание __________

Дополнительное питание для собаки __________

Всего 100

Вопрос 13. Коммерческая привлекательность

Ниже приведены названия четырех просмотренных вами роликов. Хочу вас попро-

сить дать оценку каждому из них. Поставьте «1» напротив названия ролика, который вам

понравился больше всего, «2» - следующему ролику, «3» - ролику, который понравился

меньше, и «4» - ролику, который понравился меньше всех. Каждую из оценок вы должны

поставить только один раз. ПЕРЕДАЙТЕ АНКЕТУ РЕСПОНДЕНТУ. ПОСЛЕ ЗАПОЛЕНИЯ

СОБЕРИТЕ АНКЕТЫ. УБЕДИТЕСЬ В ТОМ, ЧТО РЕСПОНДЕНТ ПОСТАВИЛ КАЖДУЮ

ИЗ ОЦЕНОК ТОЛЬКО ОДИН РАЗ.

Праздник для собаки _________

Пять метров _________

Page 35: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

403

Собака на диване __________

Зубы, о которых можно только мечтать __________

Вопрос 16. Намерение купить – цена высокая

Укажите, пожалуйста, насколько высока вероятность того, что вы купили бы собачьи

бисквиты компании «Собачья радость», если бы они продавались в вашем гастрономе, и их

цена была бы сопоставима с ценой ведущей торговой марки, производящей собачье печенье.

Чрезвычайно высока _________(1)

Достаточно высока _________(2)

Не могу сказать определенно _________(3)

Достаточно низка _________(4)

Чрезвычайно низка _________(5)

Вопрос 17. Намерение купить – цена низкая

Укажите, пожалуйста, насколько высока вероятность того, что вы купили бы собачьи

бисквиты компании «Собачья радость», если бы они продавались в вашем гастрономе и их

цена была бы сопоставима с ценой в фирменном магазине, торгующем собачьими бисквита-

ми.

Чрезвычайно высока _________(1)

Достаточно высока _________ (2)

Не могу сказать определенно _________ (3)

Достаточно низка _________ (4)

Чрезвычайно низка _________ (5)

Ответы пятидесяти респондентов воспроизведены в таблице (См. ниже).

Воспользуйтесь этими данными и своим знанием связи между уровнем измере-

ния и типом анализа для того, чтобы дать ответы на следующие вопросы:

Вопрос 1. Пол

К какому уровню измерения относится этот вопрос?

Как характеризуется выборка с точки зрения половых различий? Какая из

мер центральной тенденции (среднее, медиана или мода) лучше всего отражает

эту характеристику? Почему эта мера наиболее приемлема при данном распре-

делении? Следует ли в данном случае вычислить дисперсию и стандартное

Page 36: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

404

отклонение? Почему? Представьте результаты проведенного вами анализа в

виде таблицы и графика.

Вопрос 2. Возраст

К какому уровню измерения относится этот вопрос?

Сгруппируйте данные с целью дать характеристику выборки на основе

возраста. Какая из мер центральной тенденции (среднее, медиана или мода)

лучше всего отражает эту характеристику? Почему эта мера наиболее прием-

лема при данном распределении? Следует ли в данном случае вычислить дис-

персию и стандартное отклонение? Почему? Представьте результаты прове-

денного вами анализа в виде таблицы и графика.

Вопрос 7. Привлекательность товара

К какому уровню измерения относится этот вопрос?

Используя ответы на вопрос 7а, определите степень привлекательности

товара для целевой категории. Как каждая из мер центральной тенденции по-

могает вам понять характеристики распределения ответов? Какая из мер, с ва-

шей точки зрения, наиболее приемлема для иллюстрации степени привлека-

тельности товара? Следует ли в данном случае вычислять дисперсию и стан-

дартное отклонение? Почему

Используя ответы на вопрос 7б, определите степень доверия целевой ау-

дитории к утверждению о том, что благодаря бисквитам собака будет вести се-

бя лучше. Так же, как для вопроса 7а, определите, как каждая из мер централь-

ной тенденции помогает вам понять характеристики распределения ответов.

Какая из мер, с вашей точки зрения, наиболее приемлема для иллюстрации

уровня убеждения целевой аудитории в том, что благодаря бисквитам собака

будет вести себя лучше? Следует ли в данном случае вычислять дисперсию и

стандартное отклонение? Почему?

Представьте результаты проведенного вами анализа в виде таблицы и

графика.

Вопрос 9. Преимущества товара

К какому уровню измерения относится этот вопрос?

Page 37: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

405

Когда вы будете представлять результаты исследования, ваш клиент, - компания

«Собачья радость», - определенно попросит вас дать ответ о том, какое из преимуществ

товара следует особо подчеркнуть при проведении новой рекламной кампании. Что вы

посоветуете? Какие из дескриптивных мер наиболее приемлемы для описания характе-

ристик распределения и установления наиболее важного преимущества? Представьте

полученные результаты в табличной и графической форме, а также объясните, почему

вы рекомендуете подчеркнуть именно это преимущество товара.

Вопрос 13. Коммерческая привлекательность

К какому уровню измерения относится этот вопрос?

Вашему клиенту, - компании «Собачья радость», - больше всего понравился рек-

ламный ролик под названием «Зубы, о которых можно только мечтать». У клиента есть

все основания полагать, что целевой аудитории тоже понравится этот ролик, вследст-

вие чего рекламное агентство будет рекомендовать для производства именно его. Прав

ли клиент? Нравится ли целевой аудитории этот ролик? Всем ли респондентам в одина-

ковой мере? Какой из роликов вы бы порекомендовали для производства? Руково-

дствуясь какими соображениями, вы выбрали именно этот рекламный ролик? Какие

дескриптивные меры наиболее приемлемы для описания характеристик распределения

и для определения ролика, который больше всего понравился целевой аудитории?

Представьте результаты исследований в табличной и графической формах, а также

объясните, почему вы рекомендуете для производства именно этот рекламный ролик.

Вопросы 16 и 17. Намерение купить

К какому уровню измерения относится этот вопрос?

Ваш клиент в настоящее время устанавливает новую цену на свой товар. Охарак-

теризуйте намерение купить, сложившееся у целевой аудитории в соответствии с дву-

мя ценовыми уровнями. Какие дескриптивные меры наиболее приемлемы для описа-

ния характеристик распределения и для определения намерения купить в соответствии

с каждым из ценовых уровней? Основываясь на полученных данных, какой ценовой

уровень вы бы порекомендовали? Почему? Представьте результаты исследований в

табличной и графической формах, а также объясните, почему вы рекомендуете именно

этот уровень установления цены.

Page 38: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

408

Данные для изучения отклика на рекламу собачьих бисквитов Таблица 19

Вопрос 9: преимущества Вопрос 14: привлекательность

Номер

респон

дента Пол

Воз-

раст

Вопрос

Вопрос

Очи-

щает

зубы

Предот

враща-

ет ка-

риес

Осве-

жает

дыха-

ние

Допол-

нитель

ное

пита-

ние

Празд-

ник для

собаки

Пять

мет-

ров

Соба-

ка на

дива-

не

Зубы, о

которых

можно

мечтать

Во-

прос

16

Во-

прос

17

1 1 20 1 1 30 30 30 10 1 2 3 4 5 1

2 2 24 2 2 34 33 27 6 1 3 4 2 4 2

3 1 23 1 5 50 25 15 10 1 2 3 4 5 3

4 2 41 3 4 45 35 15 5 2 1 3 4 3 4

5 2 43 1 2 5 5 5 85 2 1 3 4 5 2

6 2 37 2 1 1 1 1 97 1 2 3 4 4 1

7 2 34 2 4 30 30 30 10 2 1 4 3 3 2

8 1 57 1 4 40 30 20 10 1 2 3 4 2 1

9 1 42 3 5 2 3 1 94 3 1 2 4 4 3

10 2 41 4 1 30 40 20 10 3 2 1 4 5 2

11 1 22 5 4 1 0 1 98 1 2 3 4 4 1

12 1 19 3 2 42 37 20 1 1 3 2 4 5 2

13 2 17 2 5 46 34 18 2 2 1 3 4 4 1

14 2 23 2 2 33 33 33 1 1 2 3 4 1 1

15 1 37 1 1 47 40 10 3 1 2 3 4 5 2

16 1 41 2 4 5 1 2 924 4 1 2 3 3 4

17 2 58 2 5 40 40 15 5 1 2 4 3 3 3

18 1 42 2 1 0 0 1 99 2 1 3 4 4 5

19 1 33 4 4 35 35 20 10 1 2 3 4 4 2

20 2 29 2 5 40 30 18 12 1 2 4 3 5 1

21 1 22 2 2 31 31 31 7 1 2 3 4 5 1

22 2 25 1 2 34 35 30 5 1 3 4 2 5 1

23 1 21 2 4 55 20 15 10 1 2 3 4 5 3

24 2 43 3 3 47 33 17 3 2 1 3 4 4 3

25 2 40 1 2 2 2 2 94 2 1 3 4 4 1

Page 39: Тема 15. Описательные методы анализа ...grado.institute.sfu-kras.ru/files/grado/SOC_R.D.Tema_15..pdf · 2010-05-14 · Когда данные собраны,

409

Данные для изучения отклика на рекламу собачьих бисквитов Таблица 20

Вопрос 9: преимущества Вопрос 14: привлекательность

Номер

респон

дента Пол

Воз-

раст

Вопрос

Вопрос

Очи-

щает

зубы

Предот

враща-

ет ка-

риес

Осве-

жает

дыха-

ние

Допол-

нитель

ное

пита-

ние

Празд-

ник для

собаки

Пять

мет-

ров

Соба-

ка на

дива-

не

Зубы, о

которых

можно

мечтать

Во-

прос

16

Во-

прос

17

26 2 36 2 1 30 30 30 10 2 1 4 3 3 3

27 2 32 1 5 1 0 5 94 1 2 3 4 5 2

28 1 59 1 4 40 30 25 5 2 1 3 4 4 2

29 1 44 3 5 43 20 20 7 1 2 4 3 3 3

30 2 49 1 1 58 32 5 5 1 3 2 4 5 2

31 2 29 2 5 40 25 25 10 1 2 3 4 5 1

32 1 35 2 4 1 0 1 98 1 3 2 4 4 2

33 2 43 3 3 47 33 17 3 2 1 3 4 4 3

34 2 40 1 2 2 2 2 94 2 1 3 44 4 1

35 2 36 2 1 30 30 30 10 2 1 4 3 3 3

36 2 32 1 5 1 0 5 94 1 2 3 4 5 2

37 2 34 2 4 30 30 30 10 2 1 4 3 3 2

38 1 22 5 4 1 0 4 95 1 2 3 4 4 1

39 1 19 3 2 42 37 20 1 1 3 2 4 5 2

40 2 17 2 5 46 34 18 2 2 1 3 4 4 1

41 1 57 1 4 40 30 20 10 1 2 3 4 2 1

42 1 42 3 5 3 6 1 90 3 2 2 4 4 3

43 2 41 4 1 30 40 20 10 1 3 2 4 4 1

44 2 33 5 2 50 35 15 0 1 2 3 4 5 2

45 1 37 4 3 42 30 20 5 1 3 2 4 1 2

46 1 41 2 4 0 1 2 97 4 1 2 3 3 4

47 1 33 4 4 35 35 20 10 1 2 3 4 4 2

48 2 29 2 5 40 30 18 12 1 2 4 3 5 1

49 1 42 3 1 0 1 0 99 2 1 3 4 4 5

50 2 58 2 5 38 38 20 4 1 2 4 3 3 3