Нулевая гипотеза
имеет следующую формулировку: события является равномерными.
Тогда альтернативная гипотеза
: cобытия неравномерны.
Затем вычисляется сумма отклонений между наблюдаемыми и теоретическими значениями по формуле (1).
Полученное значение ????2эмпир сравнивается со значением ????2критич, которое берется из
приложения А критических значений теста ????2 в зависимости от выбранного уровня
значимости α и числа степеней свободы df. df зависит от размера расчетной
таблицы и равно
=4.
Если значение??2эмпир меньше ??2критич, то нет оснований отвергнуть нулевую гипотезу. Это значит что нет значимых различий между эмпирическим и теоретическим распределений. Если значение????2эмпир больше или равно ????2критич, то нулевая гипотеза отвергается и принимается альтернативная.
Высчитываем ????2:
Из таблицы 1приложения находим, что для df=5 и α=0,05 ????2критич=11,07. Поскольку ????2эмпир больше, чем ????2критич, то нулевая гипотеза
отклоняется и принимается альтернативная. Альтернативная гипотеза
: cобытия неравномерны.
1.2 Проверка статистической гипотезы в программе IBM
SPSS Statistics
Переменная - "Событие". Далее вводится данные переменной. Часть
введенных данных показана на рисунке 4.
Рисунок 4. Совпадения
После в непараметрические критерии выбираем критерий хи-квадрат, далее
кнопка "ок". Результат теста ????2 для единственной выборки представлен
на рисунке 5.
Рисунок 5. Результат теста ????2
Кинематограф - отрасль человеческой деятельности, заключающаяся в создании движущихся изображений. Иногда также упоминается как синематограф и кинематография. Кинематограф был изобретен в конце XIX века и стал крайне популярен в XX веке.
В понятие кинематографа входят киноискусство - вид современного изобразительного искусства, произведения которого создаются при помощи движущихся изображений, и киноиндустрия (кинопромышленность) - отрасль экономики, производящая кинофильмы, спецэффекты для кинофильмов, мультипликацию, и демонстрирующая эти произведения для зрителей. Произведения киноискусства создаются при помощи кинотехники. Изучением кинематографа занимается наука киноведение. Сами кинофильмы могут сниматься в различных жанрах игрового и документального кино.
Кинематограф занимает значительную часть современной культуры многих стран. Во многих странах киноиндустрия является значимой отраслью экономики. Производство кинофильмов сосредоточено на киностудиях. Фильмы демонстрируются в кинотеатрах, по телевидению, распространяются "на видео" в форме видеокассет и видеодисков, а с появлением скоростного интернета стало доступным скачивание кинофильмов в форме видеофайлов на специализированных сайтах или посредством пиринговых сетей, а также просмотр онлайн [7].
По существу, для каждого параметрического критерия имеется, по крайней мере, один непараметрический аналог. Эти критерии можно отнести к одной из следующих групп:
· критерии различия между группами (независимые выборки);
· критерии различия между группами (зависимые выборки);
· критерии зависимости между переменными.
Различия между независимыми группами. Обычно, когда имеются две выборки (например, мужчины и женщины), которые вы хотите сравнить относительно среднего значения некоторой изучаемой переменной, вы используете t-критерий для независимых выборок. Непараметрическими альтернативами этому критерию являются: критерий серий Вальда-Вольфовица, U-критерий Манна-Уитни и двухвыборочный критерий Колмогорова-Смирнова. Если вы имеете несколько групп, то можете использовать дисперсионный анализ. Его непараметрическими аналогами являются: ранговый дисперсионный анализ Краскела-Уоллиса и медианный тест.
Различия между зависимыми группами. Если вы хотите сравнить две переменные, относящиеся к одной и той же выборке, то обычно используется t-критерий для зависимых выборок. Альтернативными непараметрическими тестами являются: критерий знаков и критерий Вилкоксона парных сравнений. Если рассматриваемые переменные по природе своей категориальны или являются категоризованными, то подходящим будет критерий хи-квадрат Макнемара. Если рассматривается более двух переменных, относящихся к одной и той же выборке, то обычно используется дисперсионный анализ (ANOVA) с повторными измерениями. Альтернативным непараметрическим методом является ранговый дисперсионный анализ Фридмана или Q-критерий Кохрена. Q-критерий Кохрена используется также для оценки изменений частот (долей) [8].
Зависимости между переменными. Для того, чтобы оценить зависимость (связь) между двумя переменными, обычно вычисляют коэффициент корреляции. Непараметрическими аналогами стандартного коэффициента корреляции Пирсона являются статистики Спирмена R, тау-Кендалла и коэффициент Гамма. Если две рассматриваемые переменные по природе своей категориальны, подходящими непараметрическими критериями для тестирования зависимости будут: хи-квадрат, фи-коэффициент, точный критерий Фишера. Дополнительно доступен критерий зависимости между несколькими переменными так называемый коэффициент конкордации Кендалла. Этот тест часто используется для оценки согласованности мнений независимых экспертов (судей), в частности, баллов, выставленных одному и тому же субъекту.
Описательные статистики. Если данные не являются нормально
распределенными, а измерения, в лучшем случае, содержат ранжированную
информацию, то вычисление обычных описательных статистик (например, среднего,
стандартного отклонения) не слишком информативно. Например, в психометрии
хорошо известно, что воспринимаемая интенсивность стимулов (например,
воспринимаемая яркость света) представляет собой логарифмическую функцию
реальной интенсивности (яркости, измеренной в объективных единицах - люксах). В
данном примере, обычная оценка среднего (сумма значений, деленная на число
стимулов) не дает верного представления о среднем значении действительной
интенсивности стимула. Модуль Непараметрическая статистика вычисляет
разнообразный набор мер положения (среднее, медиану, моду и т.д.) и рассеяния
(дисперсию, гармоническое среднее, квартильный размах и т.д.), позволяющий
представить более "полную картину" данных [9].
Абай любитель кинофильмов и ему захотелось узнать - влияет ли страна производства фильма на просматриваемый им жанр фильма. Абай выбрал 100 фильмов просмотренных им за последние годы.
Для начала выберем страны производства. Выберем странами производства
Россию, и иностранные страны (Европа и США). В таблице 4 представлены
количество просмотренных жанров для каждого страны производства фильмов.
Таблица 4
Страны производства жанров фильмов
|
Жанр |
Страна выпуска |
Итого |
|
|
|
Российские фильмы |
Иностранные фильмы |
|
|
Боевик |
9 |
9 |
18 |
|
Фантастика |
10 |
16 |
26 |
|
Комедия |
12 |
12 |
24 |
|
Драма |
7 |
11 |
18 |
|
Фэнтези |
8 |
6 |
14 |
|
Итого: |
46 |
54 |
100 |
В том случае, когда экспериментальные данные имеют неизвестный или отличный от нормального закон распределения, нельзя использовать методы проверки статистических гипотез, базирующиеся на свойствах и параметрах нормального распределения. Еще одним важным фактором, обеспечивающим надежную проверку статистических гипотез, является размер выборки. В данном случае размер выборки небольшой и закон распределения неизвестен, следовательно, будут использоваться непараметрические методы проверки гипотез [10].
Непараметрических методов проверки гипотез очень много, но не каждый
может подойти к данному случаю. Тест хи-квадрат является универсальным тестам
для данных, выраженных в шкале наименований представленных в виде таблицы
размеров (k×r), где k - число столбцов в ней, а r - число сток. Для
корректного использования теста хи-квадрат достаточная по объему выборка. Если
более 20% ожидаемых частот имеют значение меньше 5 или если хотя бы одна из
ожидаемых частот имеет значение меньше 1, применять тест хи-квадрат нельзя
[11]. В данном случае это тест рассматривается в самом общем виде, когда число
выборок произвольно. Общий вид таблицы показан на рисунке 6.
Рисунок 6. Общий вид таблицы
Значение хи-квадрат вычисляется по формуле:
.
где Oij - наблюдаемые, или эмпирические значения;- ожидаемые, или
теоретически, значения;рассчитывается по формуле:
Процедура проверки:
· выберем уровень значимости α =0,05;
· Н0: независимо от страны выпуска фильма просматриваемые жанры фильмов были одинаковы;
· Н1: от страны выпуска фильма зависит просматриваемые жанры фильмов.
Определим по приведенной выше формуле значения ожидаемых частот Eij, а затем вычислим значение 52.
Ожидаемые частоты Eij, представлены в таблице 5.
Таблица 5
Ожидаемые частоты Eij
|
Жанр |
Страна выпуска |
Итого |
|
|
|
Российские фильмы |
Иностранные фильмы |
|
|
Боевик |
(46·18)/100=8,28 |
(54·18)/100=9,72 |
18 |
|
Фантастика |
(46·26)/100=11,96 |
(54·26)/100=14,04 |
26 |
|
Комедия |
(46·24)/100=11,04 |
(54·24)/100=12,96 |
24 |
|
Драма |
(46·18)/100=8,28 |
(54·18)/100=9,72 |
18 |
|
Фэнтези |
(46·14)/100=6,44 |
(54·14)/100=7,56 |
14 |
|
Итого: |
46 |
54 |
100 |
Рассчитываем ????2:
Находим степень свободы df=(k-1)(r-1)=(5-1)(2-1)=4.
В таблице 1 приложения находим критическое значение ????2критич для уровня значимости α=0,05 и степеней свободы df=4 ????2критич=9,49. Поскольку ????2эмпир(1,932)<????2критич(9,49) нет оснований отвергнуть
нулевую гипотезу. Независимо от страны выпуска фильма просматриваемые жанры
фильмов были одинаковы.
Создадим переменную "Жанр", и еще одну переменную "Страна
производства", и поместим в переменные данные как показано на рисунке 7.
Рисунок 7. Ввод данных
После чего в меню анализ выберем таблицы сопряженности. Перенесем
переменные жанр и Страна производства в строки и колонки соответственно. В меню
"Статистики" ставим галочку на значении Хи-квадрат и получаем
решение. Результат вычисления критерия 52 показан на рисунке 8.
Рисунок 8. Результат вычисления критерия 52
Тревога - отрицательно окрашенная эмоция, выражающая ощущение неопределенности, ожидание негативных событий, трудноопределимые предчувствия. В отличие от причин страха, причины тревоги обычно не осознаются, но она предотвращает участие человека в потенциально вредном поведении, или побуждает его к действиям по повышению вероятности благополучного исхода событий. Тревога представляет собой расплывчатый, длительный и смутный страх по поводу будущих событий.
Единое Национальное Тестирование (ЕНТ) - система оценки знаний выпускников, применяемая в Республике Казахстан. От количества баллов, получаемых учеником на ЕНТ, зависят оценки итогового аттестата зрелости, а также возможность поступления в ВУЗы республики. Баллы ЕНТ также имеют значение при присуждении Президентской стипендии "Болашак".
Аналогом ЕНТ для выпускников школ прошлых лет, выпускников колледжей и некоторых других групп абитуриентов выступает Комплексное Тестирование (КТ).
ЕНТ проходит в один этап и оценивается по 125-балльной шкале. Ученики в один день сдают пять предметов: математика, история Казахстана, русский язык, казахский язык, и предмет по выбору (история мира, иностранный язык, биология, география, химия, физика, литература) по 25 заданий на каждый. На проведение ЕНТ отводится 3,5 часа, то есть 210 минут. Минимальный проходной балл для поступающих в ВУЗы в 2014 году был 50 из 125 (ежегодно этот балл меняется), так как русский язык для казахских школ и казахский язык для русских школ не учитывается во время конкурса грантов.
ЕНТ является также серьезным психологическим испытанием [14].
Рустаму через неделю предстоит сдавать ЕНТ. Он хочет поступить в ВУЗ и очень тревожится, что плохо сдаст ЕНТ. Его пригласили в группу по эмоциональной подготовки к ЕНТ. Рустам склонен на участие, но он не уверен, сможет ли участие в группе снизить его тревогу. Он решил пообщаться с людьми, у которых был опыт участия в подобных группах. Расспросив 35 людей, Рустам получил следующие результаты:
) из 20 людей, которые до начала участия в группе имели повышенный уровень тревожности, 6 человек сказали, что группа им не помогла. 14 человек сказали, что их тревога значительно снизилась;
) из 15 человек, которые не имели проблем с тревожностью, 4 человека сказали, что после участие в группе их тревожность повысилась, остальные 11 человек не заметили каких-либо изменений.
Можно ли на основании полученных данных утверждать, что участи в работе
группы влияет на тревожность?
Тест МакНемара применяется исключительно при наличии дихотомических переменных. При этом для двух зависимых переменных выясняется, происходят ли какие-либо изменения в структуре распределения их значений. В большинстве наблюдений сравнение проводится с учетом временного фактора по схеме "до - после" [15].
Представим результаты "до и после" в виде таблицы 2×2 как показано на рисунке 9.
Рисунок 9. Тревожность до и после участия в группе
Где "+" - высокий уровень тревожности, "-" - низкий или нормальный уровень тревожности. Индикаторы изменений являются A и D, значения B и C отсутствие изменений.
Выберем уровень значимости α =0,05 и сформируем гипотезы.
Н0: участие в работе группы не влияет на уровень тревожности перед сдачей ЕНТ.
Н1: участие в работе группы влияет на уровень тревожности перед сдачей ЕНТ.