4.7.Для данных задачи 4.5 вычислите коэффициент ассоциации, коэффициент контингенции. Сделайте вывод о зависимости степени доверия от пола респондента.
4.8.Для данных задачи 4.6 вычислите коэффициент ассоциации, коэффициент контингенции. Сделайте вывод о зависимости степени доверия от возраста респондента.
4.9.Для приведенных ниже данных вычислите коэффициент корреляции Спирмена:
Возраст |
В целом |
Скорее |
Скорее |
В целом |
|
доверяю |
доверяю |
не доверяю |
не доверяю |
||
|
|||||
|
|
|
|
|
|
18–25 |
5 |
3 |
3 |
4 |
|
|
|
|
|
|
|
25–40 |
6 |
3 |
2 |
4 |
|
|
|
|
|
|
|
40–50 |
3 |
5 |
3 |
4 |
|
|
|
|
|
|
|
Свыше 50 |
7 |
3 |
2 |
3 |
|
|
|
|
|
|
Сделайте вывод о степени зависимости уровня доверия от возраста респондента.
4.10. В таблице приведены данные о поле, возрасте и уровне доверия респондента органам внутренних дел:
Возраст |
В целом |
Скорее |
Скорее |
В целом |
|
доверяю |
доверяю |
не доверяю |
не доверяю |
||
|
|||||
|
|
|
|
|
|
|
|
мужской |
|
|
|
|
|
|
|
|
|
18–25 |
69 |
26 |
74 |
16 |
|
|
|
|
|
|
|
25–40 |
56 |
15 |
24 |
11 |
|
|
|
|
|
|
|
40–50 |
35 |
22 |
32 |
24 |
|
|
|
|
|
|
|
Свыше 50 |
67 |
14 |
56 |
24 |
|
|
|
|
|
|
|
|
|
женский |
|
|
|
|
|
|
|
|
|
18–25 |
45 |
67 |
74 |
26 |
|
|
|
|
|
|
|
25–40 |
37 |
95 |
24 |
11 |
|
|
|
|
|
|
|
40–50 |
77 |
42 |
32 |
48 |
|
|
|
|
|
|
|
Свыше 50 |
39 |
41 |
27 |
36 |
|
|
|
|
|
|
Какой признак (возраст или пол) оказывает большее влияние на формирование уровня доверия?
76
4.11. Заполните таблицу сопряженности двух номинальных признаков таким образом, чтобы связь между ними была максимально полной:
Значения |
0 |
1 |
|
признаков |
|
||
|
|
|
|
|
|
|
|
0 |
|
|
100 |
|
|
|
|
1 |
|
|
100 |
|
|
|
|
|
100 |
100 |
200 |
|
|
|
|
4.12. Заполните таблицу сопряженности двух номинальных признаков таким образом, чтобы связь между ними отсутствовала:
Значения признаков |
0 |
1 |
|
|
|
|
|
0 |
|
|
100 |
|
|
|
|
1 |
|
|
100 |
|
|
|
|
|
100 |
100 |
200 |
|
|
|
|
4.13. Предложите метод исследования связи между состоянием преступности и уровнем безработицы.
4.14. Заполните значения второго порядкового признака таким образом, чтобы связь между признаками была максимальной:
Признак 1 |
11 |
10 |
9 |
8 |
7 |
6 |
5 |
4 |
3 |
2 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
Признак 2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4.15. Заполните значения второго порядкового признака таким образом, чтобы связь между признаками отсутствовала:
Признак 1 |
11 |
10 |
9 |
8 |
7 |
6 |
5 |
4 |
3 |
2 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
Признак 2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Тема 5. Достоверность статистических данных и репрезентативность статистических выводов
5.1. Краткие теоретические сведения
Совокупность, которая представляет интерес для исследователя, называется генеральной совокупностью (если эта совокупность не слишком велика – до тысячи единиц, то может использоваться и термин полная совокупность). Вспомогательная совокупность, полученная из генеральной путем отбора по определенному правилу части единиц (по причине того, что исследование генеральной совокупности невозможно или затруднительно), называется выборочной совокупностью (или просто выборкой). Еще раз подчеркнем, что эти отобранные данные и полученные на их основе результаты (параметры и свойства) представляют интерес для исследователя лишь постольку, поскольку дают основание для суждений о параметрах и свойствах уже генеральной совокупности.
Трактовка данных как выборочных является основой подразделения статистики (как метода) на описательную и выводную статистики. Описательная (дискриптивная) статистика – та, что непосредственно относится к генеральной (полной) совокупности. Выводная статистика – та, что непосредственно относится к данным выборки, но потом, уже опосредованно (через обоснование репрезентативности) относится к генеральной совокупности.
В выводной статистике принято различать, во-первых, параметры и свойства генеральной совокупности (которые интересуют исследователя, но которых он, к своему глубокому сожалению, не знает). Во-вторых, количественные оценки этих параметров, сделанные по данным выборки. Оценки – это те же параметры, что интересуют в отношении генеральной совокупности. Сами по себе оценки, которые исследователь уже может рассчитать, не были бы ему интересны, но он ранее обосновал репрезентативность (представительность) выборки по отношению к генеральной совокупности, а потому с разумными оговорками объявляет оценку значением истинного параметра.
Во избежание путаницы параметров генеральной совокупности с их выборочными оценками в статистике принята следующая система обозначений: генеральные параметры обозначаются греческими буквами, выборочные показатели, которые рассматриваются как оценки генеральных параметров, обозначаются латинскими буквами.
78
Объем (т. е. число единиц) генеральной совокупности обозначают обычно N, объем выборочной совокупности – k.
Например:
Наименование статистического |
Генеральная сово- |
Выборка |
|
показателя |
купность |
|
|
|
|
|
|
Средняя арифметическая |
µ |
X |
|
величина |
|||
|
|
||
|
|
|
|
Относительная величина |
π |
Р |
|
|
|
|
|
Дисперсия |
σ2 |
S2 |
|
Коэффициент корреляции |
ρ |
R |
|
|
|
|
Выборочные оценки отличаются от генеральных параметров за счет ошибки наблюдения и ошибки выборки:
Выборочная |
= |
Генеральный |
± |
Ошибка |
± |
Ошибка |
оценка |
|
параметр |
|
наблюдения |
|
выборки |
Поводя итоги, можно утверждать, что описательная статистика является инструментом описания совокупности, по которой полностью имеются исходные данные. Метод статистического вывода позволяет по ограниченным данным выборок сделать заключение о гораздо большей совокупности, по которой не имеется исчерпывающих наблюдений.
Возможны три способа отбора единиц из генеральной совокупности (сам способ, процесс тоже именуется выборкой):
1)случайный отбор;
2)отбор единиц по определенной схеме;
3)сочетание первого и второго способов.
Все ошибки выборочного наблюдения подразделяются на ошибки выборки (случайные); ошибки, вызванные отклонением от схемы отбора (неслучайные); ошибки наблюдения (среди них есть и случайные, и неслучайные).
Репрезентативность (представительность) означает свойство выборки представлять параметры генеральной совокупности в целом в виде выборочных относительных параметров, включая и средние величины. Наличие такого свойства (доказываемого в математической статистике) служит обоснованием справедливости переноса выводов, полученных в отношении выборочной совокупности, на совокупность генеральную (с дополнительным учетом рассчитываемой и количественно контролируемой статистической ошибки,
79
детально описанной в руководствах по статистике. Но, как уже указывалось ранее, это в полной мере возможно только для случайной выборки.
Для расчета объема такой выборки должны быть в наличии следующие данные:
–размер доверительной вероятности (Р);
–коэффициент t, зависящий от принятой вероятности (определяется по статистической таблице «Значение интеграла вероятностей»);
–величина дисперсии (σ2) в генеральной совокупности (на практике заменяется величиной выборочной дисперсии – S2);
– величина минимально допустимой ошибки р;
– объем генеральной совокупности (N).
Объем выборочной совокупности (n) определяется (по упрощенной формуле для повторной случайной выборки) следующим образом:
n = t2 S2 / р2.
Если допустимая ошибка равна 5 % (т. е. вывод исследователя будет верен не менее чем в 95 случаях из 100), то для практических нужд определять репрезентативный (представительный) объем выборки можно по следующей «5 % таблице»:
Таблица 5.1
Репрезентативный объем выборки
Вид совокуп- |
|
|
Объем (количество единиц) |
|
|
||||
ности |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
Генеральная |
500 |
1000 |
2000 |
3000 |
4000 |
5000 |
10000 |
100000 |
|
совокупность |
|||||||||
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
Выборочная |
|
|
|
|
|
|
|
|
|
совокупность |
222 |
286 |
333 |
350 |
360 |
370 |
385 |
398 |
|
(выборка) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|