Материал: 343

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

1.2. Пример решения типовой задачи

Рассмотрим, например, показатель «Преступления, совершенные в районах города».

Таблица 1.5

Преступления, совершенные в районах города Петровска

 

Коли-

 

Наименование

Относит. уровень

Наименова-

чество

 

ОВД, упорядо-

преступности

пре-

ченных по относи-

в городах (кол-во

ние ОВД

ступле-

 

тельному уровню

преступлений

 

 

 

ний

 

преступности

на 100 тыс. чел.)

 

 

 

 

 

Алексеев-

1854

1

Сурожский

9,71

ское

 

 

 

 

 

 

 

 

 

Вяземский

1011

2

Павловский

10,90

 

 

 

 

 

Гороховский

240

3

Медведевское

12,16

 

 

 

 

 

Гусевское

2083

4

Косинский

13,11

 

 

 

 

 

Каменский

294

5

Вяземский

13,68 moda

 

 

 

 

 

Качинский

510

6

Сусанинский

13,68

 

 

 

 

 

Киреевское

2884

7

Гороховский

13,71

 

 

 

 

 

Косинский

679

8

Каменский

13,74 mediana

 

 

 

 

 

Макаров-

289

9

Качинский

13,97 mediana

ский

 

 

 

 

 

 

 

 

 

Медведев-

1759

10

Макаровский

15,97

ское

 

 

 

 

 

 

 

 

 

Павловский

645

11

Алексеевское

16,55

 

 

 

 

 

Сергеевский

225

12

Киреевское

16,94

 

 

 

 

 

Собинов-

913

13

Юрьевский

18,06

ский

 

 

 

 

 

 

 

 

 

Сурожский

232

14

Собиновский

18,22

 

 

 

 

 

Сусанин-

223

15

Гусевское

18,72

ский

 

 

 

 

 

 

 

 

 

Юрьевский

390

16

Сергеевский

21,23

 

 

 

 

 

Мода (Мо) – наиболее часто встречающееся значение ряда. В приведенном ряду значений, нормированных по численности

16

населения, как правило, моды быть не может (мода вырожденная), т. к. каждое значение встречается всего лишь по одному разу. Хотя

вданном случае в качестве моды указано значение 13,68, это значение, на самом деле, представляет собой с определенной точностью округление, удовлетворяющее по точности цели проводимого анализа. Строго говоря, никакие пары исходных (неокругленных) значений не совпадают: так, при округлении с большей точностью Вяземский ГОВД имеет значение, равное 13.680649, а Сусанинский РОВД – 13.680981, т. е. хоть ненамного, но больше. Поскольку для цели данного анализа такая повышенная точность не имеет никакой роли, заключение (вывод) о равенстве либо неравенстве значений производится уже на основе округленных значений.

Итак, исходные данные, нормированные по населению, не обладают модой (или, что фактически то же самое, формально каждое значение может считаться модой). Но такие данные можно предварительно сгруппировать и рассматривать моду уже группированных данных. Для этого выберем диапазон данных, включающий все имеющиеся данные. В качестве границ диапазона на числовой оси удобно выбрать значения достаточно круглые и ближайшие к крайним (наибольшему и наименьшему значениям исходных данных). При этом нижняя граница избирается как достаточно круглое значение, меньше меньшего значения анализируемых данных, а верхняя – больше большего. Конкретно в рассматриваемом случае анализируемые данные варьируются (изменяются) в пределах от 9,71 до 21,23, и за соответствующие им круглые значения диапазона можно принять 9,5 и 21,5.

Примечание. Конечно, можно избрать и такие границы диапазона, как, например, 9,0 и 22,0, значения которых еще более круглые и потому, казалось бы, более удобные. Это, однако, не так. Выбор указанных значений границ обусловлен двумя обстоятельствами: во-первых, диапазон в этих границах минимален, жестко охватывает реальные данные. Во-вторых, он равен 12, т. е. может быть разбит и на два, и на три, и на четыре, и даже на шесть равных интервалов без остатка, что представляет дополнительное удобство при визуальном анализе, поскольку границы интервалов при этом также будут числами круглыми. Разумеется, для результатов компьютерного анализа округлость граничных значений не играет никакой роли, но дробные значения несколько затрудняют восприятие их человеком. Кроме того, число интервалов должно быть примерно в несколько раз меньше, чем число данных

вряде. В зависимости от количества интервалов, на которые разбивается диапазон значений, результаты могут по-разному восприниматься, поэтому порой следует рассмотреть не один вариант подобного разбиения. Рассмотрим ряд таких разбиений имеющегося диапазона

17

размером 12. Договоримся здесь считать правую границу включенной в интервал, а левую, соответственно, не включенной в него (вообще, можно включать и наоборот, лишь бы никакое граничное значение не оказалось учтенным дважды – и в одном, и в другом интервале).

Диапазон разбит на 6 равных интервалов. Тогда получаем следующую картинку-график, которую именуют гистограммой (иными словами: эмпирическим статистическим распределением данных по рассматриваемому показателю):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

12

 

15

 

 

 

 

 

 

2

 

4

 

 

6

 

11

 

14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

3

 

 

5

 

10

 

13

 

16

 

 

 

 

9,5

11,5

13,5

Мо 15,5

17,5

19,5

21,5

 

Номера значений в гистограмме, как правило, не проставляют, здесь же они даны для наглядности и удобства дальнейшего анализа. Сами значения в гистограмме уже утрачивают свою точность – их рассматривают лишь с точностью до интервала, в который они попали, т. е. до группы, задаваемой этим интервалом. О двух минимальных значениях районов области из гистограммы известно, что они между 9,5 и 11,5; два последующих – между 11,6 и 13,5; пять значений – между 13,5 и 15,5; три значения – между 15,5 и 17,5; три значения – между 17,5 и 19,5; одно – между 19,5 и 21,5. Здесь наиболее часто (в 31 % случаев) встречается вариант: интервал между 13,5 и 15,5 (границы модального интервала иногда для простоты заменяют с некоторой неизбежной потерей информации о характере распределения на значение его середины – 14,5).

Вот иные варианты разбиения диапазона на интервалы. Вариант: четыре интервала с длиной, соответственно, 12/4=3:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

14

 

 

 

 

 

 

 

 

 

 

7

 

 

13

 

 

 

 

 

 

 

 

3

 

6

 

 

12

 

 

 

 

 

 

 

 

2

 

5

 

 

11

 

 

16

 

 

 

 

1

 

4

 

 

10

 

 

15

 

 

9,5

12,5

Мо

15,5

17,5

18,5

21,5

18

При таком разбиении значение моды, определяемое значением, встречающимся в 37,5 % случаев, таково: интервал между 12,5 и 15,5 (середина модального интервала – 14).

Вариант: три интервала с длиной, соответственно, 12/3=4:

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

11

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

4

 

8

 

 

16

 

 

 

3

 

7

 

 

15

 

 

 

2

 

6

 

 

14

 

 

 

1

 

5

 

 

13

 

 

 

9,5

13,5

Мо

17,5

21,5

При таком разбиении значение моды, определяемое значением, встречающимся в 50 % случаев, таково: интервал между 13,5 и 17,5 (середина модального интервала – 15,5).

Вариант: восемь интервалов с длиной, соответственно, 12/8=1,5:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

5

 

 

 

 

11

 

14

 

 

 

 

 

 

 

 

 

 

1

 

3

 

4

 

 

 

 

10

 

13

 

15

 

16

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9,5

11,0

12,5

14,0

15,5

17,0

18,5

20,0

21,5

 

 

 

При таком разбиении значение моды, определяемое значением, встречающимся в 37,5 % случаев, таково: интервал между 12,5 и 14,0 (середина модального интервала – 13,25).

Вариант: двенадцать интервалов с длиной, соответственно, 12/12=1:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

12

 

14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

3

 

4

 

5

 

 

 

 

 

10

 

11

 

13

 

15

 

 

 

16

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9,5

10,5

11,5

12,5

13,5

14,5

15,5

16,5

17,5

18,5

19,5

20,5

21,5

 

19

При таком разбиении значение моды, определяемое значением, встречающимся в 31 % случаев, таково: интервал между 13,5 и 14,5 (середина модального интервала – 14,0).

Вариант: два интервала с длиной, соответственно, 12/2=6:

 

 

 

 

 

 

9

 

 

 

 

 

8

 

 

 

 

 

7

 

16

 

 

6

 

15

 

 

5

 

14

 

 

4

 

13

 

 

3

 

12

 

 

2

 

11

 

 

1

 

10

 

 

9,5

15,5

21,5

 

При таком разбиении значение моды, определяемое значением, встречающимся в 56,25 % случаев, таково: интервал между 9,5 и 15,5 (середина модального интервала – 12,5).

Медиана представляет вид среднего, которое типично в том смысле, что значение объекта, признанное медианным, таково, что меньше его ровно столько же значений, сколько и тех, что больше его. Особенность медианы в сравнении с прочими видами средних в том, что всегда найдется реальный объект с такими значениями (при других средних это в большинстве случаев расчетное значение).

Медиана (Ме) определяется как значение члена числового ряда, стоящего в его середине, если число членов ряда нечетно. Формула для номера члена ряда с нечетным числом членов такая: №Me = (n+1)/2. Например, если n = 15, то №Me = 8. Если число членов четное, то берется полусумма двух подряд идущих членов ряда с номером № = (n+1)/2 и соответственно, № = (n+1)/2+1. В данном случае n = 16, поэтому №Me = 8 и 9, а сама медиана Me = (13,74 + +13,97) = 13,86.

Примечание. Когда ряд ранжирован, но при этом он не количественной, а качественной природы (порядковая шкала измерения – «больше – меньше», «хуже – лучше» и т. п.), когда операции и сложения, и деления попросту отсутствуют, при нечетном числе членов применима указанная выше формула. А при четном числе членов ранжированного ряда в качестве медианы из двух рядом стоящих возможных значений выбирается то, на которое укажет какой-либо «механизм случайных чисел» (например, монета, которую подбра-

20