МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное
учреждение высшего профессионального образования
«Государственный университет по землеустройству»
Кафедра землепользования и кадастра
Расчётно-графическая работа по дисциплине «Методы статистической обработки информации»
Статистическая обработка кадастровой информации
Вариант 27
Выполнил:
Проверила:
Москва 2020
Тема 1 «Статистическая сводка и группировка»
Задача 1. Группировка по одному признаку, построение и анализ групповой таблицы
В результате статистического наблюдения получены значения признаков хозяйственной деятельности 30 сельскохозяйственных коммерческих организаций подзоны области, представленных в таблице 1.
Табл.1 Условия и результаты хозяйственной деятельности совокупности сельскохозяйственных организаций
N/ N
|
Выручка от реализации с.х. продукции, тыс. руб.
|
С.х. угодья, га
|
Число работников чел.
|
Полная себестоимость реализованной с.х. продукции, тыс.руб.
|
Производственные затраты в сельском хозяйстве, тыс.руб.
|
Энергоресурсы, л.с. |
Балл качества почв |
1 |
36054 |
5229 |
157 |
34215 |
42899 |
23897 |
71 |
2 |
28975 |
2677 |
156 |
32374 |
39254 |
13920 |
91 |
3 |
3100 |
120 |
26 |
3047 |
3047 |
1090 |
142 |
4 |
238 |
145 |
10 |
149 |
853 |
560 |
49 |
5 |
33828 |
2442 |
84 |
33538 |
44114 |
15751 |
116 |
6 |
21071 |
1906 |
90 |
26375 |
40579 |
10388 |
96 |
7 |
23885 |
1634 |
88 |
31627 |
44079 |
11307 |
124 |
8 |
27859 |
1667 |
112 |
38336 |
50424 |
12052 |
126 |
9 |
28188 |
1847 |
104 |
27857 |
37042 |
12874 |
125 |
10 |
30411 |
2212 |
97 |
26616 |
44762 |
13714 |
114 |
11 |
21998 |
1499 |
73 |
23696 |
33527 |
10388 |
124 |
12 |
24145 |
1071 |
93 |
33186 |
26653 |
8664 |
138 |
13 |
3542 |
879 |
35 |
6385 |
11315 |
3542 |
58 |
14 |
6903 |
586 |
30 |
8921 |
11067 |
3452 |
104 |
15 |
14205 |
3596 |
64 |
14278 |
28374 |
14816 |
59 |
16 |
95056 |
2466 |
448 |
130695 |
157283 |
21947 |
150 |
17 |
167438 |
7640 |
429 |
155950 |
233666 |
61731 |
136 |
18 |
224307 |
13410 |
640 |
232490 |
372809 |
97223 |
127 |
19 |
9703 |
1565 |
38 |
11377 |
12890 |
6620 |
65 |
20 |
57811 |
2503 |
114 |
74217 |
115918 |
20274 |
139 |
21 |
88787 |
7588 |
265 |
84525 |
165689 |
44086 |
101 |
22 |
7561 |
2560 |
73 |
15580 |
16642 |
9984 |
54 |
23 |
33129 |
4718 |
149 |
33829 |
53995 |
21608 |
71 |
24 |
158280 |
5023 |
345 |
132085 |
172031 |
45960 |
144 |
25 |
38078 |
4426 |
212 |
38866 |
62098 |
22130 |
80 |
26 |
16602 |
3998 |
94 |
26079 |
23488 |
16032 |
60 |
27 |
25388 |
7004 |
195 |
64935 |
71004 |
27876 |
57 |
28 |
27443 |
4194 |
91 |
24348 |
29238 |
18915 |
69 |
29 |
20266 |
3652 |
114 |
23773 |
30701 |
15046 |
61 |
30 |
23357 |
2227 |
81 |
22998 |
34622 |
11425 |
89 |
Требуется: провести статистическую группировку предприятий по качеству пашни, дать всестороннюю характеристику выделенных групп при помощи системы статистических показателей с целью выявления влияния качества почв на экономическую эффективность сельскохозяйственного производства.
Методические указания. Статистическая группировка - важнейшая составная часть второго этапа статистического исследования – сводки, в результате которой на основании зарегистрированных при статистическом наблюдении индивидуальных признаков отдельных единиц статистической совокупности получаются статистические показатели как общие (сводные) признаки массового явления.
Статистическая группировка – это метод разделения сложного массового явления на существенно различные группы. Он позволяет исчислить показатели для каждой группы и, таким образом, всесторонне охарактеризовать состояние, развитие и взаимосвязи изучаемого явления в целом. Одновременно группировка представляет собой процесс объединения в группы однородных единиц, по которым возможна сводка значений варьирующих признаков и получение статистических показателей.
Выделение группы ведется по величине и значению характеризующих единицы совокупности признаков. Поэтому важно правильно выделить и отобрать такие признаки, чтобы отделить друг от друга действительно различные группы единиц. Признаки должны быть существенными, чтобы выделить типичные для рассматриваемого явления группы. Если взять малозначимые признаки, не определяющие главные различия в изучаемом явлении, то можно получить поверхностное или даже искаженное представление о нем. Наряду с этим необходимо учитывать также задачи исследования.
По условиям задачи рассматривается совокупность коммерческих организаций, ведущих товарное сельскохозяйственное производство в одной из сельскохозяйственных подзон области, работающих на землях разного качества. Поскольку ставилась задача выделения групп организаций, различающихся почвенными условиями, то в нашем случае с учётом имеющейся информации группировочным признаком будет оценка качества пашни в баллах.
Табл. 2 Вариационный ряд распределения с.-х. организаций по баллу пашни
№ п/п |
Балл |
№ п/п |
Балл |
№ п/п |
Балл |
1 |
71 |
11 |
124 |
21 |
101 |
2 |
91 |
12 |
138 |
22 |
54 |
3 |
142 |
13 |
58 |
23 |
71 |
4 |
49 |
14 |
104 |
24 |
144 |
5 |
116 |
15 |
59 |
25 |
80 |
6 |
96 |
16 |
150 |
26 |
60 |
7 |
124 |
17 |
136 |
27 |
57 |
8 |
126 |
18 |
127 |
28 |
69 |
9 |
125 |
19 |
65 |
29 |
61 |
10 |
114 |
20 |
139 |
30 |
89 |
По данным вариационного ряда видно, что в совокупности организаций имеются большие различия в величине группировочного признака - от 49 до 150 баллов.
Далее важно правильно разделить единицы совокупности на группы. Здесь необходимо соблюдать два требования:
Состав групп должен быть качественно однородными, а сами группы - существенно различными друг от друга.
Единиц в группе должно быть достаточно много, чтобы проявились типичные черты групп и выявились закономерные причинно-следственные взаимосвязи между статистическими показателями, характеризующими группы.
При выделении групп надо учитывать характер группировочного признака. Если признак атрибутивный (качественный), то по каждому его значению (форма собственности, профессия работника, тип почвы и т.п.) следует выделить столько групп, сколько существует градаций признака. Так же поступают, если признак количественный дискретный и принимает небольшое число целочисленных значений (число членов семьи, число комнат в квартире и т.п.).
В решаемой задаче признак количественный, дискретный, варьирующий в достаточно широких границах. В этом случае необходимо установить качественные переходы в его величине, то есть определить те границы, где заканчивается одна группа единиц и начинается другая. Для этого следует сравнивать величину группировочного признака с ранее оцененными величинами или нормативами, в которых качественные переходы уже установлены или очевидны. Так если бы рассматривался вариационный ряд по сумме полученной прибыли и убытка, то переход от плюса (прибыль) к минусу (убыток) был бы качественной границей и выделялись бы группы прибыльных и убыточных организаций.
В нашем случае нормативов нет и установить границы групп указанным выше путем не представляется возможным. В таком случае рекомендуется устанавливать границы в величине группировочного признака и выделять группы по этапам:
Построить
ранжированный ряд, в котором все единицы
совокупности располагаются по нарастанию
или убыванию группировочного признака,
и проанализировать его. Для этой цели
целесообразно воспользоваться опцией
«Сортировка» в программе Excel:
необходимо выделить всю базу данных
(только числовые данные, без названия
граф), затем указать столбец, по которому
будет проведена сортировка (в нашем
случае это балл пашни). Принцип «
»
- расположение единиц по возрастанию
признака, а «
»
соответственно, по убыванию. В
отсортированных данных первый порядковый
номер будет иметь организация с самым
низким баллом, последний порядковый
номер – с самым высоким (табл. 3).
При выполнении этого этапа работы следует помнить, что если изначально выделить не всю базу данных, а только столбец группировочного признака, то будет проранжирован только этот столбец, при этом остальные характеристики с.-х. организаций не поменяют своего места. В результате произойдет смещение информации, и она будет непригодна для дальнейшего анализа.
Для наглядности ранжированный ряд можно представить графически, где на оси ординат отражается значение признака, а на оси абсцисс – номера по ранжиру (рис. 1). График ранжированного ряда называется огива Гальтона.
Табл.3. Сортировка данных по качеству пашни
N/ N
|
Выручка от реализации с.х. продукции, тыс. руб.
|
С.х. угодья, га
|
Число работников чел.
|
Полная себестоимость реализованной с.х. продукции, тыс.руб.
|
Производственные затраты в сельском хозяйстве, тыс.руб.
|
Энергоресурсы, л.с. |
Балл качества почв |
1 |
238 |
145 |
10 |
149 |
853 |
560 |
49 |
2 |
7561 |
2560 |
73 |
15580 |
16642 |
9984 |
54 |
3 |
25388 |
7004 |
195 |
64935 |
71004 |
27876 |
57 |
4 |
3542 |
879 |
35 |
6385 |
11315 |
3542 |
58 |
5 |
14205 |
3596 |
64 |
14278 |
28374 |
14816 |
59 |
6 |
16602 |
3998 |
94 |
26079 |
23488 |
16032 |
60 |
7 |
20266 |
3652 |
114 |
23773 |
30701 |
15046 |
61 |
8 |
9703 |
1565 |
38 |
11377 |
12890 |
6620 |
65 |
9 |
27443 |
4194 |
91 |
24348 |
29238 |
18915 |
69 |
10 |
36054 |
5229 |
157 |
34215 |
42899 |
23897 |
71 |
11 |
33129 |
4718 |
149 |
33829 |
53995 |
21608 |
71 |
12 |
38078 |
4426 |
212 |
38866 |
62098 |
22130 |
80 |
13 |
23357 |
2227 |
81 |
22998 |
34622 |
11425 |
89 |
14 |
28975 |
2677 |
156 |
32374 |
39254 |
13920 |
91 |
15 |
21071 |
1906 |
90 |
26375 |
40579 |
10388 |
96 |
16 |
88787 |
7588 |
265 |
84525 |
165689 |
44086 |
101 |
17 |
6903 |
586 |
30 |
8921 |
11067 |
3452 |
104 |
18 |
30411 |
2212 |
97 |
26616 |
44762 |
13714 |
114 |
19 |
33828 |
2442 |
84 |
33538 |
44114 |
15751 |
116 |
20 |
23885 |
1634 |
88 |
31627 |
44079 |
11307 |
124 |
21 |
21998 |
1499 |
73 |
23696 |
33527 |
10388 |
124 |
22 |
28188 |
1847 |
104 |
27857 |
37042 |
12874 |
125 |
23 |
27859 |
1667 |
112 |
38336 |
50424 |
12052 |
126 |
24 |
224307 |
13410 |
640 |
232490 |
372809 |
97223 |
127 |
25 |
167438 |
7640 |
429 |
155950 |
233666 |
61731 |
136 |
26 |
24145 |
1071 |
93 |
33186 |
26653 |
8664 |
138 |
27 |
57811 |
2503 |
114 |
74217 |
115918 |
20274 |
139 |
28 |
3100 |
120 |
26 |
3047 |
3047 |
1090 |
142 |
29 |
158280 |
5023 |
345 |
132085 |
172031 |
45960 |
144 |
30 |
95056 |
2466 |
448 |
130695 |
157283 |
21947 |
150 |
Рис 1.
При анализе ранжированного ряда оценивается интенсивность изменения величины группировочного признака от одной единицы совокупности к другой. Если имеются резкие изменения и большой отрыв ряда единиц от всей совокупности, то их выделяют в особую группу. В нашем примере группировочный признак нарастает плавно, резких отклонений отдельных значений нет, и выделить группы по данным этого ряда невозможно.
При отсутствии явных качественных
переходов в ранжированном ряду строится
интервальный ряд распределения. Для
его построения необходимо знать число
групп и границы интервалов. Число групп
К зависит от численности единиц
исходной совокупности N
и определяется по формуле Стерджесса:
lgN.
Для
совокупностей небольшого объема (менее
50 единиц) число групп можно определить
приближённо по формуле К=
групп. Так как число групп не может быть
дробным, то округляем результат до
целого значения.
Для определения границ интервалов
найдем шаг интервала h
по формуле
балла,
где xmin – минимальное значение признака в ранжированном ряду;
xmax – максимальное значение признака в ранжированном ряду.
Шаг интервала обычно округляется в большую сторону (h=21). В противном случае единицы с самыми высокими значениями группировочного признака могут оказаться за пределами последнего интервала.
Минимальный балл, равный 49, принимается за нижнюю границу первого интервала, а верхняя определяется как xmin+h=49+21=70. Границы первого интервала составляют от 49 до 70. Верхняя граница первого интервала служит нижней границей второго интервала. Прибавляя к ней значение шага интервала, определим верхнюю границу второго интервала: 70 – 91. Чтобы решить, в какую группу попадут значения 70 – первую или вторую, примем, что верхние интервалы берутся включительно, поэтому во вторую группу войдут значения свыше 70. Аналогично определяем границы всех пяти интервалов.
Далее подсчитывается число организаций в каждом интервале, т.е. распределяются индивидуальные значения каждой организации по интервальным группам, и строится интервальный ряд распределения (табл. 4).
Для наглядности строим график интервального вариационного ряда распределения. По оси абсцисс указываем границы интервалов в порядке возрастания, по оси ординат – число хозяйств в каждом интервале. Такой график называется гистограммой (рис. 2).
Табл. 4. Интервальный вариационный ряд распределения
организаций по баллу пашни
№ группы |
Интервалы по баллу пашни |
Число организа-ций |
Номера единиц совокупности по базе данных (табл.1) |
||
1 |
49-70 |
9 |
4, 22, 27, 13, 15, 26, 29, 19, 28 |
||
2 |
70-91 |
5 |
1, 23, 25, 30, 2 |
||
3 |
91-112 |
3 |
6, 21, 14 |
||
4 |
112-133 |
7 |
10, 5, 7, 11, 9, 8, 18 |
||
5 |
133-154 |
6 |
17, 12, 20, 3, 24, 16 |
||
Итого |
30 |
x |
|||