Материал: baldin_kv_red_matematika_dlia_gumanitariev

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

4.Желательно, чтобы оценка была прочной (робастной) или свободной (не зависящей от распределения).

Часто до проведения исследований закон распределения случайной величины X неизвестен. Поэтому не ясно, какую

оценку принять для параметра x. Целесообразно в этом случае воспользоваться оценкой, эффективность которой при некоторых распределениях может быть меньше единицы, но вид

еене меняется с изменением закона распределения.

5.Размерность оценки должна совпадать с размерностью оцениваемого параметра.

На практике получить оценку, удовлетворяющую всем перечисленным требованиям, удается не всегда. Поэтому необходимо анализировать те последствия, к которым приводят отступления от того или иного требования.

Оценки, удовлетворяющие указанным требованиям, могут быть получены различными методами. Поскольку в дальнейшем будут использоваться уже полученные оценки параметров, то здесь эти методы не рассматриваются. Они достаточно полно изложены в литературе по математической статистике.

12.3.Оцениваниезаконовраспределенияслучайныхвеличин

Как было отмечено в п. 11.1, одной из задач статистической обработки результатов испытаний является установление вида закона распределения случайной величины. На первом этапе решения этой задачи по результатам проведенных испытаний строят статистические функцию и плотность распределения. Анализ полученных графиков и природы исследуемой случайной величины обычно позволяет выдвинуть гипотезу о виде закона ее распределения. Затем по результатам испытаний проверяют справедливость выдвинутой гипотезы.

В данном пункте рассмотрим только первый этап решения указанной задачи.

Значения, принятые случайной величиной X при испытаниях, удобно представить в виде табл. 12.1, называемой прос-

той статистической совокупностью [5].

96

Таблица 12.1

Простая статистическая совокупность

Номер испытания

1

2

i

n

 

 

 

 

 

 

 

Результат

x1

x2

xi

xn

Если результаты наблюдений разместить в порядке возрастания, то получаемая при этом таблица называется вариационным рядом (табл. 12.2). Элементы вариационно-

го ряда называются порядковыми (ранговыми) статис-

тиками. Номер элемента вариационного ряда называется

рангом.

 

 

 

 

 

 

 

 

Таблица 12.2

 

 

вариационный ряд

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ранг элемента

1

 

2

 

r

 

n

Элемент ряда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В случае, когда исследуемая случайная величина дискретного типа или результаты измерений округляются, результаты нескольких наблюдений могут совпадать. Из этого следует, что различные результаты наблюдений могут появляться в выборке с различной частотой, определяемой по формуле

где nk — число появлений в выборке результата xk, . Вариационный ряд, представленный в форме табл. 12. ,

принято называть статистическим рядом.

По известному статистическому ряду строят статистическую (выборочную) функцию распределения F*(x) (рис. 12.2). Ординаты функции F*(x) обычно определяют в точках, отвечающих полученным значениям результатов измерений , по формуле в которой суммирование распространяется на значения , меньшие x.

97

 

 

 

 

 

 

Таблица 12.3

 

 

статистический ряд

 

 

 

 

 

 

 

 

 

 

 

xk

 

 

 

 

 

 

 

 

 

 

 

 

 

nk

n1

n2

nk

nK

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F*(x)

 

 

 

 

1,0

 

 

 

 

 

0

x1

x2

x

xK 1 xK

x

 

 

Рис. 12.2. Статистическая функция распределения

Статистическая функция распределения является кусоч- но-непрерывной. Точками разрыва функции являются полученные значения xk, а величина разрыва в каждой точке численно равна частоте соответствующего результата в выборке. Если каждое из значений xk в выборке получено 1 раз, то величина разрыва в каждой точке одинакова и равна 1/n.

Основанием применимости статистической функции распределения F*(x) для оценивания истинной функции распределения F(x) служит закон больших чисел, в частности, предельная теорема В. И. Гливенко. В соответствии с этой теоремой можно утверждать, что при увеличении объема выборки F*(x) сходится по вероятности к F(x), т. е.

98

Таким образом, статистическая функция распределения F*(x) является состоятельной оценкой функции распределения F(x). Кроме того, она является несмещенной асимптотически эффективной оценкой [17]. Поэтому при достаточно большом n функцию распределения случайной величины можно приближенно заменять ее выборочной функцией распределения.

Однако при большом объеме выборки построение статистической функции распределения путем определения ее значений для каждого из полученных результатов FFF является трудоемким (статистический ряд становится громоздким). В этом случае результаты наблюдений подвергают предварительной обработке, суть которой заключается в следующем. Весь диапазон полученных результатов от xmin до xmax разбивают на m интервалов. Затем определяют частоту попадания результатов измерений в каждый интервал по формуле

где nj — число результатов измерений, попадающих в j-й интервал , включая его левую границу.

Число интервалов не должно быть слишком большим (в этом случае частоты подвергаются незакономерным колебаниям и статистический ряд становится невыразительным) или слишком малым (при этом описание случайной величины статистическим рядом становится грубым). Обычно выбирают 10–20 интервалов. Для ориентировочного определения числа интервалов можно пользоваться соотношениями m 5 lg(n) или [15]. При этом желательно, чтобы выполнялось условие nj $ 5.

Длины интервалов можно брать как одинаковыми, так и различными. Если имеет место значительная неравномерность распределения случайной величины, длины интервалов целесообразно брать различными.

В областях наибольшей изменчивости распределения интервалы должны быть более короткими. В случае, ког-

99

да интервалы различные, обработка экспериментальных данных несколько усложняется.

Итогом предварительной обработки результатов наблюдений является статистический ряд распределения случайной величины (табл. 12.4).

 

 

 

 

 

 

Таблица 12.4

 

статистический ряд распределения

 

 

 

 

 

 

 

 

Интервалы

xmin # x < x1

x1 # x < x2

xj-1 # x < xj

xm-1 # x < xmax

nj

n1

n2

nj

nm

 

 

 

 

 

 

 

 

 

 

 

 

Статистическую функцию распределения строят в виде ломаной линии с вершинами в граничных точках выбранных интервалов (см. рис. 12. ). Ординаты функции F*(x) в этих точках равны накопленным частотам:

(12.4)

Знание статистического ряда позволяет построить статистическую плотность распределения f*(x), график которой принято называть гистограммой. Гистограмму строят следующим образом. На каждом из выбранных интервалов, как на основании, строят прямоугольники, площадь которых равна частоте попадания полученных результатов наблюдений на данный интервал. Высоты прямоугольников определяют из соотношения

400