Материал: baldin_kv_red_matematika_dlia_gumanitariev

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

12.МетОдыстатистическОйОбрабОтки реЗультатОвисПытаний

12.1.Постановказадачиоцениваниявероятностных характеристикслучайныхвеличин

Предположим, цель эксперимента состоит в определении вероятностных характеристик некоторой случайной величины X. При n независимых наблюдениях этой случайной величины получена случайная выборка {X1, X2, …, Xn}. Требуется по результатам ограниченного числа наблюдений {x1, x2, …, xn} выработать суждение о вероятностных характеристиках этой случайной величины.

Известно, что исчерпывающей вероятностной характеристикой случайной величины является закон ее распределения. Поэтому одной из задач обработки результатов испытаний является построение закона распределения случайной величины (статистической функции или статистической плотности распределения) по экспериментальным данным.

Часто для описания случайной величины достаточно знания ее числовых характеристик (математического ожидания, дисперсии, стандартного отклонения, других моментов). В этом случае возникает необходимость в определении по результатам испытаний значений этих характеристик.

Поскольку объем выборки ограничен, то методы математической статистики позволяют находить лишь приближенные значения указанных характеристик, т. е. их оценки.

При оценивании параметров в математической статистике используют два подхода: точечное и интервальное оценивание. При точечном оценивании по результатам испытаний находят число (точку на числовой оси), которое принимают в качестве приближенного значения оцениваемого параметра. Полученное число называют оценкой параметра. В дальнейшем оценку параметра будем обозначать * и использовать символическую запись * → ( * является точечной оценкой параметра ). В частности, параметром может быть математическое ожида-

91

ние mx, дисперсия Dx, стандартное отклонение sx, вероятность P наступления случайного события и другие параметры случайной величины.

Оценка параметра является функцией результатов испытаний, т. е. статистикой:

* = s(X1, X2, …, Xn).

(12.1)

Следовательно, оценка * является случайной величиной с присущим ей законом распределения и числовыми характе-

ристиками. Знание вероятностных характеристик позволяет выявить статистические свойства оценок, устанавливать их точность и на этой основе выбирать наилучшие оценки.

При интервальном оценивании определяют интервал, который с заданной вероятностью накрывает истинное значение оцениваемого параметра. Границы интервала являются функциями результатов испытаний. Поэтому в общем случае границы интервала, а следовательно, и сам интервал, будут случайными:

s (X1, X2, …, Xn) # # s0(X1, X2, …, Xn),

(12.2)

где s (X1, X2, …, Xn), s0(X1, X2, …, Xn) — статистики, отличные от статистики (12.1) и в каждом конкретном случае определяемые соответствующими соотношениями.

В математической статистике рассматриваемый интервал принято называть доверительным интервалом, а вероятность, с которой он накрывает истинное значение параметра, — дове-

рительной вероятностью.

Основное назначение доверительных оценок — характеризовать качество точечных оценок, определяемое их точностью и надежностью (достоверностью).

12.2.Основныетребованиякоценкам

Вид оценки каждой числовой характеристики выбирают один раз применительно к исследованию любой случайной величины. Эту выбранную оценку используют во всех случаях

92

нахождения неизвестных значений данной числовой характеристики. Поэтому оценки выбирают так, чтобы при их массовом применении обеспечивалась наибольшая точность определения числовых характеристик. Чтобы оценки имели такое свойство, к ним предъявляют соответствующие требования

[1, 10, 14, 15].

1. Оценка параметра x должна быть несмещенной, т. е. математическое ожидание оценки должно быть равно истинному значению искомого параметра:

(12. )

Достоинством несмещенной оценки является то, что получаемые с ее помощью значения искомого параметра группируются около действительного значения этого параметра и при массовом применении такой оценки в среднем будут равны этому значению. Применение несмещенных оценок обеспечивает отсутствие систематических ошибок определения неизвестных значений характеристик.

Если то оценку называют положительно

смещенной, если — отрицательно смещенной.

На практике иногда используют оценки, которые при малом объеме выборки n являются смещенными, но при увеличении n величина смещения стремится к нулю. Такие оценки называют асимптотически несмещенными. Оценка — асимп-

тотически несмещенная, если выполняется условие

2. Оценка должна иметь минимальную дисперсию. Для одного и того же параметра можно подобрать не одну, а несколько несмещенных оценок. На рис. 12.1 показаны плотности вероятности трех несмещенных оценок параметра x, полученные при одном и том же объеме выборки n.

Как следует из рисунка, оценки имеют разные дисперсии. Поэтому значения параметра x, полученные с помощью этих оценок, будут иметь различное рассеивание относительно истинного значения этого па-

9

f(

*

f( *x )

 

 

x)

1

 

 

 

 

 

 

 

 

f(

*x )

 

 

 

 

2

*x )

 

 

 

f(

 

 

 

 

 

*

x x

Рис. 12.1. Плотности распределений различных оценок

раметра. Очевидно, что наилучшей из оценок является оценка с наименьшей дисперсией.

Отсюда вытекает, что одновременно с требованием несмещенности оценка должна удовлетворять еще одному требованию. Необходимо, чтобы при данном числе испытаний оценка имела минимальную дисперсию. Не-

смещенная оценка, имеющая минимальную дисперсию, называется эффективной оценкой.

Минимальная дисперсия несмещенной оценки определяется выражением

где n— объем выборки из генеральной совокупности;

I( x; x) — количество информации о параметре x, содержащееся в одном наблюдении, так называемое информационное количество Фишера.

где f (x, x) — плотность распределения случайной величины X.

94

Выражение для минимальной дисперсии смещенной оценки записывается в виде [1 , 14, 15]:

В качестве показателя эффективности оценки параметра x используют меру эффективности e, равную отношению минимально возможной величины дисперсии оценки к дисперсии данной конкретной оценки (0 # e # 1):

Асимптотической эффективностью ea оценки = s(X1, X2, …, Xn), полученной по независимой выборке, называют предел

если он существует. Оценка будет асимптотически эффективной, если ea() = 1.

. Оценка должна быть состоятельной, т. е. сходиться по вероятности с увеличением числа испытаний к оцениваемому параметру:

Состоятельная оценка должна быть асимптотически несмещенной, и с увеличением объема выборки дисперсия оценки должнауменьшаться.Поэтомувкачествесостоятельностиоценки можно принять одновременное выполнение двух равенств:

Таким образом, состоятельная оценка всегда асимптотически несмещенная и имеет минимальную дисперсию.

95