Теоретический материал   Reading materials  

Web-версия учебного курса "Основы математической статистики"

Раздел 1.   Оценка параметров распределений

Результат любого прямого или косвенного измерения есть случайная величина. Предполагая, что средства и методы измерения и обработки данных не вносят систематической погрешности, будем считать объективно существующее истинное значение измеряемого параметра математическим ожиданием этой случайной величины. Точно определить это истинное значение принципиально невозможно. Все, что доступно нам, это, повторив измерения несколько (n) раз, получить выборку из n значений данной случайной величины: х1, х2, ... хj, ... xn. (иногда говорят, что это выборка объема n из генеральной совокупности значений случайной величины, понимая под генеральной совокупностью бесконечное множество значений, в котором каждое значение встречается с частотой, соответствующей его вероятности). С элементами выборки мы можем производить любые арифметические действия, образуя по определенным правилам новые значения, которые называются "выборочными характеристиками".

Выборочная характеристика, которая позволяет судить о параметре закона распределения случайной величины, называется оценкой этого параметра.

Отметим, что оценка сама является случайной величиной. Действительно, взяв в качестве оценки математического ожидания (Mx) случайной величины х среднее арифметическое элементов выборки:

                                                    (1.1)

и повторив опыт снова, т.е. опять сделав n измерений той же величины, получим другой набор х1, х2, ... хj, ... xn и другое , хотя истинное значение измеряемого параметра останется тем же.

К оценкам предъявляются следующие требования:

1. Оценка должна быть несмещенной, т.е. математическое ожидание оценки должно равняться оцениваемому параметру;

2. Оценка должна быть состоятельной, т.е. с увеличением объема выборки она должна сходиться к оцениваемому параметру по вероятности;

3. Оценка должна быть эффективной, т.е. при данном объеме выборки иметь минимальную дисперсию.

Общий метод нахождения оценок - метод максимума правдоподобия . Мы не будем его рассматривать, так как практическое значение для нас имеют лишь следующие выборочные характеристики, удовлетворяющие вышеперечисленным требованиям к оценкам:

1) в качестве оценки математического ожидания - среднее арифметическое выборки (см.(1.1));

2) в качестве оценки дисперсии случайной величины х - значение, определяемое формулой

;                                             (1.2)

3) в качестве оценки дисперсии среднего арифметического - значение, определяемое формулой

;                                             (1.3)

4) в качестве оценок коэффициентов линейных моделей - оценки, полученные методом наименьших квадратов ;

5) в качестве оценки истинного значения величины х, определяемой в серии из к измерений, каждое из которых выполнено различными методами (приборами), имеющими различные дисперсии, -среднее взвешенное значение , определяемое формулой :

,                                                        (1.4)

Здесь хj - результат измерения j-ым методом (прибором), это, как правило, среднее арифметическое ряда повторных измерений тем же методом (прибором), Sj2- оценка дисперсии этого результата. Если дисперсия одного результата для каждого метода (прибора) известна достаточно точно, то хj может быть получено однократно, тогда в (1.4, 1.5) вместо оценок дисперсий ставятся значения соответствующих дисперсий;

6) в качестве оценки дисперсии - средневзвешенного значения - значение, определяемое формулой:

.                                             (1.5)

В заключение этого раздела подчеркнем еще раз различие оценок (1.2) и (1.3)

- это оценка дисперсии случайной величины x, или одного элемента выборки,

- это оценка дисперсии среднего арифметического n элементов выборки. Первая оценка характеризует разброс результатов одного измерения или технологический разброс параметра одного изделия. Она используется при метрологической аттестации средств и методов измерений, а также при оценке погрешности результата, если сделано всего одно измерение. Ее значение не зависит от объема выборки. Вторая - характеризует погрешность результата измерения, полученного усреднением n отсчетов, с ростом n ее значение уменьшается, доверительный интервал для искомого результата сужается, т.е. точность результата с ростом числа измерений растет.