Теоретический материал   Reading materials  

Web-версия учебного курса "Основы математической статистики"

Раздел 2.2.  Распределение  Χ 2. Доверительный интервал для дисперсии

По закону Χ2 ("хи-квадрат") распределена сумма ν квадратов независимых нормально распределенных величин, каждая из которых имеет математическое ожидание, равное 0, и дисперсию, равную 1. Очевидно, у этого закона один параметр ν, получивший название - "число степеней свободы". Используя элементарные знания теории вероятностей, легко показать, что математическое ожидание MΧν2 = ν, дисперсия DΧν2 = 2ν, плотность распределения p(Χν2) имеет один максимум, который при ν = 1 и ν = 2 лежит в точке Χν2 = 0, а затем с ростом ν сдвигается в сторону увеличения Χν2. При очень больших ν (ν > 30) распределение, как следует из центральной предельной теоремы, практически неотличимо от нормального с соответствующими значениями матeматического ожидания и дисперсии. Можно показать, что комбинация

.                                        (2.1)

Здесь n - объем выборки; Sx2 - оценка дисперсии результата измерения х, определенная по формуле (1.2);
σ
2 - "истинная" дисперсия результата измерения, т.е. оцениваемый параметр, который нам не известен; символ "~" здесь и в дальнейшем использован для сокращения записи вместо слов "распределено по закону".

Рассмотрим на примере, как закон (2.1) можно использовать для построения доверительного интервала для дисперсии. Допустим, что мы создали новую установку для измерения длины волны λ в оптическом спектре. Нас интересует оценка случайной погрешности измерений на этой установке, т.е. какова дисперсия значений длин волн, полученных на нашей установке. Осветим установку источником с паспортизованной длиной волны (например, λ0= 632,8 нм) и выполним 5 измерений. Получим выборку из пяти значений: λ1= 633.1 нм, λ 2 = 632.9 нм, λ3 = 633.4 нм, λ 4 = 633.3 нм, λ5= 632.5 нм.
Вычислим согласно (1.1) и (1.2)
= 633.04 нм, Sλ2 = 0.128 нм2.

Теперь попробуем найти интервал, в котором дисперсия значения измеренной длины волны лежит с вероятностью, например, P = 0.9. Если бы нам удалось точно оценить дисперсию, т.е. Sλ2 равнялось бы σ2 , это означало бы, что Χ2 согласно (2.1) приняло значение n-1, т.е. своего математического ожидания. Разумеется, это практически невероятный счастливый случай. Нас устроит попадание Χ2 в интервал, простирающийся "влево" и "вправо" от математического ожидания и соответствующий вероятности 0.9. Найти его можно с помощью таблицы Χ2 - распределения Строки таблицы соответствуют разным значениям числа степеней свободы, столбцы - значениям вероятности того, что случайная величина Χ2 примет значение большее, чем Χ2q - число, стоящее в соответствующей клетке таблицы. Выбрав строку с ν = 4 (у нас было n = 5 элементов выборки, а ν = n - 1), находим, что в этом случае Χ2 с вероятностью P = 0.95 больше значения Χ2q1 = 0.71 и с вероятностью P = 0.05 больше значения Χ2q2 = 9.5. (Таким образом, мы отбросили область очень малых и очень больших Χ2, которые согласно (2.1) соответствуют очень "неправильным" оценкам: Sλ2 << σ2 и Sλ2 >> σ2).

Получилось, что с вероятностью P = 0.9

                                            Χ2q1≤ Χ2q ≤ Χ2q2

или

                                 

"Перевернув" неравенства и подставив Sλ2 , получаем, что с вероятностью P = 0.9

                                            0.054 ≤ σ2 ≤ 0.721

Практически, строить доверительные интервалы для дисперсии приходится либо при оценке точности измерительной методики и аппаратуры (как в приведенном примере), либо, например, при оценке технологического разброса некоторого параметра промышленной продукции. Например, измерив светоотдачу Y большой партии ламп, изготовленных по определенной технологии, мы можем указать не только то, что средняя светоотдача лежит с заданной вероятностью в определенном интервале, но и гарантировать, что дисперсия светоотдачи при использовании этой технологии с заданной вероятностью не выйдет из указанных границ.

Из выше приведенного примера видно, что при малом объеме выборки дисперсия оценивается плохо (доверительный интервал весьма широк). Поэтому для построения доверительного интервала для математического ожидания нельзя, например, воспользоваться нормальным законом распределения случайных величин x и .
(Мы знаем вид закона, но не знаем его параметра - дисперсии, поэтому приходится привлечь еще одно производное от нормального распределения).