Теоретический материал   Reading materials  

Web-версия учебного курса "Основы математической статистики"

Раздел 3.6.  Проверка гипотезы об отсутствии связи между двумя случайными величинами

Объект исследований или испытаний может характеризоваться несколькими случайными величинами. Например, образец лампы общего освещения имеет определенную начальную светоотдачу (W), срок службы (L), температуру стенки (T), координаты цветности (Х,У) и т.д. Совокупность этих характеристик в теории вероятностей называют многомерной случайной величиной. Отдельные составляющие многомерной случайной величины могут быть как попарно независимыми, так и связанными друг с другом (зависимыми). Количественной мерой зависимости двух случайных величин x и y служит коэффициент корреляции [6, глава 5]:

(3.9)

Для независимых x,y r = 0. Располагая выборкой из n пар значений xi, yi, мы можем вычислить лишь оценку r или выборочный коэффициент корреляции

    (3.10)

Плотность распределения выборочного коэффициента корреляции r n может быть рассчитана при условии, что x и y - независимы (т.е. r=0) и нормально распределены. У этого распределения один параметр-n.

Таким образом, rn может служить критерием проверки гипотезы:

"x и y независимы", или "связи между характеристиками объекта x и y - нет".

Проверка этой гипотезы может быть осуществлена по t - критерию [9]. Для этого надо вычислить экспериментальное значение

              (3.11)

и при выбранном уровне значимости α по таблицам распределения Стьюдента при числе степеней свободы n - 2 найти критическое значение tq, такое что P{| t | > tq} = α. Гипотеза об отсутствии связи между величинами x и y принимается, если | tэ | < tq.

Если такая гипотеза будет отвергнута, то выявленная связь может быть использована для выяснения механизма явления (например, обнаруженная связь между температурой стенки и светоотдачей лампы помогает построить физическую модель явлений, происходящих в разряде); для прогнозирования свойств объекта (например, выявленная связь между спектром излучения и сроком службы позволяет сократить время испытаний). Такого рода обработка данных проводится на этапе поисковых экспериментов или при анализе результатов массовых обследований опытных партий образцов, когда физическая картина явлений, взаимосвязь различных их характеристик, еще не вполне ясны.