Теоретический материал   Reading materials  

Web-версия учебного курса " Основы математической статистики"

Раздел 3.1.   Общий алгоритм статистической проверки гипотез

В своей практической деятельности как в сфере производства, так и в быту человек то и дело выдвигает и экспериментально проверяет различные гипотезы, при этом сохраняется следующий общий порядок: формулируется гипотеза ("Наверно, моего друга еще нет дома"), планируется эксперимент, причем заранее известно, какой результат приведет к принятию гипотезы ("Позвоню ему по телефону, если никто не подойдет, то его нет дома"), затем эксперимент выполняется, и гипотеза принимается или отвергается. При этом практически всегда имеется некоторая вероятность ошибочного решения по результатам эксперимента (друг прослушивал новые магнитофонные записи и не слышал звонка, хотя и был дома, или Вы ошибочно набрали не его номер). Все эти черты присущи и статистической проверке гипотез, только здесь порядок действий строго формализован, что, с одной стороны, имеет преимущества, в частности, мы всегда знаем (т.к. сами устанавливаем) вероятность возможной ошибки (отвергнуть верную гипотезу), с другой стороны, есть и недостаток: далеко не всякая гипотеза может быть таким образом проверена. Мы рассмотрим здесь только способы проверки простых гипотез. В случае, если потребуется более сложный вариант: проверка гипотезы против альтернативы, читатель, усвоивший общие принципы, легко разберется в литературе[5].

В таблице 3.1 перечислены этапы проверки гипотезы, они сразу же иллюстрируются примером. Чтобы дальнейшее было понятно, сначала рассмотрим конкретный пример.

Предположим, что для игрового автомата изготовлен генератор случайных чисел по следующему техническому заданию (ТЗ): на определенном этапе игры генератор должен выработать независимо от состояния всей системы и своих предыдущих состояний либо 0 с вероятностью 0.20, либо 1 с вероятностью 0.80 (предположим для простоты, что другие состояния генератора невозможны). Надо организовать проверку генератора на соответствие ТЗ как статистическую проверку гипотезы.

Таблица 3.1 Этапы проверки гипотезы.

Общая формулировка этапа

Пример

1. Формулируется проверяемая гипотеза Н0 .

Н0 . Генератор соответствует ТЗ.

2. Выбирается критерий проверки - X.

Критерий - это случайная величина, закон распределения которой при условии справедливости проверяемой гипотезы нам известен.

Критерий ( см. пояснения к таблице)

, n - число запусков игры при испытаниях генератора, р = 0.2, q = 0.8, m - число появившихся нулей.

3. Выбирается уровень значимости α и критическая область Q, так, чтобы условная вероятность попадания критерия в Q при условии справедливости гипотезы равнялась α, т.е. Р{X Ε Q/H0) = α.

Выберем α = 0.05. Это - вероятность забраковать хороший генератор. По таблицам нормального распределения находим Р{| X | > 1.96} = 0.05, следовательно, критическая область Q: | X | > 1.96.

4. Выполняем эксперимент и находим экспериментальное значение критерия Хэ.

Выберем n = 100. При 100 запусках игры 0 появляется 26 раз, т.е. m = 26

5. Если критерий не попадает в критическую область, гипотеза принимается, если X Ε Q, то отвергается.

У нас 1.5 < 1.96.

Гипотеза принимается.

Результат оформляется так: гипотеза Н0 проверена по критерию Х на уровне значимости α и принята (или отвергнута).

Гипотеза о том, что генератор соответствует ТЗ проверена по критерию на

уровне значимости 5 % и принята.

Сделаем к этой схеме некоторые пояснения. Гипотеза - это всегда утверждение. Частая ошибка студентов состоит в попытках проверить гипотезу типа: "Соответствует ли генератор ТЗ?" - это вопрос, а не утверждение. Надо выбрать для проверки одно из двух утверждений: "Соответствует ТЗ" или "Не соответствует ТЗ". Выбор зависит не от эмоционального настроя (например, заказчик, может быть, очень хочет доказать, что работа не соответствует ТЗ). Мы уже упоминали о том, что не всякую гипотезу можно проверить: если генератор соответствует ТЗ, то событие: "появление 0" имеет известную постоянную вероятность, и результат каждого испытания не зависит от предыдущих. В этом случае число m нулей в серии из n испытаний подчиняется известному закону Бернулли, а при большом n величина Х, приведенная выше, согласно теореме Муавра - Лапласа [6, глава 8] распределена нормально со средним 0 и дисперсией 1, т.е. Х имеет известное распределение и может быть критерием проверки гипотезы. Если же сформулировать противоположную гипотезу, то совершенно неизвестно, как и в какую сторону мы отклонились от ТЗ, и критерия построить нельзя. Выбор α не диктуется правилами статистики, а целиком определяется обстоятельствами эксперимента. Чем больше в нашем примере α, тем строже приемка работы, т.е. тем больше вероятность того, что придется переделывать вполне хороший генератор. Зато, уменьшая α, мы увеличиваем опасность того, что признаем годным бракованное изделие. В данном случае α  следует согласовать с заказчиком, но обязательно до начала испытаний. В случаях, не имеющих принципиального значения и не сулящих большого ущерба при отклонении верной гипотезы, принято выбирать α = 0.05 или α = 0.1, что облегчает использование многих таблиц.

Выбор критической области должен производиться с учетом смысла гипотезы; надо понимать, что если Х попадает в критическую область, то гипотеза будет отвергнута. В нашем примере очевидно, что ТЗ нарушено и в том случае, если нулей при 100 испытаниях будет много меньше, чем 20 и если много больше, поэтому критическая область - двухсторонняя. Ниже мы увидим, что так бывает не всегда.

Переходим теперь к рассмотрению конкретных типов гипотез, которые чаще других встречаются в практике работы физика-экспериментатора и инженера-исследователя.