Web-версия учебного курса "Основы математической статистики"
Раздел 4. Метод наименьших квадратов (продолжение)
На простейшем примере рассмотрим порядок решения задачи с использованием МНК.
При разработке нового образца газоразрядного источника
света обнаружено, что основное влияние на его светоотдачу
оказывают две компоненты наполнения, которые мы условно
назовем добавка А и добавка В. Прежде чем приступить к
постановке опытов по изучению влияния добавок,
необходимо оценить дисперсию воспроизводимости результатов,
т.е. решить вопрос - какой разброс значений параметра возможен
не за счет влияния факторов, а за счет неконтролируемых причин.
Поэтому изготовили пять опытных образцов с одинаковым наполнением
и измерили их светоотдачу (в относительных единицах).
Получены следующие результаты: y = 62.0, 63.6, 63.5, 61.0, 62.2.
По этим данным оценена дисперсия Sу2 = 1.2. Затем выполнена серия опытов при различных количествах добавок (в мг), результаты представлены в таблице 4.1.
Таблица 4.1. Светоотдача ламп у (в относительных единицах)
в зависимости от количества добавок
(количество добавки А в мг обозначено
х 1,
количество добавки В - х2).
х1
 z1
х 2 z2
|
40
-1
|
60
0 |
80
1 |
2 -1
|
1
52.0
|
2
58.1 |
3
65.5 |
4 0 |
4
53.8 |
5
61.3 |
6
70.0 |
6 1 |
7
56.2 |
8
65.9 |
9
74.0 |
Предположим,
что зависимость светоотдачи от количества добавок описывается
моделью:
y = b1 + b2x1 + b3x2 + b4x1x2
(4.8)
Перенумеруем опыты (номера указаны в правом верхнем углу каждой клеточки) и выпишем систему уравнений, которую следует решить:
52.0 = b1 + 40b2 + 2b3x2 + 80b4
58.1 = b1 + 60b2 + 2b3x2 + 120b4
* * * * * * * * * * * *
74 = b1 + 80b2 + 6b3x2 + 480b4
Соответственно
матрица планирования имеет вид:
 ,
в ней 9 строк и 4 столбца.
С такой матрицей решить задачу по формулам (4.4, 4.5) с помощью ЭВМ
не представляет труда. Однако, сделав замену переменных,
мы не только решим задачу "вручную",
но продемонстрируем полезное свойство данного плана эксперимента.
Перейдем к новым переменным
по принципу
, где
- средний уровень данного фактора
( у нас для x1
- это 60, а для x2 - 4), а h x - выбирается произвольно, но так, чтобы значения z были равны одной или нескольким единицам. Нам удобно взять
hx1 = 20, hx2 = 2.
Итак,
,
(4.9)
Значения z приводятся
в таблице 4.1 жирным шрифтом.
Будем искать коэффициенты модели:
y = а 1 + а2z1 + a3z2 + a4z1z2.
(4.10)
Когда они будут найдены, мы легко перейдем к модели (4.8), подставив в (4.10) z из (4.9).
Матрица планирования для модели (4.10) имеет вид:
Достоинство этой матрицы в том, что все ее столбцы ортогональны, т.е. матрица
АТА-диагональна, что существенно облегчает
расчеты по (4.4). Действительно,
,
и коэффициенты а определятся по формулам:
а1 = (52 + 58.1 + 65.5 + 53.8 + 61.3 + 70 + 56.2 + 65.9 + 74) × 1 / 9 = 61.87
а 2 = (-52 + 65.5 - 53.8 + 70 - 56.2 + 74) × 1 / 6 = 7.92
а 3 = (-52 - 58.1 - 65.5 + 56.2 + 65.9 + 74) × 1 / 6 = 3.42
а 4 = (52 -65.5 - 56.2 + 74) × 1 / 4 = 1.075.
Оценим дисперсии коэффициентов
по формуле (4.5):
, ,
,
отсюда получим критерии значимости коэффициентов по (4.6)
t1 = 169.4, t2 = 17.7, t3 = 7.6, t4 = 1.96.
Задав уровень значимости, например α = 0.1, находим по таблице t-распределения при ν = 4 tq = 2.13.
Следовательно, коэффициент а4 - незначимый. Поскольку матрица АТА диагональна, коэффициенты определены независимо и незначимый можно просто отбросить.
Итак, зависимость y от z 1, z2 имеет вид:
y = 61.87 + 7.92z1 + 3.42z2.
(4.11)
Поскольку z 1, z2 принимают очень простые значения (-1, 0, 1), то адекватность модели проще проверить на этом этапе, до перехода к "старым" переменным х1, х2. Результаты сравнения эксперимента с расчетом по модели (4.11) - в таблице 4.2.
Таблица 4.2. Проверка адекватности модели
Номер опыта |
1 |
2 |
3 |
4 |
5 |
yj эксп. |
52 |
58.1 |
65.5 |
53.8 |
61.3 |
 расч. |
50.53 |
58.45 |
66.37 |
53.95 |
61.87 |
 |
2.152 |
0.123 |
0.752 |
0.022 |
0.321 |
Номер опыта |
6 |
7 |
8 |
9 |
|
yj эксп. |
70 |
56.2 |
65.9 |
74 |
|
 расч. |
69.78 |
57.37 |
65.28 |
73.20 |
|
 |
0.0467 |
1.362 |
0.379 |
0.638 |
|
В нашем случае число опытов - 9, число значимых коэффициентов модели - 3, число степеней свободы для вычисления дисперсии адекватности согласно (4.7) - 6; поделив на 6 сумму элементов последней стоки, получаем S a2 = 0.966.
В этом случае очевидно,
что модель адекватна, т.к. S a2 < Sy2, если бы Sa2 оказалась больше Sy2 следовало бы сравнивать их отношение с критическим значением Fq при числе степеней свободы к1 = 6, к2 = 4.
Теперь можно вернутся к модели (4.8). Подставляя (4.9) в (4.10.), имеем:
y = 61.87 + 7.92(x1 - 60) / 20 + 3.42(x2 - 4) / 2 = 31.3 +0.396x1 + 1.71x2 ,
т.е. b 1 = 31.28, b2 = 0.396, b3 = 1.71.
Если нас интересуют
оценки дисперсий коэффициентов b, то их тоже легко найти,
пользуясь свойством дисперсии и независимостью коэффициентов а.
,
,
.
4.2. Метод наименьших квадратов - общий случай
Кратко остановимся на случае,
когда нет уверенности, что все погрешности независимы и имеют
одинаковую дисперсию. В этом случае нужно проделать большую работу,
выполнив многократные (р раз)
измерения y j во всех точках
плана эксперимента и построить оценку ковариационной матрицы
D погрешностей измерений
по следующему правилу:
(4.12)
Здесь
i и j - номера экспериментальных точек,
k - номера повторных изменений.
- средние по к измерениям в i-ой ( j-ой) точке.
Видно, что Dii - оценка дисперсии измерения в i-ой точке (р >> 1, поэтому р - 1» р). Обозначив W = D-1 можно получить [4] следующие формулы вместо (4.4 и 4.5).
b = (ATWA)-1ATW y,
(4.13)
Sbi2 = [(ATWA)-1] ii
(4.14)
Вообще же матрица
( ATWA)-1 является
ковариационной матрицей оценок b, т.е. ее недиагональные элементы
- оценки коэффициентов ковариации b.
Проверка значимости коэффициентов проводится так же, как в предыдущем случае (по 4.6).
Проверку адекватности модели в этом случае
можно организовать как проверку гипотезы о том, что
"истинное значение" в каждой экспериментальной точке равно
рассчитанному по модели (см. приложение 1.3)
по критерию Т 2.
Легко видеть,
что если погрешности y
независимы и одинаковы, то D = Sy2×I (I - единичная матрица) и (4.13, 4.14) переходят в (4.4, 4.5).
Подводя итог этому разделу, перечислим основные этапы решения задачи методом наименьших квадратов.
1. Формулируем модель, т.е. вид зависимости параметра от факторов.
2. Выбираем диапазон варьирования факторов (область плана эксперимента).
3. В этой области выбираем экспериментальные точки,
т.е. те значения уровней факторов, при которых
ставится эксперимент.
При этом желательно придерживаться следующих правил:
- обязательно делать опыты на границах
варьирования факторов;
- обязательно делать опыты в центре плана
(за исключением случая, когда мы уверены, что в модель входят
только линейные по факторам члены, и это не нуждается в
экспериментальной проверке);
- располагать экспериментальные точки симметрично
относительно центра плана.
В общем случае, имея в своем распоряжении ЭВМ,
можно всегда подобрать набор экспериментальных точек,
обеспечивающих максимальное значение определителя матрицы
( AТA),
что в свою очередь, минимизирует в совокупности
[(AТA)-1]ii,
при всех i.
4. Оцениваем дисперсию (ковариационную матрицу)
результатов опытов путем повторных измерений при одинаковых условиях.
5. Проверяем гипотезу о ее диагональности и
об однородности дисперсий y (см. приложение 1).
Если сами условия эксперимента создают уверенность
в независимости погрешностей у и одинаковости их дисперсий,
этот пункт можно опустить.
6. Проводим эксперимент
и оцениваем коэффициенты модели по формулам (4.4) или (4.13).
7. Оцениваем погрешности коэффициентов по
(4.5) или (4.14).
Расчет по формулам (4.4, 4.13, 4.5, 4.14)
даст правильные результаты и в том случае, если параметр не является нормально
распределенной случайной величиной, т.к. при выводе этих формул
такое предположение не иcпользовалось, а вот проверки значимости коэффициентов
и адекватности модели при "не нормальном" распределении параметра
выполнить нельзя, поскольку в этих проверках используются критерии,
распределенные по законам,"производным от нормального".
8. Проверяем значимость коэффициентов по
t-критерию (4.6).
9. Проверяем адекватность модели
по F-критерию (4.7).
Если в модели много незначимых коэффициентов
- ее надо упростить, т.е. уменьшить число искомых величин b.
Если модель неадекватна, ее надо усложнить, т.е. добавить новые члены.
|
 |
|