Теоретический материал   Reading materials  

Web-версия учебного курса "Основы математической статистики"

Раздел 5.  Планирование эксперимента

5.1. Постановка задачи и параметр

Четко сформулировав цель эксперимента, мы должны выбрать определяемую на опыте величину-параметр, которая характеризует степень достижения цели (в задачах оптимизации) или изучаемое явление (в задачах выяснения механизма явления). Правильная постановка задачи и выбор адекватного задаче параметра оптимизации - необходимое условие успешной работы. Параметр оптимизации обязательно должен в каждом конкретном эксперименте выражаться одним числом, но при этом сам параметр может быть простым или сложным.

В задачах выяснения механизма явления, как правило, используется простой параметр - изучаемая физическая характеристика объекта. Например, изучая механизмы разрушения и заселения уровней в плазме, выбираем в качестве параметра - заселенность конкретного уровня, изучая процессы формирования контуров спектральных линий в плазме - ширину контура и т.д.

В задачах оптимизации, особенно при разработке промышленных образцов, приходится учитывать несколько характеристик объекта. Например, лампа должна иметь высокую светоотдачу, большой срок службы, низкую стоимость, "хороший" цвет излучения. Здесь возможны два пути: выбрать простой параметр оптимизации, например, светоотдачу, а на остальные характеристики наложить условия: например, "стоимость не более ... рублей, срок службы не менее ... часов", "координаты цветности в пределах...", или же строить сложный или обобщенный параметр оптимизации [1].

5.2. Выбор и ранжирование факторов

После выбора параметра оптимизации проводится выбор и ранжирование факторов. Факторами называют независимые друг от друга условия эксперимента или характеристики объекта, которые в процессе проведения работы или могут быть установлены каждый на произвольно выбранном по желанию работающего уровне, или, по крайней мере, поддаются контролю со стороны экспериментатора, и которые могут, в принципе, влиять на значение параметра.

Например, в случае разработки газоразрядного источника света факторами можно считать: межэлектродное расстояние, материал колбы, диаметр горелки, количество того или иного вещества, введенного в горелку, размеры электродов и т.д.

В педагогическом эксперименте факторами могут быть пол и возраст учащихся, распределение часов между лекциями и практикой, степень компьютеризации обучения и т.д.

В сельском хозяйстве факторами могут быть кислотность почвы, число солнечных дней в сезоне (не может быть произвольно установлено, но можно проконтролировать), количество и сорта удобрений (устанавливается экспериментатором).

Поясним требования к факторам на примере разработки газоразрядного источника света.

1. "Поддающиеся контролю" - это значит, что для каждого конкретного образца, светоотдача которого (т.е. параметр) нами измерена, могут быть измерены и зафиксированы в протоколах и все величины, характеризующие факторы. Конкретные значения этих величин называются "уровни факторов". Например, исследована светоотдача двух серий образцов с межэлектродным расстоянием l = 6 см в первой серии и l = 7 см во второй. Говорят, что фактор l варьировался на двух уровнях. К числу факторов можно отнести и величины, не имеющие количественного выражения. В условиях производства существенное влияние на качество продукции могут оказать и такие факторы, как квалификация рабочего на некоторой ответственной операции, завод-поставщик исходных материалов и т.д. Влияние этих факторов также может быть математически проанализировано, "уровни факторов" в этом случае выбираются условно, например, заводы-поставщики однотипного сырья просто нумеруются 1, 2, 3 или обозначаются буквами А, В, С, важно только, чтобы этот номер для каждого испытуемого изделия был известен.

2. "Произвольно устанавливаемые" - это значит, что, в принципе, можно изготовить образец, в котором выбранный фактор, например, межэлектродное расстояние, будет на любом из выбранных уровней. Разумеется, сам выбор уровней не вполне произволен, вначале он основан на предыдущем опыте или на анализе изделий, впоследствии он определяется планом эксперимента.

3. "Независимые" - это требование к факторам очень важно. Оно означает, что в число факторов нельзя включать взаимосвязанные условия эксперимента или характеристики образца. Мы всегда должны иметь возможность изготовить образец при любом сочетании выбранных уровней факторов. Например, можно изготовить горелку с межэлектродным расстоянием и 6 и 7 см из стекла, поставленного как заводом 1,так и заводом 2. Следовательно, межэлектродное расстояние и завод-поставщик - независимые факторы. Но если завод 1 поставляет стекло только диаметром 10 мм, а завод 2 - диаметром 15 мм, то диаметр горелки и завод-поставщик не могут быть одновременно включены в список факторов.

После того, как составлен список всех факторов, которые могут влиять на значение параметра, наступает ответственный момент выбора наиболее существенных факторов, влияние которых должно быть проверено в эксперименте. Этот процесс называется "ранжированием факторов".

Один из способов "ранжирования" состоит в опросе специалистов в данной области. Предлагая специалистам, среди которых могут быть ведущие инженеры данного и родственных предприятий, ученые, работающие в близких областях науки, опытные рабочие и т.п., список факторов, просят их присвоить каждому фактору "ранг", т.е. место, которое, по мнению данного специалиста, занимает данный фактор по своему влиянию на параметр.

При этом самому "значимому" фактору присваивается ранг 1, следующему 2 и т.д. Специалистов не следует предварительно знакомить с мнением других участников опроса. Затем ранги, "полученные" каждым фактором, суммируются, и выделяется группа факторов с наименьшими значениями суммы.

Если этот способ не дает четких результатов (мнения специалистов противоречивы) или опрос специалистов вообще неэффективен ввиду отсутствия в отрасли достаточного опыта работы над изделиями, подлежащими разработке, проводятся, так называемые, "отсеивающие эксперименты".

При этом все факторы варьируются на двух уровнях. Нижний и верхний уровень каждого фактора выбирается из технологических соображений и предыдущего опыта. Общее число опытов должно быть не меньше числа исследуемых факторов (требования к числу опытов обсудим позже). Комбинация уровней факторов определяется "матрицей планирования" - это таблица, показывающая, на каком уровне устанавливается каждый конкретный фактор в каждом опыте. В этой таблице "+1" (или просто "+") означает, что фактор берется на верхнем уровне, "-1" (или "-") - на нижнем. (для качественных факторов эти понятия условны, например, "буферным газом" на нижнем уровне может быть ксенон, на верхнем - гелий, важно, чтобы отличие между уровнями было как можно больше в рамках допустимых пределов работоспособности изделия). В каждом конкретном опыте уровни факторов в отсеивающем эксперименте должны быть выбраны так, чтобы матрица планирования обладала следующими свойствами: сумма чисел в каждом столбце кроме первого равнялась 0, и сумма произведений элементов, относящихся к одному опыту, для двух любых столбцов равнялась нулю.

Пример матрицы планирования при исследовании факторов, влияющих на светоотдачу металлогалоидной лампы, приведен в табл. 5.1.

Таблица 5.1. Матрица планирования отсеивающего 7-факторного эксперимента

В качестве факторов взяты: 1 - материал колбы, 2 - конструкция электродного узла, 3 - дозировка ртути, 4 - дозировка TlJ , 5 - дозировка InJ , 6 - дозировка NaJ , 7 - буферный газ; измерялась световая отдача экспериментальных горелок (в относительных единицах).

Столбец с обозначением "0" не отвечает никакому фактору, он появился вследствие правила формирования матрицы, которое поясняется ниже, кроме того, что эта же матрица планирования годится для вычисления коэффициентов линейной модели (см. раздел 4), где с помощью этого столбца определяется первый коэффициент.

Собственно план эксперимента содержится в залитой голубым цветом части таблицы. Его надо понимать так, что, например, в опыте 5 первые 3 фактора должны быть на верхнем уровне, остальные - на нижнем.

Матрицу, обладающую свойствами ортогональности можно построить по следующему алгоритму:

За основу берутся так называемые матрицы Адамара. Матрица Адамара размерности 2ν * 2ν строится из матриц размерности ν * ν по правилу

,

В случае, представленном в таблице (5.1), матрица планирования образована матрицей Н8, отсюда столбец с номером 0. Видно, что с такой матрицей можно проверить влияние не более, чем 7 факторов. Если проверяемых факторов больше (от 8 до 15) , то следует строить матрицу Н16. Число опытов в этом случае 16, а если факторов меньше 15, то просто отбрасываются последние столбцы матрицы Н16.

После выполнения эксперимента по данному плану анализируем его результат следующим образом. Выбираем все опыты, где i-тый фактор был на верхнем уровне и находим сумму значений параметра в этих опытах Si+. Затем находим сумму значений параметра в опытах, где этот фактор был на нижнем уровне Si- и вычисляем разность Δi = |(Si+) - (Si-)|. Проделываем это для всех семи факторов и вносим результаты в соответствующие столбцы таблицы. Выделяем группу факторов, для которых абсолютная величина разности имеет заметно большее, чем для остальных факторов, значение. Есть основание считать, это и будут наиболее сильно влияющие факторы. Ранг фактора по этому признаку внесен в последнюю строку таблицы 5.1.

Однако, такое предположение нуждается в проверке, поскольку это "влияние" может быть вызвано и случайным сочетанием уровней других факторов. Кроме того, не исключено, что максимальное влияние фактора проявляется, когда он не на верхнем и не на нижнем, а на каком-то промежуточном уровне.

Наиболее надежный способ решения вопроса, влияет ли данный фактор на параметр, состоит в проведении дисперсионного анализа . Дисперсионный анализ выявляет влияние фактора на фоне "шумов", причем под "шумами" здесь понимается не только погрешность в измерении параметра, но и влияние большого числа технологических, временных, конструктивных и иных факторов, не контролируемых в данном эксперименте.

Для проведения дисперсионного анализа выбирается небольшое число факторов (один, два, три), влияние которых требуется проверить, все остальные факторы во всей серии экспериментов должны по возможности закрепляться на определенном уровне. Многофакторный анализ, в котором одновременно выявляется влияние нескольких факторов на параметр более выгоден, чем однофакторный, т.к. в случае многофакторного анализа при каждом из уровней фактора может быть сделан лишь один опыт.

5.3. Рандомизация эксперимента

При выполнении отсеивающих экспериментов и дисперсионного анализа (если он не ведется как обработка "пассивного" эксперимента) сначала составляется план эксперимента, т.е. выбирается, сколько факторов и на каком количестве уровней будет варьироваться и сколько раз будет повторен опыт при каждом сочетании уровней факторов. Чтобы уменьшить влияние неконтролируемых факторов, эксперимент должен быть "рандомизирован", т.е. запланированные опыты должны выполняться в случайном порядке.

При "рандомизации" мы перенумеровываем все запланированные опыты, а затем определяем порядок их выполнения с помощью таблиц случайных чисел или генераторов случайных чисел на ЭВМ.

5.4. Определение аналитического вида зависимости параметра от факторов. Матрица планирования

После того, как выявлены основные факторы, влияющие на параметр и определен диапазон варьирования факторов (так называемая область плана эксперимента), задачу оптимизации (нахождения комбинации факторов, обеспечивающих требуемый экстремум параметра) можно решить, найдя аналитический вида зависимости параметра от факторов и затем - экстремум найденной функции. Если искомая зависимость может быть описана линейной моделью, то ее коэффициенты находятся методом наименьших квадратов.

Выбор числа и расположения экспериментальных точек в области плана эксперимента, обеспечивающий минимизацию погрешности коэффициентов модели при фиксированном числе опытов и погрешности измеряемой величины, составляет предмет математической теории планирования эксперимента [1-3]. Некоторые рекомендации этой теории уже приведены в разделе 4.