Массивы данных, полученные в результате практических исследований после математической обработки, дают возможность вывести числовые значения коэффициентов корреляционной зависимости вида: Yi = a1X1,i+a2X2,i …+…ajXj,i , которое называется уравнение регрессии.
Где Х это имеющиеся показатели процесса, которые влияют на определяемый показатель Y. Далее, подставляя желаемые числовые значения коэффициентов показателей X, получаем предсказание следующих значений Y.
Выпускаемое четырнадцатью предприятиями изделие (или продукция, выпускаемая в четырнадцать временных периодов) имеет шесть параметров (например, рабочая частота изделия, энергопотребление, вес…). Основной показатель S (например, производительность изделия) зависит от этих параметров. Необходимо определить корреляционную зависимость, позволяющую предсказывать величину показателя S от всех шести параметров.
Имеются исходные данные, которые были получены в результате ряда опытов или из сравнения подобных объектов. Количество опытов при этом должно быть, как минимум на один больше количества параметров объекта или процесса.
1.Занести данные на лист Excel и найти среднее значение всех факторов, позволяющее в дальнейшем использовать исследование безразмерных данных в соответствии с понятием коэффициент эластичности, позволяющего установить степень доверия к полученным результатам. Коэффициенты эластичности определяют и оценивают процентное изменение результата с увеличением или уменьшением каждого отдельного показателя на 1% при фиксированном значении остальных показателей и вычисляется как отношение среднего значения показателя к среднему значению результата.
2.Для вывода уравнения регрессии открыть и подключить (Файл, Параметры, Надстройки, Управление, перейти) надстройку Excel – пакет анализа.
3.Через меню Excel (Данные, Анализ данных) выполнить расчет и вывести итоги.
Получено достаточно высокое значение коэффициента корреляции 0,99, говорящее о том, что представленные данные хорошо описывают исследуемый процесс.
4.Вывести уравнение регрессии Y = A0 + A1 X1 + A2 X2 + …
Коэффициент уравнения А0 находится в ячейке В36, значение его 653.0, далее коэффициент А1 в ячейке В37 со значением 2.419 и так далее;
5. Проверить полученное уравнение регрессии для каждого из ряда данных. В ячейке I1, строим формулу, получаем значение параметра Y для первого опыта.
=$B$36+$B$37*A1+$B$38*B1+$B$39*C1+$B$40*D1+$B$41*E1+$B$42*F1+$B$43*G1+$B$44*H1
Не забываем фиксировать адреса ячеек коэффициентов клавишей F4 клавиатуры. Копируем результат ячейки первой строки исходной таблицы на все строки.
6.Выявить параметры, имеющие низкую значимость, используем для этого показатель t- статистика и исключаем из таблицы данных параметры, имеющие низкое < │2 │ значение показателя, это переменные 1 и 5, соответствующие коэффициентам ячеек В37 и В41.
Уравнение при этом принимает вид:
=$B$36+$B$38*B1+$B$39*C1+$B$40*D1+$B$42*F1+$B$43*G1+$B$44*H1
Повторяем расчеты для обновленных данных, строим уравнение регрессии и выводим данные по каждому опыту в дополнительный столбец.
7. График зависимости показателя Y для опытов и на этом же графике интерполяционные зависимости, полученные из уравнений регрессии, если его построить, показывает совпадение расчётных данных с экспериментальными, следовательно, уравнением регрессии можно пользоваться для дальнейшего предсказания результатов.
1.Заполнить ячейки EXCEL исходными данными.
2.Найти среднее значение всех факторов Х, позволяющее в дальнейшем использовать исследование в соответствии с понятием коэффициент эластичности (меню ГЛАВНАЯ, Редактирование, Другие функции, найти =СРЗНАЧ() и указать аргументом диапазон колонки чисел, затем скопировать функцию на все колонки):
3.Загрузить надстройку анализ данных (меню Данные, анализ данных, выбрать регрессия).
4.Настроить параметры в окне регрессии: входной интервал Y – указать выделением мышью диапазон Y, входной интервал Х указать выделением мышью все числовые значения Х, Параметры вывода можно оставить Новый рабочий лист или щелкнуть на свободное место текущего листа.
5.Получить коэффициенты уравнения регрессии и коэффициент корреляции.
Уравнение регрессии при этом выглядит следующим образом:
Y1=34,2199 -0,0603x1-1,77084x2-0,00143x3+1,089928x4-0,00035x5+0,01854x6
Подставляя в полученное уравнение числовые значения факторов можно предсказать дальнейшее изменение определяемого параметра Y.
6.Используя уравнение регрессии, получить значения выходного параметра для всех опытов: выбрать ячейку К2 занести формулу затем скопировать формулу на все опыты по столбцу.
=34,22-0,06*C2-1,77*D2-0,00143*E2+1,09*F2-0,00035*G2+0,01854*H2
7.Выделить диапазон J2:K15 и построить график.
Некоторые факторы демонстрируют плохую корреляцию с определяемым параметром, поэтому по таблице Стьюдента с вычисленным уровнем значимости и известным количеством опытов можно найти критическое значение параметра t-статистика и исключить некоторые из факторов. Проверка значимости модели регрессии также может быть проведена с использованием F-критерия Фишера. Значимость факторов может также продемонстрировать коэффициент эластичности.
8.Вычислить коэффициенты эластичности каждого из факторов. Коэффициент эластичности показывает, на сколько процентов в среднем изменяется результативный признак У, при изменении факторного признака Х на 1%. Коэффициент эластичности находится по формуле:
Е = Кх* Хср/Yср
где Кх – коэффициент уравнения регрессии при факторе, Хср и Yср средние значения фактора и параметра. В результате получены коэффициенты:
Оказалось, что лишь изменение факторов Х3 и Х4 может существенно влиять на результирующий показатель.
9.Исключить из ряда факторов те, у которых малая по абсолютному значения величина параметра t-статистика, это переменные Х1, Х2, Х5, Х6, и, снова получить коэффициенты уравнения регрессии и коэффициент корреляции;
Коэффициент корреляции при этом уменьшился, но все факторы имеют высокий уровень значимости и их достаточно для описания процесса. Уравнение регрессии при этом выглядит следующим образом:
Y2=28,89433-0,00124x3+0,83244x4