Ковариацией
называется показатель тесноты связи между переменными:где x
x – среднее арифметическое факторной переменной;
y – среднее арифметическое результативной переменной;
Четвертое условие выполняется в том случае, если
изучаемые данные не являются временными рядами;
5) исходя из третьего и четвертого условий, можно добавить пятое условие о том, что случайная ошибка регрессионной модели является случайной величиной, подчиняющейся нормальному закону распределения с нулевым математическим ожиданием и дисперсиейгде
ε
Y = βX + ε,
где
β – вектор коэффициентов регрессионной модели размерности 2 × 1; n.
ε – вектор случайных ошибок регрессионной модели размерности28. Классический метод наименьших квадратов для модели парной регрессии
Неизвестные параметры
Предположим, что исследователем собран цифровой материал, характеризующий две переменные – х и у.
Связь между исследуемыми переменными описывается равенством вида:
В соответствии с методом наименьших квадратов в качестве метода оценки неизвестных параметров регрессионной модели будет выступать сумма квадратов отклонений наблюдаемых значений результативного признака
Для нахождения оптимальных значений неизвестных параметров β0 и β1 необходимо минимизировать функционал
При минимизации данного функционала неизвестными являются только значения коэффициентов регрессии β0 и β1. Значения результативной и факторной переменных известны из наблюдений.
Для определения минимума функции двух переменных нужно вычислить частные производные этой функции по каждому из оцениваемых параметров и приравнять их к нулю. Результатом будет являться стационарная система уравнений для функции (2):
Если разделить обе части каждого уравнения системы на (-2), раскрыть скобки и привести подобные члены, то получим систему:
Решением системы нормальных уравнений являются оценки неизвестных параметров уравнения регрессии β0 и β1:
где у – среднее значение результативной переменной;