Основным показателем качества модели множественной регрессии является множественный коэффициент детерминации
.
Он показывает, какая доля изменений результата Y учтена в модели и обусловлена влиянием включенных факторов. Чем ближе R2 к единице, тем выше качество модели.
Заметим, что R2 всегда увеличивается при добавлении в модель новых факторов, даже не оказывающих существенного влияния на Y. Скорректированный (нормированный) коэффициент детерминации
может при этом уменьшаться. Поэтому добавление факторов в модель по методу включения прекращается, когда перестает расти.
Статистическую значимость отдельных коэффициентов регрессии проверяют по t-критерию Стьюдента, а уравнения в целом — по F–критерию Фишера.
Пример 3. По 12 транспортным предприятиям исследуется зависимость чистой годовой прибыли (Y, млн. руб.) от количества грузовых автомобилей с разрешенной максимальной массой: а) не более 3,5 т (X1, шт.), б) свыше 3,5 т (X2, шт.). В качестве фактора также учитывается форма собственности (фиктивная переменная X3: 0 — муниципальное предприятие, 1 — частное):
№ предприятия |
Y |
X1 |
X2 |
X3 |
1 |
13 |
23 |
9 |
0 |
2 |
22 |
28 |
8 |
1 |
3 |
17 |
20 |
12 |
0 |
4 |
19 |
28 |
13 |
0 |
5 |
24 |
25 |
7 |
1 |
6 |
33 |
27 |
20 |
1 |
7 |
8 |
13 |
10 |
0 |
8 |
17 |
25 |
10 |
0 |
9 |
32 |
36 |
10 |
1 |
10 |
21 |
23 |
17 |
1 |
11 |
27 |
28 |
8 |
1 |
12 |
20 |
23 |
10 |
0 |
Среднее |
21,1 |
24,9 |
11,2 |
0,50 |
Стандартное отклонение |
7,27 |
5,50 |
3,86 |
0,52 |
Проверим факторы на коллинеарность, для чего с помощью EXCEL рассчитаем матрицу парных коэффициентов корреляции:
|
Y |
X1 |
X2 |
X3 |
Y |
1 |
|
|
|
X1 |
0,805 |
1 |
|
|
X2 |
0,291 |
-0,016 |
1 |
|
X3 |
0,779 |
0,554 |
0,135 |
1 |
Ни один из коэффициентов корреляции между факторами не превышает по модулю 0,8, что свидетельствует об отсутствии коллинеарности. Можно попробовать построить трехфакторную модель.
С помощью Excel было получено уравнение линейной регрессии:
;
и коэффициенты детерминации: R2=0,865; .
Уравнение регрессии объясняет 86,5% изменений чистой прибыли, обусловленных изменением количества легких и тяжелых грузовых автомобилей. Каждый новый легкий «грузовик» приносит в среднем 0,755 млн. руб. прибыли в год, а каждый тяжелый «грузовик» дает дополнительно в среднем 0,457 млн. руб. прибыли. Частные предприятия (x3=1) при прочих равных условиях имеют в среднем на 5,973 млн. руб. прибыли больше, чем муниципальные (x3=0). Интерпретация свободного коэффициента b0=–5,82 здесь лишена экономического смысла.