Теория по эконометрике

Проверка качества многофакторных регрессионных моделей. Коэффициент детерминации R2. Скорректированный R2. Проверка гипотез с помощью t-статистик и F-статистик

Основным показателем качества модели множественной регрессии является множественный коэффициент детерминации

.

Он показывает, какая доля изменений результата Y учтена в модели и обусловлена влиянием включенных факторов. Чем ближе R2 к единице, тем выше качество модели.

Заметим, что R2 всегда увеличивается при добавлении в модель новых факторов, даже не оказывающих существенного влияния на Y. Скорректированный (нормированный) коэффициент детерминации

может при этом уменьшаться. Поэтому добавление факторов в модель по методу включения прекращается, когда перестает расти.

Статистическую значимость отдельных коэффициентов регрессии проверяют по t-критерию Стьюдента, а уравнения в целом — по F–критерию Фишера.

Пример 3. По 12 транспортным предприятиям исследуется зависимость чистой годовой прибыли (Y, млн. руб.) от количества грузовых автомобилей с разрешенной максимальной массой: а) не более 3,5 т (X1, шт.), б) свыше 3,5 т (X2, шт.). В качестве фактора также учитывается форма собственности (фиктивная переменная X3: 0 — муниципальное предприятие, 1 — частное):

предприятия

Y

X1

X2

X3

1

13

23

9

0

2

22

28

8

1

3

17

20

12

0

4

19

28

13

0

5

24

25

7

1

6

33

27

20

1

7

8

13

10

0

8

17

25

10

0

9

32

36

10

1

10

21

23

17

1

11

27

28

8

1

12

20

23

10

0

Среднее

21,1

24,9

11,2

0,50

Стандартное отклонение

7,27

5,50

3,86

0,52

Проверим факторы на коллинеарность, для чего с помощью EXCEL рассчитаем матрицу парных коэффициентов корреляции:

 

Y

X1

X2

X3

Y

1

 

 

 

X1

0,805

1

 

 

X2

0,291

-0,016

1

 

X3

0,779

0,554

0,135

1

Ни один из коэффициентов корреляции между факторами не превышает по модулю 0,8, что свидетельствует об отсутствии коллинеарности. Можно попробовать построить трехфакторную модель.

С помощью Excel было получено уравнение линейной регрессии:

;

и коэффициенты детерминации: R2=0,865; .

Уравнение регрессии объясняет 86,5% изменений чистой прибыли, обусловленных изменением количества легких и тяжелых грузовых автомобилей. Каждый новый легкий «грузовик» приносит в среднем 0,755 млн. руб. прибыли в год, а каждый тяжелый «грузовик» дает дополнительно в среднем 0,457 млн. руб. прибыли. Частные предприятия (x3=1) при прочих равных условиях имеют в среднем на 5,973 млн. руб. прибыли больше, чем муниципальные (x3=0). Интерпретация свободного коэффициента b0=–5,82 здесь лишена экономического смысла.