Теория

Выявление основной тенденции развития и формирование моделей для анализа и прогнозирования.

При изучении и прогнозировании рядов динамики важной задачей является определение основной тенденции развития, для определения которой используются различные приемы и методы.

Одним из приемов выявления тенденции является метод скользящей средней. Суть метода состоит в замене абсолютных данных средними арифметическими за отдельные периоды. Расчет средних ведется способом скольжения, то есть постепенным исключением из принятого периода скольжения первого уровня и включением следующего.

В таблице 6.2 приведены результаты сглаживания временного ряда методом трехчленной и четырехчленной скользящей средней (на основе данных об экспорте товаров).

Таблица 2

Динамика экспорта Российской Федерации в 2009 г.

и расчет скользящих средних

Месяц

Экспорт товаров, млн. долл. США

Трехчленные скользящие суммы

Трехчленные скользящие средние

Четырехчленные скользящие средние

Четырехчленные скользящие средние (нецентрированные)

Четырехчленные скользящие средние (центрированные)

1

17786

2

18373

18946,3

19438,3

 

3

20680

56839

19989,0

77753

20622,5

20030,4

4

20914

59967

21372,3

82490

22128,3

21375,4

5

22523

64117

22611,0

88513

23510,8

22819,5

6

24396

67833

24376,3

94043

25047,8

24279,3

7

26210

73129

25889,3

100191

26571,8

25809,8

8

27062

77668

27297,0

106287

28071,0

27321,4

9

28619

81891

28691,3

112284

29203,0

28637,0

10

30393

86074

29916,7

116812

30964,3

30083,6

11

30738

89750

31746,0

12

34107

95238

Взяв данные за три месяца, исчисляем трехчленные суммы, затем среднюю:

;

и т.д.

Интервал скольжения можно брать четный (четыре, шесть и т.д.). Нахождение скользящей средней по четному числу членов осложняется тем, что средняя может быть отнесена только к середине между двумя датами. Чтобы ликвидировать этот сдвиг, применяется центрирование, то есть нахождение средней из средних за два периода для отнесения полученного уровня к определенной дате. При центрировании также необходимо находить скользящие суммы.

Наиболее эффективным способом выявления основной тенденции развития является аналитическое выравнивание.

При этом уровни ряда динамики выражаются в виде функции времени:

.

При таком подходе изменение исследуемого показателя связывают лишь с течением времени; считается, что влияние других факторов несущественно или косвенно сказывается через фактор времени.

Правильно выбранная модель кривой роста должна соответствовать характеру изменения тенденции исследуемого явления. Кривая роста позволяет получить выровненные или теоретические значения уровней динамического ряда. Это те уровни, которые наблюдались бы в случае полного совпадения динамики явления с кривой.

Прогнозирование на основе модели кривой роста базируется на экстраполяции, т. е. на продлении в будущее тенденции, наблюдавшейся в прошлом. При этом предполагается, что во временном ряду присутствует тренд, характер развития показателя обладает свойством инерционности, сложившаяся тенденция не должна претерпевать существенных изменений в течение периода упреждения.

В настоящее время в литературе описано несколько десятков кривых роста, многие из которых широко применяются для выравнивания экономических временных рядов: линейная модель, полиномиальная модель второй, третьей степени, логарифмическая, экспоненциальная модели и др.

Существует несколько практических подходов, облегчающих процесс выбора формы кривой роста.

Наиболее простой путь — визуальный анализ, опирающийся на изучение графического изображения временного ряда. Подбирают такую кривую роста, форма которой соответствует фактическому развитию процесса. Если на графике исходного ряда тенденция развития недостаточно четко просматривается, то можно провести некоторые стандартные преобразования ряда (например, сглаживание), а потом подобрать функцию, отвечающую графику преобразованного ряда. В современных пакетах статистической обработки имеется богатый арсенал стандартных преобразований данных и широкие возможности для графического изображения, в том числе в различных масштабах. Все это позволяет существенно упростить для исследователя проведение данного этапа.

В табличном процессоре Microsoft Excel выбор кривой можно осуществить на основании сравнения величины достоверности аппроксимации выбранных моделей: для анализа и прогнозирования необходимо выбрать такую модель, где данная величина будет наибольшей.

Рассмотрим применение метода аналитического выравнивания по прямой ля выражения основной тенденции на следующем примере.

А таблице 2 приведены уже известные данные об экспорте Российской Федерации в 2009 году. Для выравнивания ряда динамики по прямой воспользуемся уравнением .

Способ наименьших квадратов дает систему нормальных уравнений для нахождения параметров и :

;

,

где — исходный уровень ряда динамики;

— число членов ряда;

— показатель времени, который обозначается порядковым номером, начиная от низшего (1, 2, 3 и т.д.).

Решение системы позволяет получить выражение для параметров и :

; (15)

. (16)

Расчет необходимых значений приведен в таблице 6.2. По итоговым данным определяем параметры уравнения: =15 769, =1 443,2.

В результате получаем следующее уравнение основной тенденции экспорта России в 2009 году:

Таблица 3

Исходные и расчетные данные для определения параметров уравнения

Месяц

 

Порядковый номер, t

 

Экспорт, млн. долл. США, y

Январь

1

17786

1

17786

17212,2

573,8

Февраль

2

18373

4

36746

18655,4

-282,4

Март

3

20680

9

62040

20098,6

581,4

Апрель

4

20914

16

83656

21541,8

-627,8

Май

5

22523

25

112615

22985

-462

Июнь

6

24396

36

146376

24428,2

-32,2

Июль

7

26210

49

183470

25871,4

338,6

Август

8

27062

64

216496

27314,6

-252,6

Сентябрь

9

28619

81

257571

28757,8

-138,8

Октябрь

10

30393

100

303930

30201

192

Ноябрь

11

30738

121

338118

31644,2

-906,2

Декабрь

12

34107

144

409284

33087,4

1019,6

Итого

78

301 801

650

2 168 088

 

 

По окончании расчета целесообразно построить график с изображением исходных данных и теоретических значений ряда (рис. 1).

Рис. 1. Графическое изображение исходных данных и теоретических значений по линейной модели

Основная тенденция (тренд) показывает, как воздействуют систематические факторы на уровень ряда динамики, а колеблемость уровней около тренда служит мерой воздействия остаточных факторов.

Оценка качества модели сводится к оценке ее точности и адекватности.

Проверка адекватности выбранных моделей реальному процессу (в частности, адекватности полученной кривой роста) строится на анализе остаточной компоненты. Остаточная компонента получается после выделения из исследуемого ряда систематической составляющей (тренда и периодической составляющей, если она присутствует во временном ряду). В нашем случае исходный временной ряд описывает процесс, не подверженный сезонным колебаниям. Ряд остатков получается как отклонение фактических значений временного ряда от теоретических, полученных по модели (табл. 3):

. (17)

Теоретические значения за каждый период рассчитываются путем подстановки в полученную функцию последовательных значений t.

Принято считать, что модель адекватна описываемому процессу, если остаточная последовательность (ряд остатков) представляет собой случайную компоненту ряда.

Поэтому при оценке «качества» модели проверяют, удовлетворяет ли остаточная последовательность следующим свойствам:

  1. случайности колебаний уровней ряда;

  2. соответствию распределения остаточной компоненты нормальному закону с нулевым математическим ожиданием;

  3. независимости значений уровней ряда остатков между собой.

При проверке первого свойства исследователю полезно провести графический анализ остаточной последовательности.

В современных эконометрических пакетах имеется набор графических средств, позволяющих судить о том, насколько распределение остатков согласуется с нормальным распределением. Например, полезным может оказаться график гистограммы остатков с наложенной нормальной плотностью, позволяющей исследователю оценить симметричность распределения остатков и близость к нормальному закону.

Кроме графических средств, в современных пакетах прикладных программ представлены и статистические критерии, позволяющие проводить проверку гипотезы о нормальности распределения остатков, например, критерий Пирсона и др. Однако на практике использование этих средств зачастую затруднено из-за небольшой длины временных рядов экономических показателей (n < 50). Поэтому проверка на нормальность может быть произведена приближенно, например, на основе подхода, опирающегося на рассмотрение показателей асимметрии и эксцесса.

Как известно, при нормальном распределении показатели асимметрии и эксцесса равны нулю. Так как мы предполагаем, что отклонения от тренда представляют собой выборку из некоторой генеральной совокупности, то можно определить выборочные характеристики асимметрии (А) и эксцесса (Э), а также оценить их среднеквадратические ошибки, зависящие от длины ряда n:

, . (18)

Если одновременно выполняются следующие неравенства:

, (19)

, (20)

то гипотеза о нормальном характере распределения случайной компоненты не отвергается.

Если выполняется хотя бы одно из неравенств:

, (21)

, (22)

то гипотеза о нормальном характере распределения отвергается.

Другие случаи требуют дополнительной проверки с помощью более мощных критериев.

Рассмотрим подробнее последнее свойство. Если вид функции, описывающей систематическую составляющую, выбран неудачно, то последовательные значения ряда остатков могут не обладать свойствами независимости, т.к. они могут коррелировать между собой. В этом случае говорят, что имеет место автокорреляция остатков.

Существует несколько приемов обнаружения автокорреляции. Наиболее распространенным является подход, опирающийся на критерий Дарбина-Уотсона. Тест Дарбина-Уотсона связан с проверкой гипотезы об отсутствии автокорреляции первого порядка, т.е. автокорреляции между соседними остаточными членами ряда. При этом критическая статистика определяется по формуле:

. (23)

Можно показать, что величина d приближенно равна:

, (24)

где — коэффициент автокорреляции первого порядка (то есть парный коэффициент корреляции между двумя последовательностями остатков , ,…, и , , …, . Близость значения статистики d к нулю означает наличие высокой положительной автокорреляции (коэффициент близок к единице); близость значения статистики d к четырем означает наличие высокой отрицательной автокорреляции (коэффициент близок к минус единице). Естественно, в случае отсутствия автокорреляции значение статистики d будет близким к двум (коэффициент не сильно отличается от нуля).

Применение на практике критерия Дарбина-Уотсона основано на сравнении расчетного значения статистики d с пороговыми, граничными значениями и .

Граничные значения и , зависящие от числа наблюдений n, количества объясняющих переменных в модели, уровня значимости α, находятся по таблицам (авторами критерия составлены таблицы для α = 0,05, α = 0,025 и α = 0,01). Фрагмент таблицы Дарбина-Уотсона с критическими значениями и при 5% уровне значимости представлен ниже (см. табл. 3).

Алгоритм выявления автокорреляции остатков на основе критерия Дарбина-Уотсона следующий. Выдвигается гипотеза об отсутствии автокорреляции остатков. Пусть альтернативная гипотеза состоит в наличии в остатках положительной автокорреляции первого порядка.

Тогда при сравнении расчетного значения статистики d ( d < 2) с и возможны следующие варианты.

1) если d < , то гипотеза об отсутствии автокорреляции отвергается (с вероятностью ошибки, равной α ) в пользу гипотезы о положительной автокорреляции;

2) если d > , то гипотеза не отвергается;

3) если , то нельзя сделать определенный вывод по имеющимся исходным данным (значение d попало в область неопределенности).

Если альтернативной является гипотеза о наличии в остатках отрицательной автокорреляции первого порядка, то с пороговыми, граничными значениями и сравнивается величина 4 − d (при d >2).

При этом возможны следующие варианты.

1) если 4 − d < , то гипотеза об отсутствии автокорреляции отвергается (с вероятностью ошибки, равной α) в пользу гипотезы об отрицательной автокорреляции;

2) если 4 − d > , то гипотеза не отвергается;

3) если , то нельзя сделать определенный вывод по имеющимся исходным данным.

Таблица 3

Значения и критерия Дарбина-Уотсона при 5% уровне значимости ( n – длина временного ряда, К – число объясняющих переменных в модели)

n

К=1

К=2

К=3

15

1,08

1,36

0,95

1,54

0,82

1,75

16

1,1

1,37

0,98

1,54

0,86

1,73

17

1,13

1,38

1,02

1,54

0,9

1,71

18

1,16

1,39

1,05

1,53

0,93

1,69

19

1,18

1,4

1,08

1,53

0,97

1,68

20

1,2

1,41

1,1

1,54

1

1,68

21

1,22

1,42

1,13

1,54

1,03

1,67

22

1,”4

1,43

1,15

1,54

1,05

1,66

23

1,26

1,44

1,17

1,54

1,08

1,66

24

1,27

1,45

1,19

1,55

1,1

1,66

25

1,29

1,45

1,21

1,55

1,12

1,66

26

1,3

1,46

1,22

1,55

1,14

1,65

27

1,32

1,47

1,24

1,56

1,16

1,65

28

1,33

1,48

1,26

1,56

1,18

1,65

29

1,34

1,48

1,27

1,56

1,2

1,65

30

1,35

1,49

1,28

1,57

1,21

1,65

31

1,36

1,5

1,3

1,57

1,23

1,65

32

1,37

1,5

1,31

1,57

1,24

1,65

33

1,38

1,51

1,32

1,58

1,26

1,65

34

1,49

1,51

1,33

1,58

1,27

1,65

35

1,4

1,52

1,34

1,58

1,28

1,65

36

1,41

1,52

1,35

1,59

1,29

1,65

Таким образом, можно считать, что в случае отсутствия автокорреляции в остатках расчетное значение статистики «не слишком отличается» от 2.

Важнейшими характеристиками качества модели, выбранной для прогнозирования, являются показатели ее точности. Они описывают величины случайных ошибок, полученных при использовании модели. Таким образом, чтобы судить о качестве выбранной модели, необходимо проанализировать систему показателей, характеризующих как адекватность модели, так и ее точность.

О точности прогноза можно судить по величине ошибки (погрешности) прогноза. Ошибка прогноза — величина, характеризующая расхождение между фактическим и прогнозным значением показателя.

Абсолютная ошибка прогноза определяется по формуле:

, (25)

где — прогнозное значение показателя,

— фактическое значение.

Эта характеристика имеет ту же размерность, что и прогнозируемый показатель, и зависит от масштаба измерения уровней временного ряда.

На практике широко используется относительная ошибка прогноза, выраженная в процентах относительно фактического значения показателя:

(26)

При проведении сравнительной оценки моделей могут использоваться такие характеристики качества как дисперсия (S2) или среднеквадратическая ошибка (S):

; . (27)

Чем меньше значения этих характеристик, тем выше точность модели.

В указанном выше примере коэффициенты асимметрии и эксцесса равны соответственно 0,0047 и (-0,77), гипотеза о нормальном характере распределения случайной компоненты не отвергается.

Проверив остатки на автокорреляцию, получаем критерий Дарбина – Уотсона ; d > , гипотеза об отсутствии автокорреляции не отвергается, можно сделать вывод о независимости значений уровней ряда остатков между собой. Следовательно, выбранная модель адекватна по рассмотренным критериям.

Среднеквадратическая ошибка прогноза составляет 536 млн. долл. США или 3 % от среднего значения экспорта Российской Федерации. Модель является достаточно точной и может быть использована для описания основной тенденции и прогнозирования.

В случае если исследователь рассматривает в качестве альтернативы другие модели, для экстраполяции тенденции на будущие периоды необходимо выбрать адекватную модель с наименьшими значениями ошибок.

Пермь Питер Пятигорск