Теория

Парная регрессия

Взаимосвязанные признаки подразделяются на факторные (под их воздействием изменяются другие, зависящие от них признаки) и результативные (изменяющихся под воздействием факторных признаков).

Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, при большом количестве наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

Прямолинейная зависимость в этом случае может быть выражена уравнением прямой:

Параметр a1 называется коэффициентом регрессии и показывает, насколько в среднем отклоняется величина результативного признака y при отклонении величины факторного признака x на одну единицу.

Параметр a0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов.

Алгоритм выполнения индивидуального задания 2

Парная регрессия характеризует связь между двумя признаками: результативным (y) факторным (x). Аналитически линейная связь между ними описывается уравнением прямой ;

  1. Скопируйте файл «Численность населения» на лист Excel.

  2. Скопируйте данные своего варианта задания 1 (без регионов) в следующий столбец.

  1. Исключите суммарные итоги по федеральным округам и Российской федерации в целом (удалите эти строки).

  1. Вычислите средние значения по обоим факторам.

  1. Организуйте столбцы Yi-Yсред, (Yi-Yсред)2, Xi-Xсред, (Xi-Xсред)2, (Yi-Yсред)*(Xi-Xсред). Произведите расчеты этих столбцов.

  1. Рассчитайте суммарные значения столбцов

  1. Рассчитайте коэффициент регрессии а1.

  2. В уравнениях регрессии параметр параметр а1 — коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения.

  3. Коэффициент регрессии а1 рассчитается коэффициент регрессии а1 по формуле:

Коэффициент регрессии означает, что при увеличении а1 – оборота розничной торговли на единицу (один миллиард рублей) численность населения увеличится на 0,05 человека, т.е чтобы численность населения увеличилась на 1 человека, оборот розничной торговли должен увеличится в 20 раз.

  1. Рассчитайте свободный член уравнения регрессии а0 .В уравнениях регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов.

Свободный член а0 в уравнении регрессии означает, что если оборота розничной торговли не будет вовсе, численность населения составит 1258,18 человек. Если бы свободный член был отрицательным, то это бы означало, что х не может быть равен нулю или близким к нулю.

  1. Рассчитайте тесноту связи между рассматриваемыми факторами по величине коэффициента корреляции.

Величина коэффициента корреляции

Характер тесноты связи

До |±0,3|

практически отсутствует

|±0,3|-|±0,5|

слабая

|±0,5|-|±0,7|

умеренная

|±0,7|-|±1,0|

сильная

По направлению выделяют связь прямую и обратную. При прямой связи с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. В случае обратной связи значения результативного признака изменяются в противоположном направлении по сравнению с изменением факторного признака.

  1. Коэффициент корреляции рассчитывается по формуле

Коэффициент корреляции показывает, что связь между факторами сильная.

  1. Рассчитайте коэффициент детерминации по формуле ryx2=0,82=0,64, который характеризует долю вариации результативного признака Y под воздействием всех изучаемых факторных признаков, то есть долю дисперсии отклонений зависимой переменной от её среднего значения, объясняемую рассматриваемой моделью связи.

  2. Проведите статистическую оценку надежности (значимости) параметров парной регрессии

  1. Для коэффициента парной регрессии а1 средняя ошибка оценки

где – расчётные значения результативного признака для i-й единицы;

n- 2 — число степеней свободы (теряются 2 степени свободы, поскольку линейная парная регрессия имеет два параметра).

  1. Рассчитывается столбец с расчётными значениями по уравнению регрессии y=а01х=1258,18+0,05x.

  1. находится отношение коэффициента к его средней ошибке, т.е. t-критерий Стьюдента:

Табличное значение t-критерия Стьюдента при 16 – 2 степенях свободы и уровне значимости 0,05 составляет 2,14 (функция СТЬЮДРАСПОБР).

Полученное значение критерия намного больше, следовательно, вероятность нулевого значения коэффициента регрессии менее 0,05, то есть Коэффициент регрессии значим.

32. Произведите статистическую оценку надежности (значимости) коэффициента корреляции.

  1. Для проверки существенности связи между группировочным признаком и вариацией исследуемого признака используется F-критерий Фишера.

  1. В нашем примере Fкр=3,96 (функция FРАСПРОБР) при уровне значимости 0,05, степенях свободы v1 = m-1; v2 = N-m;

где m – число факторов (при парной корреляции равно 2,

N – число наблюдений,

Степени свободы v1=2-1=1; v2=81-2=79

Поскольку Fрасч >Fкp, коэффициент корреляции значим, наличие связи доказано, т.е. это говорит о наличии связи между факторным и результативным признаками.