Для измерения силы связи между двумя переменными используется такая статистическая характеристика, как коэффициент корреляции.
Для двух переменных коэффициент парной корреляции определяется следующим образом:
(1),
где – оценки дисперсий величин Х, Y. Эти оценки характеризуют степень разброса значений и вокруг своих средних и (т.е.вариабельность этих переменных на множестве наблюдений).
Оценка дисперсии определяется по формуле:
(2)
В теории разработаны и на практике применяются и другие модификации формулы расчета данного коэффициента:
(3)
Более естественно измерять степень разброса значений переменных в тех же единицах, в которых измеряется и сама переменная. Для этого вычисляется показатель, называемый среднеквадратическим отклонением (или стандартной ошибкой переменной Х или Y):
(4)
Коэффициент корреляции принимает значения в диапазоне от -1 до +1.
Для качественной оценки коэффициента корреляции применяется следующая шкала:
0,1-0,3 – слабая;
0,3-0,5 – заметная;
0,5-0,7 – умеренная;
0,7-0,9 – высокая;
0,9-1,0 – весьма высокая.
По направлению выделяют связь прямую (положительную) (значение коэффициента корреляции со знаком «+») и обратную (отрицательную) (значение коэффициента корреляции со знаком «-»). Прямая – это связь, при которой с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного признака. Так, рост объемов производства способствует увеличению прибыли предприятия. В случае обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака, то есть обратная – это связь, при которой с увеличением или с уменьшением значений одного признака происходит, соответственно, уменьшение или увеличение значений другого признака. Так, снижение себестоимости единицы производимой продукции влечет за собой рост рентабельности.
Важно отметить, что величина коэффициента корреляции не является доказательством того, что между исследуемыми признаками существует причинно-следственная связь, а представляет собой лишь оценку степени взаимной согласованности в изменениях признаков. Для того, чтобы установить причинно-следственную зависимость, необходим анализ качественной природы явлений.
Пример.
На основе выборочных данных о деятельности 6 предприятий одной из отраслей промышленности оценить тесноту связи между трудоемкостью продукции предприятия (Х, чел./час) и объемом ее производства (Y, млн.руб.).
Таблица 2
Расчетная таблица для определения коэффициента корреляции
№ |
Объем произведенной продукции Y, млн.руб. |
Затраты на 100 изделий Х, чел./час |
yx |
y2 |
x2 |
1 |
221 |
96 |
21216 |
48841 |
9216 |
2 |
1070 |
77 |
82390 |
1144900 |
5929 |
3 |
1001 |
77 |
77077 |
1002000 |
5929 |
4 |
606 |
89 |
53934 |
367236 |
7921 |
5 |
779 |
82 |
63878 |
606841 |
6724 |
6 |
789 |
81 |
63909 |
622520 |
6561 |
Cумма |
4466 |
502 |
362404 |
3792338 |
42280 |
Средняя |
744,33 |
83,67 |
60400,67 |
632056,33 |
7046,67 |
Используя формулу (3) получаем:
Значение коэффициента корреляции свидетельствует о сильной обратной зависимости между изучаемыми признаками.