Для выявления наличия связи, ее характера и направления применяются различные статистические методы. Поскольку зависимости в статистике проявляются через вариацию признаков, то и методы в основном измеряют и сопоставляют вариацию факторного и результативного признаков.
Описательные методы.
Метод приведения параллельных рядов.
Балансовый метод.
Графический метод (корреляционное поле).
Метод аналитической группировки.
Аналитические методы.
Непараметрические (ранговые): коэффициент Фехнера, коэффициент ассоциации и контингенции, коэффициент Спирмена (ранговый коэффициент).
Параметрические: корреляционный.
Рассмотрим каждый из них в отдельности.
Изучение неполной корреляции осуществляется двумя группами методов, которые можно определить, как нематематические и математические. Нематематические методы дают приближенную оценку о наличии, формы и направлении связи. Нематематические методы:
Метод параллельных рядов;
Метод аналитических группировок;
Графический метод.
Метод параллельных рядов применяется для определения наличия и
направления взаимосвязи при немногочисленных совокупностях (15-20 единиц). При этом методе значение факторного признака располагается в порядке возрастания или убывания и параллельно с ними отражаются соответствующие значения результативного признака. Сопоставляя ряды значений, устанавливается зависимость. По вариации признака в первом и втором ряду судят о наличии связи признаков. Такой метод позволяет вывести только направление связи, но не измерить ее.
Метод аналитической группировки применяется в случаях, когда совокупность достаточно велика и параллельные ряды не позволяют обнаружить зависимость. Сущность метода аналитических группировок состоит в том, что единицы статистической совокупности группируются, как правило, по факторному признаку и для каждой группы рассчитывается средняя или относительная величина по результативному признаку. Затем изменения средних или относительных значений результативного признака сопоставляются с изменениями факторного признака для выявления характера связи между ними. Результаты аналитической группировки представляют в виде итоговой статистической таблицы.
В расчетной части по данным 30 предприятий выполнена аналитическая группировка, результаты которой представлены в итоговой таблице.
Таблица 1
Результаты аналитической группировки
№ |
Группы предприятий по уровню производительности труда, тыс. руб./чел |
Число предприятий |
Уровень производительности, тыс. руб./чел |
Средняя заработная плата. тыс. руб. |
||
всего |
среднее |
всего |
среднее |
|||
1 |
120 – 168 |
3 |
410 |
136,67 |
133 |
44,33 |
2 |
168 – 216 |
4 |
740 |
185 |
232 |
58 |
3 |
216 – 264 |
12 |
2911 |
242,58 |
907 |
75,58 |
4 |
264 – 312 |
7 |
2012 |
287,43 |
631 |
90,14 |
5 |
312 – 360 |
4 |
1350 |
337,5 |
447 |
111,8 |
всего |
|
30 |
7423 |
247,43 |
2350 |
78,33 |
Таким образом, гипотеза о наличии прямой зависимости между производительностью труда и заработной платой подтверждается. В группе с самой низкой производительностью труда – 136,67 тыс. руб./чел. заработная плата так же самая низкая и составляет 44,33 тыс. руб./чел. В группе с самой высокой производительностью труда – 337,5 тыс. руб./чел. наблюдается и самый высокий уровень заработной платы – 11,8 тыс. руб. Таким образом рост производительности труда в 337,5 / 136,67 = 2,47 раз приводит к увеличению заработной платы в 111,8 / 44,33 = 2,52 раза. Следовательно, можно сделать предположение о пропорциональном увеличении заработной платы в зависимости от роста производительности труда. Другим словами, можно предположить, что взаимосвязь между факторами может быть выражена линейной зависимостью.
Графический метод заключается в построении корреляционного поля, на котором отражаются параметрические данные. На оси абсцисс откладывается значение факторного признака, а на оси ординат – результативного. Каждая единица, обладающая определенным значением факторного и результативного признака, обозначается точкой. По корреляционному полю так же можно судить о характере взаимосвязи. Если точки сконцентрированы около диагонали идущей слева направо, снизу вверх – то связь прямая. Если около другой диагонали – обратная. Если точки рассеяны по всему полю графика – связь отсутствует. Наоборот, чем сильнее связь, тем теснее точки группируются вокруг определенной линии.
На рисунке 1 представлен график корреляционного поля. Зависимая переменная – уровень заработной платы, факторный признак – производительность труда. Связь прямая, точки тесно группируются вокруг прямой линии, таким образом, между факторами наблюдается тесная зависимость.
Рис.1. График корреляционного поля
Более глубокий анализ осуществляется с помощью математических методов:
Регрессионный анализ, позволяющий выразить с помощью уравнения форму взаимосвязи, т.е. исследует аналитическое выражение взаимосвязи между признаками. Одной из проблем построения уравнений регрессии является их размерность, то есть определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным. Сокращение размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, качественнее реализуемую.
При построении моделей регрессии должны соблюдаться следующие требования:
1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.
2. Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей.
3. Все факторные признаки должны иметь количественное выражение.
4. Наличие достаточно большого объема исследуемой совокупности.
5. Постоянство территориальной и временной структуры изучаемой совокупности.
Корреляционный анализ имеет своей задачей количественное определение тесноты и направления связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). Теснота связи количественно выражается величиной коэффициентов корреляции, которые, давая количественную характеристику тесноты связи между признаками, позволяют определить «полезность» факторных признаков при построении уравнения множественной регрессии. Знаки при коэффициентах корреляции характеризуют направление связи между признаками.
Корреляционные методы делятся на:
– Параметрические методы, которые дают оценку тесноты связи непосредственно на базе значений факторного и результативного признаков. Главным параметрическим методом является корреляционный. Он заключается в нахождении уравнения связи, в котором результативный признак зависит только от интересующего нас фактора (или нескольких факторов). Все прочие факторы, также влияющие на результат, принимаются за постоянные средние.
– Непараметрические методы – дают оценку на основе условных оценок признаков. Их еще называют ранговыми методами. Они связаны с расчетами различных коэффициентов: коэффициент Фехнера (коэффициент совпадения знаков), коэффициенты ассоциации и контингенции, коэффициент Спирмана (ранговый коэффициент). Применяются как отдельно, так и совместно с параметрическими. Особенно эффективны непараметрические методы, когда необходимо измерить связь между качественными признаками. Они проще в вычислении и не требуют никаких предположений о законе распределения исходных статистических данных, т.к. при их расчете оперируют не самими значениями признаков, а их рангами, частотами, знаками и т.д.
Оценка тесноты криволинейных зависимостей дается после расчета параметра уравнения регрессии. Поэтому такой метод называется корреляционно-регрессионным.
Если анализируется зависимость одного факторного и результативного признаков, то в этом случае имеем дело с парной корреляцией и регрессией. Если анализируются несколько факторных и результативных признаков – это множественная корреляция и регрессия.