Построение статистических группировок включает следующие этапы:
Определение цели группировки и группировочного признака.
Определение числа групп.
Обозначение границ групп.
Выбор признаков, которые будут характеризовать выделенные группы.
Число выделяемых групп зависит от вида группировочного признака, степени его вариации и объема изучаемой совокупности.
Если группировочный признак атрибутивный (качественный), то число групп будет равно числу вариантов этого признака.
В зависимости от того, как задано значение количественного признака в группе – отдельным (дискретным) значением или интервалом, – различают соответственно дискретные и интервальные группировки.
Дискретные группировки рекомендуются, если значения признака в совокупности повторяются часто и количество вариантов значений много меньше, чем объем совокупности. При этом количество групп определяется числом вариантов значений признака.
Алгоритм дискретной группировки:
1)Определяется число вариантов значений признака. Количество групп (К) равно этому числу.
2) Подсчитывается численность единиц по каждой группе
3)Результаты заносят в таблицу.
Макет таблицы, представляющий результат дискретной группировки
Номер группы i |
Значения группировочного признака, xi |
Число единиц совокупности в группе, fi |
Доля единиц в _рупппе = fi/N |
1 |
Х1 |
|
|
2 |
Х2 |
|
|
… |
|
|
|
К |
Хк |
|
|
Итого: |
– |
N |
1 |
Пример. Группа из 15 человек представляет собой статистическую совокупность. Каждый студент характеризуется признаком х – оценкой по дисциплине «Статистика» (пятибалльная система). Построить дискретную группировку по признаку х.
Номер студента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
Оценка |
3 |
3 |
4 |
5 |
4 |
4 |
5 |
4 |
3 |
4 |
3 |
2 |
4 |
3 |
4 |
Число вариантов значений признака равно 4 – 2,3,4,5.
Номер группы i |
Оценка по статистике |
Число студентов |
Доля студентов |
1 |
2 |
1 |
0,067 |
2 |
3 |
5 |
0,33 |
3 |
4 |
7 |
0,47 |
4 |
5 |
2 |
0,133 |
Итого: |
– |
15 |
1,0 |
Интервальные группировки рекомендуются, если группировочный признак имеет большое число вариантов значений.
Алгоритм построения группировки с равными интервалами:
Определяется количество групп. Для совокупностей объемом свыше 30 единиц используют формулу Стерджесса:
Определяется длина интервала:
Определяются границы каждого интервала
Результаты заносят в таблицу.
Пример. Группа из 15 человек представляет собой статистическую совокупность. Каждый студент характеризуется признаком х – суммой баллов, набранной при изучении дисциплины «Статистика» в соответствии с балльно-рейтинговой системой (максим. сумма 100). Построить равноинтервальную группировку по признаку х.
Номер студента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
Баллы |
41 |
60 |
80 |
91 |
75 |
85 |
98 |
85 |
50 |
80 |
45 |
30 |
72 |
70 |
90 |
Возьмем число групп 3. Величина интервала =23
Номер группы I |
Баллы по статистике |
Число студентов |
Доля студентов |
1 |
30-53 |
4 |
0,267 |
2 |
53-76 |
4 |
0,267 |
3 |
76-99 |
7 |
0,467 |
Итого: |
|
15 |
1,0 |
Алгоритм построения аналитической группировки:
Выделяют признак-фактор х и признак-результат у.
Производится группировка единиц совокупности по х.
По каждой полученной группе отбираются соответствующие значения признака у, и на их основе рассчитывается обобщающий показатель (чаще всего среднее значение)
Анализируются результаты группировки и делается вывод о наличии или отсутствии взаимосвязи.