Как сделать структурную группировку

Группировка данных и построение ряда распределения

Виды статистических группировок

Принципы построения статистических группировок

При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

Длину частичных интервалов вычисляют как h=(xmax-xmin)/k

Построить вариационный ряд. По найденному ряду построить полигон распределения, гистограмму, кумуляту. Определить моду и медиану.
Скачать решение

Пример. По результатам выборочного наблюдения (выборка А приложение):
а) составьте вариационный ряд;
б) вычислите относительные частоты и накопленные относительные частоты;
в) постройте полигон;
г) составьте эмпирическую функцию распределения;
д) постройте график эмпирической функции распределения;
е) вычислите числовые характеристики: среднее арифметическое, дисперсию, среднее квадратическое отклонение. Решение

Требуется: ранжировать ряд, построить интервальный ряд распределения, вычислить среднее значение, колеблемость среднего значения, моду и медиану для ранжированного и интервального рядов.

На основе исходных данных построить дискретный вариационный ряд; представить его в виде статистической таблицы и статистических графиков. 2). На основе исходных данных построить интервальный вариационный ряд с равными интервалами. Число интервалов выбрать самостоятельно и объяснить этот выбор. Представить полученный вариационный ряд в виде статистической таблицы и статистических графиков. Указать виды примененных таблиц и графиков.

С целью определения средней продолжительности обслуживания клиентов в пенсионном фонде, число клиентов которого очень велико, по схеме собственно-случайной бесповторной выборки проведено обследование 100 клиентов. Результаты обследования представлены в таблице. Найти:
а) границы, в которых с вероятностью 0.9946 заключено среднее время обслуживания всех клиентов пенсионного фонда;
б) вероятность того, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине);
в) объем повторной выборки, при котором с вероятностью 0.9907 можно утверждать, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине).
2. По данным задачи 1, используя X 2 критерий Пирсона, на уровне значимости α = 0,05 проверить гипотезу о том, что случайная величина Х – время обслуживания клиентов – распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Скачать решение

Имеются следующие выборочные данные (выборка 10%-ная, механическая) о выпуске продукции и сумме прибыли, млн. руб. По исходным данным:
Задание 13.1.
13.1.1. Постройте статистический ряд распределения предприятий по сумме прибыли, образовав пять групп с равными интервалами. Постройте графики ряда распределения.
13.1.2. Рассчитайте числовые характеристики ряда распределения предприятий по сумме прибыли: среднюю арифметическую, среднее квадратическое отклонение, дисперсию, коэффициент вариации V. Сделайте выводы.
Задание 13.2.
13.2.1. Определите границы, в которых с вероятностью 0.997 заключена сумма прибыли одного предприятия в генеральной совокупности.
13.2.2. Используя x2-критерий Пирсона, при уровне значимости α проверить гипотезу о том, что случайная величина X – сумма прибыли – распределена по нормальному закону.
Задание 13.3.
13.3.1. Определите коэффициенты выборочного уравнения регрессии.
13.3.2. Установите наличие и характер корреляционной связи между стоимостью произведённой продукции (X) и суммой прибыли на одно предприятие (Y). Постройте диаграмму рассеяния и линию регрессии.
13.3.3. Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами X и Y, используя шкалу Чеддока.
Методические рекомендации. Задание 13.3 выполняется с помощью этого сервиса.
Скачать решение

Задача. Следующие данные представляют собой затраты времени клиентов на заключение договоров. Построить интервальный вариационный ряд представленных данных, гистограмму, найти несмещенную оценку математического ожидания, смещенную и несмещенную оценку дисперсии.

Решение:
Для построения группировка с равными интервалами воспользуемся сервисом Группировка статистических данных.

Источник

Сводка и группировка статистических данных

3.2. Метод группировок в статистике

Под статистической группировкой понимается распределение единиц наблюдения по группам по одному или нескольким признакам. Эти признаки называются группировочными. В зависимости от задач исследования строят типологические, структурные и аналитические группировки.

Таблица 3.1. Распределение предприятий и организаций по формам собственности на 1 января 2006 г.

Форма собственностиЧисло предприятий и организаций, тыс.
Государственная160
Муниципальная252
Собственность общественных и религиозных объединений (организаций)252
Частная3 838
Прочие формы собственности, включая смешанную российскую, иностранную, совместную российскую и иностранную265
Всего4 767

Источник: Россия в цифрах. 2006: Крат. стат. сб. / Росстат. М., 2006. С. 167.

При структурной группировке разделение единиц однородной совокупности на группы происходит с целью выявления ее структуры по одному из признаков. Например, распределение наемных работников по полу, возрасту; распределение предприятий по численности работающих и т.д. Примером структурной группировки являются данные табл. 3.2.

Таблица 3.2. Структура работников по стажу работы на предприятии

Стаж работы, летЧисло работниковЧисло работников в процентах к итогу
До 2105
2-42010
4-63015
6-88040
8 и более6030
Итого200100

При построении аналитической группировки в качестве группировочного признака всегда выбирают факторный признак. В каждой выделенной группе рассчитывают среднее значение результативного признака. Например, в табл. 3.3 компании сгруппированы по величине затрат на рекламу. В каждой группе определен средний размер товарооборота. Из таблицы видно, что чем больше внимания компании уделяют рекламе, тем значительнее результаты их деятельности, выражающиеся в объеме товарооборота.

Таблица 3.3. Распределение компаний по затратам на рекламу и объему товарооборота

Затраты на рекламу в год, млн руб.Число компанийОбъем товарооборота в среднем на одну компанию, млн руб.
До 35300
3-520305
5-715315
7 и более10320
Итого50311
Таблица 3.4. Распределение учащихся на потоке по полу и возрасту

Возраст, летПолИтого
мужчиныженщины
До 1410818
158917
16121325
17 и более111021
Итого414081

Вторичная группировка данных. На практике часто возникают ситуации, когда по имеющимся сгруппированным данным требуется построить новую группировку. При этом, как правило, массив первичных данных оказывается недоступным. Тогда прибегают к методам вторичной группировки данных.

Вторичной группировкой называется перегруппировка уже сгруппированных данных без обращения к массиву первичных данных. Для этой цели применяются два подхода: объединение первоначальных интервалов, если границы новых и старых групп совпадают, и долевая перегруппировка данных при несовпадении границ.

Метод объединения первоначальных интервалов продемонстрируем на следующем примере. Предположим, что исходные данные представляют собой ряд, приведенный в табл. 3.5.

Таблица 3.5. Распределение работников фирмы по размеру заработной платы

Номер интервалаЗаработная плата, руб.Численность работающих, чел.
12 000-3 00016
23 000-4 00040
34 000-5 00065
45 000-6 00058
56 000-7 00044
67 000 и выше17
Итого240
Таблица 3.6. Распределение работников фирмы по размеру заработной платы (вторичная группировка)

Номер интервалаЗаработная плата, руб.Численность работающих, чел.
12 000-4 00056
24 000-6 000123
36 000 и выше61
Итого240

Долевая перегруппировка базируется на принципе равномерности распределения единиц наблюдения внутри границ интервальных групп. В результате ее проведения рассчитывают, какая часть единиц наблюдения перейдет из старой интервальной группы в новую.

Пример 3.1. «Перегруппируем данные табл. 3.5 и образуем новые интервалы: «2000-3400»; «3400-4800»; «4800-6200»; «6200 и выше». Распределим единицы совокупности по новым интервалам.

В первый новый интервал войдут из исходной группировки все единицы первого интервала и часть единиц из второго интервала. Эту часть мы определяем следующим образом. Новая граница «3400» разбивает второй интервал на два отрезка: «3000-3400» и «3400-4000». Находим, какую долю составляет длина отрезка «3000-3400» от длины второго интервала. Она равна Как сделать структурную группировкуЗначит, от 40 единиц, находившихся во втором интервале исходной группировки, следует взять для нового первого интервала 16 единиц Как сделать структурную группировкуТогда первый новый интервал будет содержать 32 единицы (16 + 16).

При проверке правильности расчетов видим, что сумма единиц совокупности осталась равной 240.

Результаты вторичной группировки приведены в следующей таблице.

Источник

Структурные группировки

Структурная группировка заключается в расчленении однородной в качественном отношении совокупности статистических единиц на группы, характеризующие состав сложного объекта. Посредством структурной группировки изучается внутреннее строение типов, статистических совокупностей. В связи с этим она может проводиться на основе типологической группировки. Вместе с тем нередко изучается структура общих совокупностей, включающих неоднородные явления. Например, исследуется структура всех организаций и хозяйств в системе АПК: сельскохозяйственных, вспомогательных, перерабатывающих, сбытовых и др.

Структурные группировки могут проводиться как по качественным, так и по количественным признакам. В зависимости от целей, задач, масштабности и сложности статистического объекта за основу группировки берут либо один, либо несколько существенных группировочных признаков. В связи с этим структурные группировки могут быть простыми или сложными (комбинированными).

Структурная группировка проводится в следующем порядке:

· выбирается один или несколько группировочных признаков, по которым намечено провести группировку;

· выделяются группы по качественным признакам или определяются интервалы по количественным признакам;

· статистические единицы группируются согласно выделенным группам; по каждой группе рассчитываются необходимые относительные и средние показатели;

· оцениваются результаты структурной группировки.

Выбор группировочных признаков определяется поставленной задачей структурной группировки. Так, если необходимо выявить структуру численности работников по уровню образования, то очевидно, что все работники будут распределены по качественному признаку. Если же поставлена задача определить структуру работников по возрасту, то их численность необходимо распределить по количественному признаку. При необходимости изучения совместной структуры численности работников по уровню образования и по возрасту возможно применение этих двух признаков в сочетании (комбинации).

Выделение групп по намеченным качественным признакам в структурной группировке ограничивается, как правило, характером признака. При этом количество групп, на которые делится изучаемая статистическая совокупность, нередко определяется числом разновидностей качественного признака. Так, группировка работников системы АПК по профессиям допускает формирование стольких групп, сколько различных профессий имеют работники этой отрасли экономики.

В качестве примера простой структурной группировки по качественному признаку можно привести данные о составе всей рабочей силы Республики Беларусь по уровню образования (табл. 3.3).

Т а б л и ц а 3. 3. Распределение численности работников по уровню образования(на начало года, в % к итогу)

Показатели
Всего работников100,0100,0100,0
В т. ч. имеют образование высшее среднее специальное среднее общее базовое (неполное среднее)18,8 22,4 50,6 8,222,8 22,8 31,2 4,323,8 22,7 29,8 3,4

Данные таблицы 3.3 показывают, что в структуре общей численности работников Беларуси за период 2001 – 2009 гг. значительная доля была представлена группой лиц, имевших среднее образование. Удельный вес этих групп имеет тенденцию к снижению. Сокращается также доля группы работников, имевших базовое (неполное среднее) образование. В структуре всех работников Беларуси значительный удельный вес занимали группы лиц, имевших среднее специальное и высшее образование. Доля каждой из этих групп за рассматриваемый период повысилась.

Структурные сдвиги в распределении численности работников свидетельствуют об улучшении качественного состава рабочей силы в Республике Беларусь по уровню образования.

Построение структурной группировки по количественным признакам обычно связано с определением рационального числа интервальных групп и расчётом величины интервалов. Возможное рациональное число групп может колебаться в различных приделах и зависит от объема статистического объекта (количества единиц) и однородности группировочных признаков.

При расчете величины интервалов, т.е. пределов колебания между наибольшими и наименьшими значениями признака в каждой группе, необходимо стремиться к тому, чтобы не исчезли особенности изучаемого явления. Например, при изучении структурных особенностей перерабатывающих организации АПК по числу работников необходимо, чтобы число групп было не слишком большим и не слишком малым. В настоящее время перерабатывающая сфера АПК представлена сочетанием небольших (20 – 30 работников), средних (100-200 человек) и крупных (700-800 и более работников) организаций.

При условии формирования малого числа интервальных групп возможно попадание в одну и ту же группу перерабатывающих организаций, существенно различающихся по их размеру. В то же время если образовать большое число групп, то в них могут сгладиться характерные особенности, выражающие различия по численности работников в организациях.

Одно из важнейших требований формирования групп заключается в том, чтобы в каждую вошло достаточно большое число статистических единиц для обеспечения представительности результатов структурной группировки. Это достигается регулированием величины интервалов в группах, т.е. путем использования равных и неравных интервалов. Применение приёма равных интервалов во всех группах может быть обеспечено только в условиях однородности группировочного признака, т.е. когда вариация этого признака не превышает 10 %. В условиях же неоднородности группировочного признака формирование интервальных групп чаще всего связано с неравными интервалами.

Примером простой структурной группировки, построенной по количественному признаку, могут быть данные о составе рабочей силы Республики Беларусь по возрасту (табл. 3.4).

Т а б л и ц а 3.4. Распределение численности работников по возрастным группам

(на начало года, в % к итогу)

Показатели2001 г.2006 г.2009 г.
Всего работников100,0100,0100,0
в т.ч. в возрасте, лет:
до 2510,611,411,6
– 25-2912,012,112,4
– 30-3927,524,423,4
– 40-4928,728,826,6
– 50-5411,812,513,6
– 55 и старше9,610,812,4
средний возраст, лет39,439,740,1

Из данных табл. 3.4. видно, что в структуре общей численности работников Беларуси за период 2001 – 2009 гг. основной удельный вес занимали группы лиц в возрасте 30–39 и 40–49 лет, которые составляли вместе не менее 55 % всего числа работников. В динамике доля групп работников в возрасте до 25 лет, 25–29 и 50–54 года, 55 лет и старше имела тенденцию повышения, доля работников в возрасте 30–39 лет – снижения. Структурные изменения, имевшие место в составе общей численности работников Беларуси за период 2001– 2009гг. привели к повышению среднего возраста работавшего населения с 39,4 до 40,1 года.

Содержание и значение аналитических группировок.

Дата добавления: 2017-04-20 ; просмотров: 1931 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *