Выборочное наблюдение: понятие, виды, ошибки выборки, оценка результатов. Примеры решения задач

Как известно, в статистике существует два способа наблюдения массовых явлений в зависимости от полноты охвата объекта: сплошное и несплошное. Разновидностью несплошного наблюдения является выборочное наблюдение.

Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным образом.

Выборочное наблюдение ставит перед собой задачу – по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.

Совокупность отобранных для обследования единиц в статистике принято называть выборочной совокупностью, а совокупность единиц, из которых производится отбор, называют генеральной совокупностью. Основные характеристики генеральной и выборочной совокупности представлены в таблице 1.

Таблица 1 - Основные характеристики генеральной и выборочной совокупности
Показатель Обозначение или формула
Генеральная совокупность Выборочная совокупность
Число единиц N n
Число единиц, обладающих каким-либо признаком M m
Доля единиц, обладающих этим признаком p = M/N ω = m/n
Доля единиц, не обладающих этим признаком q = 1 - p 1 - ω
Средняя величина признака формула формула
Дисперсия признака формула формула
Дисперсия альтернативного признака (дисперсия доли) pq ω (1 - ω )

При проведении выборочного наблюдения возникают систематические и случайные ошибки. Систематические ошибки возникают в силу нарушения правил отбора единиц в выборку. Изменив правила отбора, от таких ошибок можно избавиться.

Случайные ошибки возникают в силу несплошного характера обследования. Иначе их называют ошибками репрезентативности (представительности). Случайные ошибки разделяют на средние и предельные ошибки выборки, которые определяются как при расчете признака, так и при расчете доли.

Средние и предельные ошибки связаны следующим соотношением: Δ = tμ, где Δ - предельная ошибка выборки, μ - средняя ошибка выборки, t - коэффициент доверия, определяемый в зависимости от уровня вероятности. В таблице 2 приведены некоторые значения t, взятые из теории вероятностей.

Таблица 2 - Соответствие некоторых значений вероятностей коэффициенту доверия
Вероятность, Р 0,683 0,866 0,954 0,988 0,997 0,999
Значение t 1,0 1,5 2,0 2,5 3,0 3,5

Величина средней ошибки выборки рассчитывается дифференцированно в зависимости от способа отбора и процедуры выборки. Основные формулы для расчета ошибок выборки представлены в таблице 3.

Таблица 3 - Основные формулы для расчета ошибок выборки при повторном и бесповторном отборе
Показатель Обозначение и формула
Генеральная совокупность Выборочная совокупность
Средняя ошибка признака при случайном повторном отборе формула формула
Средняя ошибка доли при случайном повторном отборе формула формула
Предельная ошибка признака при случайном повторном отборе формула формула
Предельная ошибка доли при случайном повторном отборе формула формула
Средняя ошибка признака при случайном бесповторном отборе формула формула
Средняя ошибка доли при случайном бесповторном отборе формула формула
Предельная ошибка признака при случайном бесповторном отборе формула формула
Предельная ошибка доли при случайном бесповторном отборе формула формула

Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности.

формула

Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:

формула

- пределы доли признака в генеральной совокупности р.

Примеры решения задач по теме «Выборочное наблюдение в статистике»

Задача 1. Имеется информация о выпуске продукции (работ, услуг), полученной на основе 10% выборочного наблюдения по предприятиям области:

таблица

Определить: 1) по предприятиям, включенным в выборку: а) средний размер произведенной продукции на одно предприятие; б) дисперсию объема производства; в) долю предприятий с объемом производства продукции более 400 тыс. руб.; 2) в целом по области с вероятностью 0,954 пределы, в которых можно ожидать: а) средний объем производства продукции на одно предприятие; б) долю предприятий с объемом производства продукции более 400 тыс. руб.; 3) общий объем выпуска продукции по области.

Решение

Для решения задачи расширим предложенную таблицу.

таблица

1) По предприятиям, включенным в выборку, средний размер произведенной продукции на одно предприятие

формула

= 110800/400 = 277 тыс. руб.

Дисперсию объема производства вычислим упрощенным способом σ2 = 35640000/400 – 2772 = 89100 - 76229 = 12371.

Число предприятий, объем производства продукции которых превышает 400 тыс. руб. равно 36+12 = 48, а их доля равна ω = 48:400 = 0,12 = 12%.

2) Из теории вероятности известно, что при вероятности Р=0,954 коэффициент доверия t=2. Предельная ошибка выборки

формула

= 2√12371:400 = 11,12 тыс. руб.

Установим границы генеральной средней: 277-11,12 ≤Хср≤ 277+11,12; 265,88 ≤Хср≤ 288,12

Предельная ошибка выборки доли предприятий

формула

=2√0,12*0,88/400 = 0,03

Определим границы генеральной доли: 0,12-0,03≤ р ≤0,12+0,03; 0,09≤ р ≤0,15

3) Поскольку рассматриваемая группа предприятий составляет 10% от общего числа предприятий области, то в целом по области насчитывается 4000 предприятий. Тогда общий объем выпуска продукции по области лежит в пределах 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

Задача 2. По результатам контрольной проверки налоговыми службами 400 бизнес-структур, у 140 из них в налоговых декларациях не полностью указаны доходы, подлежащие налогообложению. Определите в генеральной совокупности (по всему району) долю бизнес-структур, скрывших часть доходов от уплаты налогов, с вероятностью 0,954.

Решение

По условию задачи число единиц в выборочной совокупности n=400, число единиц, обладающих рассматриваемым признаком m=140, вероятность Р=0,954.

Из теории вероятностей известно, что при вероятности Р=0,954 коэффициент доверия t=2.

Долю единиц, обладающих указанным признаком, определим по формуле: p=w+∆p, где w = m/n=140/400=0,35=35%,
а предельную ошибку признака ∆p получим из формулы: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5%

Тогда р = 35±5%.

Ответ: Доля бизнес-структур, скрывших часть доходов от уплаты налогов с вероятностью 0,954 равна 35±5%.

Другие статьи по данной теме:

Список использованных источников

  1. Белобородова С.С. и др. Теория статистики: Типовые задачи с контрольными заданиями. Екатеринбург: Изд-во Урал. гос. экон. ун-та, 2001;
  2. Минашкин В.Г. и др. Курс лекций по теории статистики. / Московский международный институт эконометрики, информатики, финансов и права. - М., 2003;
  3. Сизова Т.М. Статистика: Учебное пособие. – СПб.: СПб ГУИТМО, 2005;
  4. Фёдорова Л.Н., Фёдорова А.Е. Методические указания по написанию контрольной работы по курсу «Статистика» для студентов экономических специальностей: УрГЭУ, 2007;




Делопроизводство
Этика и психология делового общения
Методы исследования


2012-2015 © Лана Забродская (в Google+). При копировании материалов сайта ссылка на источник обязательна