Progress-servis55.ru

Новости из мира ПК
2 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Предельная ошибка выборки определяется по формуле

Выборочное наблюдение: понятие, виды, ошибки выборки, оценка результатов. Примеры решения задач

Как известно, в статистике существует два способа наблюдения массовых явлений в зависимости от полноты охвата объекта: сплошное и несплошное. Разновидностью несплошного наблюдения является выборочное наблюдение.

Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным образом.

Выборочное наблюдение ставит перед собой задачу – по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.

Совокупность отобранных для обследования единиц в статистике принято называть выборочной совокупностью, а совокупность единиц, из которых производится отбор, называют генеральной совокупностью. Основные характеристики генеральной и выборочной совокупности представлены в таблице 1.

Таблица 1 — Основные характеристики генеральной и выборочной совокупности

ПоказательОбозначение или формула
Генеральная совокупностьВыборочная совокупность
Число единицNn
Число единиц, обладающих каким-либо признакомMm
Доля единиц, обладающих этим признакомp = M/Nω = m/n
Доля единиц, не обладающих этим признакомq = 1 — p1 — ω
Средняя величина признака
Дисперсия признака
Дисперсия альтернативного признака (дисперсия доли)pqω (1 — ω )

При проведении выборочного наблюдения возникают систематические и случайные ошибки. Систематические ошибки возникают в силу нарушения правил отбора единиц в выборку. Изменив правила отбора, от таких ошибок можно избавиться.

Случайные ошибки возникают в силу несплошного характера обследования. Иначе их называют ошибками репрезентативности (представительности). Случайные ошибки разделяют на средние и предельные ошибки выборки, которые определяются как при расчете признака, так и при расчете доли.

Средние и предельные ошибки связаны следующим соотношением: Δ = tμ, где Δ — предельная ошибка выборки, μ — средняя ошибка выборки, t — коэффициент доверия, определяемый в зависимости от уровня вероятности. В таблице 2 приведены некоторые значения t, взятые из теории вероятностей.

Таблица 2 — Соответствие некоторых значений вероятностей коэффициенту доверия

Вероятность, Р0,6830,8660,9540,9880,9970,999
Значение t1,01,52,02,53,03,5

Величина средней ошибки выборки рассчитывается дифференцированно в зависимости от способа отбора и процедуры выборки. Основные формулы для расчета ошибок выборки представлены в таблице 3.

Таблица 3 — Основные формулы для расчета ошибок выборки при повторном и бесповторном отборе

ПоказательОбозначение и формула
Генеральная совокупностьВыборочная совокупность
Средняя ошибка признака при случайном повторном отборе
Средняя ошибка доли при случайном повторном отборе
Предельная ошибка признака при случайном повторном отборе
Предельная ошибка доли при случайном повторном отборе
Средняя ошибка признака при случайном бесповторном отборе
Средняя ошибка доли при случайном бесповторном отборе
Предельная ошибка признака при случайном бесповторном отборе
Предельная ошибка доли при случайном бесповторном отборе

Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности.

Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:

— пределы доли признака в генеральной совокупности р.

Примеры решения задач по теме «Выборочное наблюдение в статистике»

Задача 1. Имеется информация о выпуске продукции (работ, услуг), полученной на основе 10% выборочного наблюдения по предприятиям области:

Определить: 1) по предприятиям, включенным в выборку: а) средний размер произведенной продукции на одно предприятие; б) дисперсию объема производства; в) долю предприятий с объемом производства продукции более 400 тыс. руб.; 2) в целом по области с вероятностью 0,954 пределы, в которых можно ожидать: а) средний объем производства продукции на одно предприятие; б) долю предприятий с объемом производства продукции более 400 тыс. руб.; 3) общий объем выпуска продукции по области.

Решение

Для решения задачи расширим предложенную таблицу.

1) По предприятиям, включенным в выборку, средний размер произведенной продукции на одно предприятие

= 110800/400 = 277 тыс. руб.

Дисперсию объема производства вычислим упрощенным способом σ 2 = 35640000/400 – 277 2 = 89100 — 76229 = 12371.

Число предприятий, объем производства продукции которых превышает 400 тыс. руб. равно 36+12 = 48, а их доля равна ω = 48:400 = 0,12 = 12%.

2) Из теории вероятности известно, что при вероятности Р=0,954 коэффициент доверия t=2. Предельная ошибка выборки

= 2√12371:400 = 11,12 тыс. руб.

Установим границы генеральной средней: 277-11,12 ≤Хср≤ 277+11,12; 265,88 ≤Хср≤ 288,12

Предельная ошибка выборки доли предприятий

Определим границы генеральной доли: 0,12-0,03≤ р ≤0,12+0,03; 0,09≤ р ≤0,15

3) Поскольку рассматриваемая группа предприятий составляет 10% от общего числа предприятий области, то в целом по области насчитывается 4000 предприятий. Тогда общий объем выпуска продукции по области лежит в пределах 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

Задача 2. По результатам контрольной проверки налоговыми службами 400 бизнес-структур, у 140 из них в налоговых декларациях не полностью указаны доходы, подлежащие налогообложению. Определите в генеральной совокупности (по всему району) долю бизнес-структур, скрывших часть доходов от уплаты налогов, с вероятностью 0,954.

Решение

По условию задачи число единиц в выборочной совокупности n=400, число единиц, обладающих рассматриваемым признаком m=140, вероятность Р=0,954.

Из теории вероятностей известно, что при вероятности Р=0,954 коэффициент доверия t=2.

Долю единиц, обладающих указанным признаком, определим по формуле: p=w+∆p, где w = m/n=140/400=0,35=35%,
а предельную ошибку признака ∆p получим из формулы: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5%

Ответ: Доля бизнес-структур, скрывших часть доходов от уплаты налогов с вероятностью 0,954 равна 35±5%.

Другие статьи по данной теме:

  • назад:Показатели вариации: понятие, виды, формулы для вычислений
  • далее:Ряды динамики: понятие и классификация. Показатели уровней ряда динамики. Примеры решения задач

Список использованных источников

  1. Белобородова С.С. и др. Теория статистики: Типовые задачи с контрольными заданиями. Екатеринбург: Изд-во Урал. гос. экон. ун-та, 2001;
  2. Минашкин В.Г. и др. Курс лекций по теории статистики. / Московский международный институт эконометрики, информатики, финансов и права. — М., 2003;
  3. Сизова Т.М. Статистика: Учебное пособие. – СПб.: СПб ГУИТМО, 2005;
  4. Фёдорова Л.Н., Фёдорова А.Е. Методические указания по написанию контрольной работы по курсу «Статистика» для студентов экономических специальностей: УрГЭУ, 2007;

2012 © Лана Забродская. При копировании материалов сайта ссылка на источник обязательна

Предельная ошибка выборки

Онлайн школа английского языка нового поколения. Более 7 лет предоставляет обучение английскому языку по Skype (Скайп) и является лидером данного направления! Основные преимущества:

    Вводный урок бесплатно; Большое число опытных преподавателей (нейтивов и русскоязычных); Курсы НЕ на определенный срок (месяц, полгода, год), а на конкретное количество занятий (5, 10, 20, 50); Более 10 000 довольных клиентов. Стоимость одного занятия с русскоязычным преподавателем — от 600 рублей, с носителем языка — от 1500 рублей

Учитывая, что на основе выборочного обследования нельзя точно оценить изучаемый параметр (например, среднее значение) генеральной совокупности, необходимо найти пределы, в которых он находится. В конкретной выборке разность может быть больше, меньше или равна . Каждое из отклонений от имеет определенную вероятность. При выборочном обследовании реальное значение в генеральной совокупности неизвестно. Зная среднюю ошибку выборки, с определенной вероятностью можно оценить отклонение выборочной средней от генеральной и установить пределы, в которых находится изучаемый параметр (в данном случае среднее значение) в генеральной совокупности. Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки . Она определяется в долях средней ошибки с заданной вероятностью, т.е.

= t, (1.38)

где tкоэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.

Вероятность появления определенной ошибки выборки находят с помощью теорем теории вероятностей. Согласно теореме П. Л. Чебышёва, при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности вероятность того, что разность между выборочной средней и генеральной средней будет сколь угодно мала, близка к единице:

при .

А. М. Ляпунов доказал, что независимо от характера распределения генеральной совокупности при увеличении объема выборки распределение вероятностей появления того или иного значения выборочной средней приближается к нормальному распределению. Это так называемая центральная предельная теорема. Следовательно, вероятность отклонения выборочной средней от генеральной средней, т.е. вероятность появления заданной предельной ошибки, также подчиняется указанному закону и может быть найдена как функция от t с помощью интеграла вероятностей Лапласа:

,

где – нормированное отклонение выборочной средней от генеральной средней.

Значения интеграла Лапласа для разных t рассчитаны и име­ются в специальных таблицах, из которых в статистике широко применяется сочетание:

Определение ошибки выборки при различных способах отбора

При решении задач выборочного наблюдения обязательным этапом является определение ошибки выборки. Формулы для ее определения разработаны теорией вероятности и математической статистикой.

При собственно-случайном способе отбора обследованию подвергаются единицы совокупности без предварительного систематизирования.

Средняя ошибка выборки для среднего размера признака определяется по формулам 8.1 и 8.2.

При повторном способе:

При бесповторном способе:

где — дисперсия;

n – объем выборочной совокупности;

N – объем генеральной совокупности.

Предельная (абсолютная ошибка выборки) находится по формуле:

, (8.3)

где t – коэффициент доверия, который определяется по таблице

значений функции Лапласа при заданной

Относительная ошибка выборки определятся с использованием формулы:

где — среднее значение признака в выборочной совокупности.

Считается, что если β превышает 12%, то погрешность высокая и необходимо увеличить объем выборки.

Зная величину выборочной средней и предельную ошибку выборки, определяется доверительный интервал, в котором находится значение генеральной средней:

+ , (8.5)

где – средний размер признака в генеральной совокупности.

При проектировании выборочного наблюдения решается задача нахождения необходимой численности выборки, обеспечивающей определенную точность расчета оценок генеральной средней.

Сначала задается величина относительной ошибки выборки (β), затем определяется абсолютная ошибка (Δ) при заданном значении β:

Затем находится объем выборки при повторном способе:

При бесповторном способе объем выборки определяется:

При определении ошибки доли единиц, которые обладают определенным признаком, используется формула:

— при повторном способе:

— при бесповторном способе:

где w – доля единиц, обладающих каким-либо значением признака в

Значение генеральной доли (P) будет находиться в доверительном интервале:

Пример 1. Для определения средней продолжительности междугородних телефонных разговоров из 1300 предоставленных абонентам разговоров в случайном порядке было отобрано 316. Результаты этого наблюдения представлены в таблице 8.1.

Продолжительность междугородних телефонных разговоров, мин.Количество разговоров
До 3 3-5 5-7 7-9 9-11 11-13 13-15
Итого

По данным ряда распределения определить:

— среднюю протяженность разговоров;

— ошибку средней при вероятности 0,99;

— объем выборки при заданном значении β=4%.

Способ отбора бесповторный.

По средней арифметической взвешенной определено, что средняя продолжительность разговоров составляет 6,7 мин., а дисперсия 7,3 мин.

Абсолютная ошибка выборки составит:

Значение коэффициента доверия t=3 взято из таблицы в зависимости от заданной вероятности равной 0,99.

Относительная ошибка выборки:

Интервал, в котором находится генеральная средняя:

Определяется объем выборки при заданном β=4%.

при β=4% необходимо взять в выборку 527 разговоров.

Пример 2. На предприятии работает 1250 человек, проведено бесповторное выборочное наблюдение и отобрано 280 человек, из них 105 человек прошли техническое обучение. Определить долю работников, прошедших техническое обучение при вероятности 0,995. Выборка бесповторная.

Доля работников, прошедших обучение в выборке:

Интервал, в котором находится генеральная доля:

36,6

Относительная ошибка выборки составит:

Механический способ отбора отличается от собственно-случайного тем, что исследуемые единицы сначала систематизируются, а потом отбираются или каждая пятая, или десятая единица в группе. Механический способ бывает только бесповторный, а формулы определения ошибки выборки аналогичны собственно-случайному способу.

Серийный способ отбора является групповым способом. Отбор производится случайно, целыми группами или сериями. В отобранных сериях обследованию подвергаются все единицы.

Ошибки средней величины при серийном способе определяются по формулам:

— при повторном способе:

— при бесповторном способе:

где s – количество серий в выборочной совокупности;

S – количество серий в генеральной совокупности.

Типический способпредполагает, что вначале вся совокупность разбивается на группы по определенному признаку, а затем в каждой группе в случайном порядке отбираются отдельные единицы.

Формула для определения ошибки выборки при этом способе следующая:

где средняя из групповых дисперсий.

Малой выборкойсчитается такая выборка, в которой количество отобранных единиц не превышает 20. Ошибка в малой выборке (Δ * ) определяется по формуле:

где — коэффициент доверия, который находится по таблице

Стьюдента в зависимости от заданной вероятности и объема

Вопросы для самопроверки

1. Какие существуют способы проведения выборочного наблюдения?

2. Какие факторы влияют на величину ошибки выборки?

3. Каким образом переносятся результаты выборочного наблюдения на генеральную совокупность?

4. Что показывает относительная ошибка выборки?

5. Каким образом находится необходимый объем выборки?

6. Чем отличается расчет ошибки в малой выборке от расчета ошибки, которая находится в большой выборке?

7. С точки зрения достоверности, какая выборка предпочтительнее: бесповторная или повторная?

Тест для самопроверки к теме 8 «Выборочное наблюдение»

1. При определении ошибки выборки откуда берется коэффициент доверия:

1. определяется по формуле

2. определяется по графику

3. находится по специальным таблицам

2. Какая ошибка выборочного наблюдения характеризует величину погрешности:

3. Имеются несколько формул для определения ошибки доли единиц, которые обладают данным признаком. Выбрать правильную формулу (выборка бесповторная):

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: Как то на паре, один преподаватель сказал, когда лекция заканчивалась — это был конец пары: «Что-то тут концом пахнет». 8835 — | 8363 — или читать все.

Средняя и предельная ошибки выборки

Основное преимущество выборочного наблюдения среди прочих других — возможность рассчитать случайную ошибку выборки.

Ошибки выборки бывают систематические и случайные.

Систематические— в том случае, когда нарушен основной принцип выборки — случайности. Случайные— возникают обычно ввиду того, что структура выборочной совокупности все­гда отличается от структуры генеральной совокупности, как бы правильно ни был произведен отбор, то есть, несмотря на принцип случайности отбора единиц совокупности, все же имеются расхо­ждения между характеристиками выборочной и генеральной сово­купности. Изучение и измерение случайных ошибок репрезента­тивности и является основной задачей выборочного метода.

Как правило, чаще всего рассчитывают ошибку средней и ошиб­ку доли. При расчетах используются следующие условные обо­значения:

— средняя, рассчитанная в пределах генеральной совокупности;

— средняя, рассчитанная в пределах выборочной совокупно­сти;

р — доля данной группы в генеральной совокупности;

w — доля данной группы в выборочной совокупности.

Используя условные обозначения, ошибки выборки для средней и для доли можно записать следующим образом:

Выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать любые значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок μ.

В отличие от систематической, случайную ошибку можно опре­делить заранее, до проведения выборки, согласно предельных теорем, рассматриваемых в математической статистике.

Средняя ошибка определяется с вероятностью 0,683. В случае другой вероятности говорят о предельной ошибке.

Средняя ошибка выборки для средней и для доли определяется следующим образом:

В этих формулах дисперсия признака является характеристикой генеральной совокупности, которые при выборочном наблюдении неизвестны. На практике их заменяют аналогичными xapaктеристиками выборочной совокупности на основании закона больших чисел, по которому выборочная совокупность большом объеме точно воспроизводит характеристики генеральной совокупности.

Формулы определения средней ошибки для различных способ отбора:

Способ отбораПовторныйБесповторный
ошибка среднейошибка долиошибка среднейошибка доли
Собственно-случайный и механиче­ский
Типический
Серийный

μ — средняя ошибка;

п — численность выборки;

N — численность генеральной совокупности;

— общая дисперсия;

w — доля данной категории в общей численности выборки:

— средняя из внутригрупповых дисперсии;

Δ 2 — межгрупповая дисперсия;

r — число серий в выборке;

R — общее число серий.

Предельная ошибкадля всех способов отбора связана со сред­ней ошибкой выборки следующим образом:

где t — коэффициент доверия, функционально связанный с веро­ятностью, с которой обеспечивается величина предельной ошиб­ки. В зависимости от вероятности коэффициент доверия t принимает следующие значения:

tP
0,683
1,50,866
2,00,954
2,50,988
3,00,997
4,00,9999

Например, вероятность ошибки равна 0,683. Это значит, что генеральная средняя отличается от выборочной средней по абсолютной величине не более чем на величину μ с вероятностью 0,683, то если — выборочная средняя, — генеральная средняя, то с вероятностью 0,683.

Если мы хотим обеспечить большую вероятность выводов, тем самым мы увеличиваем границы случайной ошибки.

Таким образом, величина предельной ошибки зависит от сле­дующих величин:

— колеблемости признака (прямая связь), которую характеризует величина дисперсии;

— численности выборки (обратная связь);

— доверительной вероятности (прямая связь);

Пример расчета ошибки средней и ошибки доли.

Для определения среднего числа детей в семье методом случайной бесповторной выборки из 1000 семей отобраны 100. Результаты приведены в таблице:

Число детей, чел.Число семей
Итого

с вероятностью 0,997 предельную ошибку выборки и границы, в которых находится средне число детей в семье;

с вероятностью 0,954 границы, в которых находится удельный вес семей с двумя детьми.

1. Определим предельную ошибку средней с вероятностью 0,977. Для упрощения расчетов воспользуемся способом моментов:

p = 0,997 t = 3

средняя ошибка средней, 0,116 — предельная ошибка

2,12 – 0,116 ≤ ≤ 2,12+ 0,116

2,004 ≤ ≤ 2,236

Следовательно, с вероятностью 0,997 среднее число детей в семье в генеральной совокупности, то есть среди 1000 семей, находится в интервале 2,004 — 2,236.

2. Определим предельную ошибку доли с вероятностью 0,954.

p = 0,954 t = 2

29 — 8,6 ≤ d ≤ 29 +8,6

20,4% 2 = 0,2, а общая численность рабочих 10000 чел. Р = 0,954,значит t = 2

.

Читать еще:  Ошибка сертификата что делать
Ссылка на основную публикацию
Adblock
detector