Progress-servis55.ru

Новости из мира ПК
1 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Определить среднюю ошибку выборки

Выборочное наблюдение: понятие, виды, ошибки выборки, оценка результатов. Примеры решения задач

Как известно, в статистике существует два способа наблюдения массовых явлений в зависимости от полноты охвата объекта: сплошное и несплошное. Разновидностью несплошного наблюдения является выборочное наблюдение.

Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным образом.

Выборочное наблюдение ставит перед собой задачу – по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.

Совокупность отобранных для обследования единиц в статистике принято называть выборочной совокупностью, а совокупность единиц, из которых производится отбор, называют генеральной совокупностью. Основные характеристики генеральной и выборочной совокупности представлены в таблице 1.

Таблица 1 — Основные характеристики генеральной и выборочной совокупности

ПоказательОбозначение или формула
Генеральная совокупностьВыборочная совокупность
Число единицNn
Число единиц, обладающих каким-либо признакомMm
Доля единиц, обладающих этим признакомp = M/Nω = m/n
Доля единиц, не обладающих этим признакомq = 1 — p1 — ω
Средняя величина признака
Дисперсия признака
Дисперсия альтернативного признака (дисперсия доли)pqω (1 — ω )

При проведении выборочного наблюдения возникают систематические и случайные ошибки. Систематические ошибки возникают в силу нарушения правил отбора единиц в выборку. Изменив правила отбора, от таких ошибок можно избавиться.

Случайные ошибки возникают в силу несплошного характера обследования. Иначе их называют ошибками репрезентативности (представительности). Случайные ошибки разделяют на средние и предельные ошибки выборки, которые определяются как при расчете признака, так и при расчете доли.

Средние и предельные ошибки связаны следующим соотношением: Δ = tμ, где Δ — предельная ошибка выборки, μ — средняя ошибка выборки, t — коэффициент доверия, определяемый в зависимости от уровня вероятности. В таблице 2 приведены некоторые значения t, взятые из теории вероятностей.

Таблица 2 — Соответствие некоторых значений вероятностей коэффициенту доверия

Вероятность, Р0,6830,8660,9540,9880,9970,999
Значение t1,01,52,02,53,03,5

Величина средней ошибки выборки рассчитывается дифференцированно в зависимости от способа отбора и процедуры выборки. Основные формулы для расчета ошибок выборки представлены в таблице 3.

Таблица 3 — Основные формулы для расчета ошибок выборки при повторном и бесповторном отборе

ПоказательОбозначение и формула
Генеральная совокупностьВыборочная совокупность
Средняя ошибка признака при случайном повторном отборе
Средняя ошибка доли при случайном повторном отборе
Предельная ошибка признака при случайном повторном отборе
Предельная ошибка доли при случайном повторном отборе
Средняя ошибка признака при случайном бесповторном отборе
Средняя ошибка доли при случайном бесповторном отборе
Предельная ошибка признака при случайном бесповторном отборе
Предельная ошибка доли при случайном бесповторном отборе

Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности.

Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:

— пределы доли признака в генеральной совокупности р.

Примеры решения задач по теме «Выборочное наблюдение в статистике»

Задача 1. Имеется информация о выпуске продукции (работ, услуг), полученной на основе 10% выборочного наблюдения по предприятиям области:

Определить: 1) по предприятиям, включенным в выборку: а) средний размер произведенной продукции на одно предприятие; б) дисперсию объема производства; в) долю предприятий с объемом производства продукции более 400 тыс. руб.; 2) в целом по области с вероятностью 0,954 пределы, в которых можно ожидать: а) средний объем производства продукции на одно предприятие; б) долю предприятий с объемом производства продукции более 400 тыс. руб.; 3) общий объем выпуска продукции по области.

Решение

Для решения задачи расширим предложенную таблицу.

1) По предприятиям, включенным в выборку, средний размер произведенной продукции на одно предприятие

= 110800/400 = 277 тыс. руб.

Дисперсию объема производства вычислим упрощенным способом σ 2 = 35640000/400 – 277 2 = 89100 — 76229 = 12371.

Число предприятий, объем производства продукции которых превышает 400 тыс. руб. равно 36+12 = 48, а их доля равна ω = 48:400 = 0,12 = 12%.

2) Из теории вероятности известно, что при вероятности Р=0,954 коэффициент доверия t=2. Предельная ошибка выборки

= 2√12371:400 = 11,12 тыс. руб.

Установим границы генеральной средней: 277-11,12 ≤Хср≤ 277+11,12; 265,88 ≤Хср≤ 288,12

Предельная ошибка выборки доли предприятий

Определим границы генеральной доли: 0,12-0,03≤ р ≤0,12+0,03; 0,09≤ р ≤0,15

3) Поскольку рассматриваемая группа предприятий составляет 10% от общего числа предприятий области, то в целом по области насчитывается 4000 предприятий. Тогда общий объем выпуска продукции по области лежит в пределах 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

Задача 2. По результатам контрольной проверки налоговыми службами 400 бизнес-структур, у 140 из них в налоговых декларациях не полностью указаны доходы, подлежащие налогообложению. Определите в генеральной совокупности (по всему району) долю бизнес-структур, скрывших часть доходов от уплаты налогов, с вероятностью 0,954.

Решение

По условию задачи число единиц в выборочной совокупности n=400, число единиц, обладающих рассматриваемым признаком m=140, вероятность Р=0,954.

Из теории вероятностей известно, что при вероятности Р=0,954 коэффициент доверия t=2.

Долю единиц, обладающих указанным признаком, определим по формуле: p=w+∆p, где w = m/n=140/400=0,35=35%,
а предельную ошибку признака ∆p получим из формулы: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5%

Ответ: Доля бизнес-структур, скрывших часть доходов от уплаты налогов с вероятностью 0,954 равна 35±5%.

Другие статьи по данной теме:

  • назад:Показатели вариации: понятие, виды, формулы для вычислений
  • далее:Ряды динамики: понятие и классификация. Показатели уровней ряда динамики. Примеры решения задач

Список использованных источников

  1. Белобородова С.С. и др. Теория статистики: Типовые задачи с контрольными заданиями. Екатеринбург: Изд-во Урал. гос. экон. ун-та, 2001;
  2. Минашкин В.Г. и др. Курс лекций по теории статистики. / Московский международный институт эконометрики, информатики, финансов и права. — М., 2003;
  3. Сизова Т.М. Статистика: Учебное пособие. – СПб.: СПб ГУИТМО, 2005;
  4. Фёдорова Л.Н., Фёдорова А.Е. Методические указания по написанию контрольной работы по курсу «Статистика» для студентов экономических специальностей: УрГЭУ, 2007;

2012 © Лана Забродская. При копировании материалов сайта ссылка на источник обязательна

Определение ошибки выборки при различных способах отбора

При решении задач выборочного наблюдения обязательным этапом является определение ошибки выборки. Формулы для ее определения разработаны теорией вероятности и математической статистикой.

При собственно-случайном способе отбора обследованию подвергаются единицы совокупности без предварительного систематизирования.

Средняя ошибка выборки для среднего размера признака определяется по формулам 8.1 и 8.2.

При повторном способе:

При бесповторном способе:

где — дисперсия;

n – объем выборочной совокупности;

N – объем генеральной совокупности.

Предельная (абсолютная ошибка выборки) находится по формуле:

, (8.3)

где t – коэффициент доверия, который определяется по таблице

значений функции Лапласа при заданной

Относительная ошибка выборки определятся с использованием формулы:

где — среднее значение признака в выборочной совокупности.

Считается, что если β превышает 12%, то погрешность высокая и необходимо увеличить объем выборки.

Зная величину выборочной средней и предельную ошибку выборки, определяется доверительный интервал, в котором находится значение генеральной средней:

+ , (8.5)

где – средний размер признака в генеральной совокупности.

При проектировании выборочного наблюдения решается задача нахождения необходимой численности выборки, обеспечивающей определенную точность расчета оценок генеральной средней.

Сначала задается величина относительной ошибки выборки (β), затем определяется абсолютная ошибка (Δ) при заданном значении β:

Затем находится объем выборки при повторном способе:

При бесповторном способе объем выборки определяется:

При определении ошибки доли единиц, которые обладают определенным признаком, используется формула:

— при повторном способе:

— при бесповторном способе:

где w – доля единиц, обладающих каким-либо значением признака в

Значение генеральной доли (P) будет находиться в доверительном интервале:

Пример 1. Для определения средней продолжительности междугородних телефонных разговоров из 1300 предоставленных абонентам разговоров в случайном порядке было отобрано 316. Результаты этого наблюдения представлены в таблице 8.1.

Продолжительность междугородних телефонных разговоров, мин.Количество разговоров
До 3 3-5 5-7 7-9 9-11 11-13 13-15
Итого

По данным ряда распределения определить:

— среднюю протяженность разговоров;

— ошибку средней при вероятности 0,99;

— объем выборки при заданном значении β=4%.

Способ отбора бесповторный.

По средней арифметической взвешенной определено, что средняя продолжительность разговоров составляет 6,7 мин., а дисперсия 7,3 мин.

Абсолютная ошибка выборки составит:

Значение коэффициента доверия t=3 взято из таблицы в зависимости от заданной вероятности равной 0,99.

Относительная ошибка выборки:

Интервал, в котором находится генеральная средняя:

Определяется объем выборки при заданном β=4%.

при β=4% необходимо взять в выборку 527 разговоров.

Пример 2. На предприятии работает 1250 человек, проведено бесповторное выборочное наблюдение и отобрано 280 человек, из них 105 человек прошли техническое обучение. Определить долю работников, прошедших техническое обучение при вероятности 0,995. Выборка бесповторная.

Доля работников, прошедших обучение в выборке:

Интервал, в котором находится генеральная доля:

36,6

Относительная ошибка выборки составит:

Механический способ отбора отличается от собственно-случайного тем, что исследуемые единицы сначала систематизируются, а потом отбираются или каждая пятая, или десятая единица в группе. Механический способ бывает только бесповторный, а формулы определения ошибки выборки аналогичны собственно-случайному способу.

Серийный способ отбора является групповым способом. Отбор производится случайно, целыми группами или сериями. В отобранных сериях обследованию подвергаются все единицы.

Ошибки средней величины при серийном способе определяются по формулам:

— при повторном способе:

— при бесповторном способе:

где s – количество серий в выборочной совокупности;

S – количество серий в генеральной совокупности.

Типический способпредполагает, что вначале вся совокупность разбивается на группы по определенному признаку, а затем в каждой группе в случайном порядке отбираются отдельные единицы.

Формула для определения ошибки выборки при этом способе следующая:

где средняя из групповых дисперсий.

Малой выборкойсчитается такая выборка, в которой количество отобранных единиц не превышает 20. Ошибка в малой выборке (Δ * ) определяется по формуле:

где — коэффициент доверия, который находится по таблице

Стьюдента в зависимости от заданной вероятности и объема

Вопросы для самопроверки

1. Какие существуют способы проведения выборочного наблюдения?

2. Какие факторы влияют на величину ошибки выборки?

3. Каким образом переносятся результаты выборочного наблюдения на генеральную совокупность?

4. Что показывает относительная ошибка выборки?

5. Каким образом находится необходимый объем выборки?

6. Чем отличается расчет ошибки в малой выборке от расчета ошибки, которая находится в большой выборке?

7. С точки зрения достоверности, какая выборка предпочтительнее: бесповторная или повторная?

Тест для самопроверки к теме 8 «Выборочное наблюдение»

1. При определении ошибки выборки откуда берется коэффициент доверия:

1. определяется по формуле

2. определяется по графику

3. находится по специальным таблицам

2. Какая ошибка выборочного наблюдения характеризует величину погрешности:

3. Имеются несколько формул для определения ошибки доли единиц, которые обладают данным признаком. Выбрать правильную формулу (выборка бесповторная):

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: Для студента самое главное не сдать экзамен, а вовремя вспомнить про него. 10618 — | 7808 — или читать все.

Средние ошибки повторной и бесповторной выборки

Средняя ошибка выборки

Средняя ошибка выборки представляет из себя такое расхождение между средними выборочной и генеральной совокупностями, которое не превышает ±б (дельта).

На основании теоремы Чебышева П. Л. величина средней ошибки при случайном повторном отборе в контрольных работах по статистике рассчитывается по формуле (для среднего количественного признака):

где числитель — дисперсия признака х в выборочной совокупности;
n — численность выборочной совокупности.

Для альтернативного признака формула средней ошибки выборки для доли по теореме Я. Бернулли рассчитывается по формуле:

где р(1- р) — дисперсия доли признака в генеральной совокупности;
n — объем выборки.

Вследствие, того что дисперсия признака в генеральной совокупности точно не известна, на практике используют значение дисперсии, которое рассчитано для выборочной совокупности на основании закона больших чисел. Согласно данному закону выборочная совокупность при большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.

Поэтому расчетные формулы средней ошибки при случайном повторном отборе будут выглядеть таким образом:

1. Для среднего количественного признака:

где S^2 — дисперсия признака х в выборочной совокупности;
n — объем выборки.

2. Для доли (альтернативного признака):

где w (1 — w) — дисперсия доли изучаемого признака в выборочной совокупности.

В теории вероятностей было показано, что генеральная дисперсия выражается через выборочную согласно формуле:

В случаях малой выборки, когда её объем меньше 30, необходимо учитывать коэффициент n/(n-1). Тогда среднюю ошибку малой выборки рассчитывают по формуле:

Так как в процессе бесповторной выборки сокращается численность единиц генеральной совокупности, то в представленных выше формулах расчета средних ошибок выборки нужно подкоренное выражение умножить на 1- (n/N).

Расчетные формулы для такого вида выборки будут выглядеть так:

1. Для средней количественного признака:

где N — объем генеральной совокупности; n — объем выборки.

2. Для доли (альтернативного признака):

где 1- (n/N) — доля единиц генеральной совокупности, не попавших в выборку.

Поскольку n всегда меньше N, то дополнительный множитель 1 — (n/N) всегда будет меньше единицы. Это означает, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. Когда доля единиц генеральной совокупности, которые не попали в выборку, существенная, то величина 1 — (n/N) близка к единице и тогда расчет средней ошибки производится по общей формуле.

Средняя ошибка зависит от следующих факторов:

1. При выполнении принципа случайного отбора средняя ошибка выборки определяется во-первых объемом выборки: чем больше численность, тем меньше величины средней ошибки выборки. Генеральная совокупность характеризуется точнее тогда, когда больше единиц данной совокупности охватывает выборочное наблюдение

2. Средняя ошибка также зависит от степени варьирования признака. Степень варьирования характеризуется дисперсией. Чем меньше вариация признака (дисперсия), тем меньше средняя ошибка выборки. При нулевой дисперсии (признак не варьируется) средняя ошибка выборки равна нулю, таким образом, любая единица генеральной совокупности будет характеризовать всю совокупность по этому признаку.

Ошибки выборки

Онлайн школа английского языка нового поколения. Более 7 лет предоставляет обучение английскому языку по Skype (Скайп) и является лидером данного направления! Основные преимущества:

    Вводный урок бесплатно; Большое число опытных преподавателей (нейтивов и русскоязычных); Курсы НЕ на определенный срок (месяц, полгода, год), а на конкретное количество занятий (5, 10, 20, 50); Более 10 000 довольных клиентов. Стоимость одного занятия с русскоязычным преподавателем — от 600 рублей, с носителем языка — от 1500 рублей

Чтобы оценить степень точности выборочного наблюдения, необходимо оценить величину ошибок, которые могут возникнуть в процессе проведения выборочного наблюдения.


Основное внимание уделяется случайным ошибкам репрезентативности.

Статистическое исследование может осуществляться по данным несплошного наблюдения, основная цель которого состоит в получении характеристик изучаемой совокупности по обследованной ее части. Одним из наиболее распространенных в статистике методов, применяющих несплошное наблюдение, является выборочный метод.

Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части на основе положений случайного отбора. При выборочном методе обследованию подвергается сравнительно небольшая часть всей изучаемой совокупности (обычно до 5 — 10%, реже до 15 — 25%). При этом подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью. Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или просто выборкой.

Значение выборочного метода состоит в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.

В проведении ряда исследований выборочный метод является единственно возможным, например, при контроле качества продукции (товара), если проверка сопровождается уничтожением или разложением на составные части обследуемых образцов (определение сахаристости фруктов, клейковины печеного хлеба, установление носкости обуви, прочности тканей на разрыв и т.д.).

Проведение исследования социально — экономических явлений выборочным методом складывается из ряда последовательных этапов:

1) обоснование (в соответствии с задачами исследования) целесообразности применения выборочного метода;

2) составление программы проведения статистического исследования выборочным методом;

3) решение организационных вопросов сбора и обработки исходной информации;

4) установление доли выборки, т.е. части подлежащих обследованию единиц генеральной совокупности;

5) обоснование способов формирования выборочной совокупности;

6) осуществление отбора единиц из генеральной совокупности для их обследования;

7) фиксация в отобранных единицах (пробах) изучаемых признаков;

8) статистическая обработка полученной в выборке информации с определением обобщающих характеристик изучаемых признаков;

9) определение количественной оценки ошибки выборки;

10) распространение обобщающих выборочных характеристик на генеральную совокупность.

В генеральной совокупности доля единиц, обладающих изучаемым признаком, называется генеральной долей (обозначается р), а средняя величина изучаемого варьирующего признака — генеральной средней (обозначается ).

В выборочной совокупности долю изучаемого признака называют выборочной долей, или частостью (обозначается ), а среднюю величину в выборке — выборочной средней (обозначается ).

При контрольной проверке качества хлебобулочных изделий проведено 5%-ное выборочное обследование партии нарезных батонов из муки высшего сорта. При этом из 100 отобранных в выборку батонов 90 шт. соответствовали требованиям стандарта. Средний вес одного батона в выборке составлял 500,5 г при среднем квадратическом отклонении г.

На основе полученных в выборке данных нужно установить возможные значения доли стандартных изделий и среднего веса одного изделия во всей партии.

Прежде всего устанавливаются характеристики выборочной совокупности. Выборочная доля, или частость, определяется из отношения единиц, обладающих изучаемым признаком m, к общей численности единиц выборочной совокупности n:

Поскольку из 100 изделий, попавших в выборку n, 90 ед. оказались стандартными m, то показатель частости равен: = 90_100=0,9.

Средний вес изделия в выборке х = 500,5 г определен взвешиванием. Но полученные показатели частости (0,9) и средней величины (500,5 г) характеризуют долю стандартной продукции и средний вес одного изделия лишь в выборке. Дляопределения соответствующих показателей для всей партии товара надо установить возможные при этом значения ошибки выборки.

Ошибка выборки — это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности. Она зависит от ряда факторов: степени вариации изучаемого признака, численности выборки, методом отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования.

Определение ошибки выборочной средней.

При случайном повторном отборе средняя ошибка выборочной средней рассчитывается по формуле:

,

где — средняя ошибка выборочной средней;

— дисперсия выборочной совокупности;

n — численность выборки.

При бесповторном отборе она рассчитывается по формуле:

,

где N — численность генеральной совокупности.

Определение ошибки выборочной доли.

При повторном отборе средняя ошибка выборочной доли рассчитывается по формуле:

,

где — выборочная доля единиц, обладающих изучаемым признаком;

— число единиц, обладающих изучаемым признаком;

— численность выборки.

При бесповторном способе отбора средняя ошибка выборочной доли определяется по формулам:

Предельная ошибка выборки связана со средней ошибкой выборки отношением:

.

При этом t как коэффициент кратности средней ошибки выборки зависит от значения вероятности Р, с которой гарантируется величина предельной ошибки выборки.

Предельная ошибка выборки при бесповторном отборе определяется по следующим формулам:

,

.

Предельная ошибка выборки при повторном отборе определяется по формуле:

,

.

Читать еще:  Ошибка приложение гугл плей остановлено
Ссылка на основную публикацию
Adblock
detector