Предельная ошибка выборки равна
Средние и предельные ошибки выборочного наблюдения
Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки, которые свойственны только выборочным наблюдениям. Данные показатели отражают разность между выборочными и соответствующими генеральными показателями.
Средняя ошибкавыборки определяется прежде всего объемом выборки и зависит от структуры и степени варьирования изучаемого признака.
Смысл средней ошибки выборки заключается в следующем. Рассчитанные значения выборочной доли (w) и выборочной средней ( )по своей природе случайные величины. Они могут принимать различные значения в зависимости от того, какие конкретные единицы генеральной совокупности попадут в выборку. Например, если при определении среднего возраста работников предприятия в одну выборку включить больше молодежи, а в другую — работников старшего возраста, то выборочные средние и ошибки выборки будут разными. Средняя ошибка выборки определяется по формуле:
(27) или
— повторная выборка. (28)
Где: μ – средняя ошибка выборки;
σ – среднее квадратическое отклонение признака в генеральной совокупности;
n – объем выборки.
Величина ошибки μ показывает, насколько среднее значение признака, установленное по выборке, отличается от истинного значения признака в генеральной совокупности.
Из формулы следует, что ошибка выборки прямо пропорциональна среднему квадратическому отклонению и обратно пропорциональна корню квадратному из числа единиц, попавших в выборку. Это означает, например, что чем больше разброс значений признака в генеральной совокупности, то есть чем больше дисперсия, тем больше должен быть объем выборки, если мы хотим доверять результатам выборочного обследования. И, наоборот, при малой дисперсии можно ограничиться небольшим числом выборочной совокупности. Ошибка выборки при этом будет находиться в приемлемых пределах.
Поскольку при бесповторном отборе численность генеральной совокупности N в ходе выборки сокращается, то в формулу для расчета средней ошибки выборки включают дополнительный множитель
(1-
). Формула средней ошибки выборки принимает следующий вид:
. (29)
Средняя ошибка меньше у бесповторной выборки, что и обусловливает ее более широкое применение.
Для практических выводов нужна характеристика генеральной совокупности на основе выборочных результатов. Выборочные средние и доли распространяются на генеральную совокупность с учетом предела их возможной ошибки, причем с гарантирующим ее уровнем вероятности. Задавшись конкретным уровнем вероятности, выбирают величину нормированного отклонения и определяют предельную ошибку выборки.
Надежностью (доверительной вероятностью) оценки Х по Х* называют вероятность γ, с которой осуществляется неравенство
Обобщенные формулы по теме «Выборочное наблюдение»
Повторный отбор | Бесповторный отбор | |
Средняя ошибка выборочной средней | ![]() | ![]() |
Средняя ошибка выборочной доли | ![]() | ![]() |
Предельная ошибка выборочной средней | ![]() | ![]() |
Предельная ошибка выборочной доли | ![]() | ![]() |
Пример 1: производится выборочная 5%-ная обработка данных об успеваемости студентов 5-го курса дневного отделения ВУЗа одного из факультетов по результатам зимней сессии:
Баллы успеваемости | Всего |
Число студентов |
Принимая во внимание, что отбор был случайным и бесповторным, определите с вероятностью 0,954 по факультету в целом:
1) пределы, в которых находится средний балл успеваемости в целом по факультету;
2) пределы, в которых находится доля студентов, сдавших экзамены на «хорошо» и «отлично».
Решение:
1) Среднее значение признака в генеральной совокупности находится в интервале: Х* — δ ≤ ≤ Х* + δ.
По формуле средней арифметической взвешенной найдем средний балл успеваемости. = 3,75 балла.
Предельную ошибку выборки определим по формуле для бесповторного отбора:
или δ = t *
= 2 *
= 0,122.
Соответственно, средний балл успеваемости в целом по факультету находится в пределах ±0,122 балла:
3,75 – 0,122 ≤ ≤ 3,75 + 0,122.
С вероятностью 0,954 можно утверждать, что средний балл успеваемости в целом по факультету составляет от 3,628 до 3, 872 балла.
2) доверительные интервалы или пределы доли студентов, сдавших экзамены на «хорошо» и «отлично», представляют собой:
По итогам выборки определяем долю студентов, сдавших экзамены на «хорошо» и «отлично»:
ω = 90 + 40 = 0,65 или 65 %.
Средняя ошибка доли:
=
балла.
Предельная ошибка доли:
t*μ = 2 * 0,033 ≈ 0,066 или 6,6 %.
Таким образом, доля студентов, сдавших экзамены на «хорошо» и «отлично», в генеральной совокупности находится в пределах ω±6,6%:
65 % — 6,6 % ≤ р ≤ 65 % + 6,6 %.
С вероятностью 0,954 можно гарантировать, что доля студентов, сдавших экзамены на «хорошо» и «отлично», составляет от 58,4 до 71,6 % общего числа студентов факультета.
Не нашли то, что искали? Воспользуйтесь поиском:
Лучшие изречения: Как то на паре, один преподаватель сказал, когда лекция заканчивалась — это был конец пары: «Что-то тут концом пахнет». 8835 — | 8363 —
или читать все.
Предельная ошибка выборки
Онлайн школа английского языка нового поколения. Более 7 лет предоставляет обучение английскому языку по Skype (Скайп) и является лидером данного направления! Основные преимущества:
- Вводный урок бесплатно; Большое число опытных преподавателей (нейтивов и русскоязычных); Курсы НЕ на определенный срок (месяц, полгода, год), а на конкретное количество занятий (5, 10, 20, 50); Более 10 000 довольных клиентов. Стоимость одного занятия с русскоязычным преподавателем — от 600 рублей, с носителем языка — от 1500 рублей
Учитывая, что на основе выборочного обследования нельзя точно оценить изучаемый параметр (например, среднее значение) генеральной совокупности, необходимо найти пределы, в которых он находится. В конкретной выборке разность может быть больше, меньше или равна
. Каждое из отклонений
от
имеет определенную вероятность. При выборочном обследовании реальное значение
в генеральной совокупности неизвестно. Зная среднюю ошибку выборки, с определенной вероятностью можно оценить отклонение выборочной средней от генеральной и установить пределы, в которых находится изучаемый параметр (в данном случае среднее значение) в генеральной совокупности. Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки
. Она определяется в долях средней ошибки с заданной вероятностью, т.е.
= t
, (1.38)
где t – коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.
Вероятность появления определенной ошибки выборки находят с помощью теорем теории вероятностей. Согласно теореме П. Л. Чебышёва, при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности вероятность того, что разность между выборочной средней и генеральной средней будет сколь угодно мала, близка к единице:
при
.
А. М. Ляпунов доказал, что независимо от характера распределения генеральной совокупности при увеличении объема выборки распределение вероятностей появления того или иного значения выборочной средней приближается к нормальному распределению. Это так называемая центральная предельная теорема. Следовательно, вероятность отклонения выборочной средней от генеральной средней, т.е. вероятность появления заданной предельной ошибки, также подчиняется указанному закону и может быть найдена как функция от t с помощью интеграла вероятностей Лапласа:
,
где – нормированное отклонение выборочной средней от генеральной средней.
Значения интеграла Лапласа для разных t рассчитаны и имеются в специальных таблицах, из которых в статистике широко применяется сочетание:
Средняя и предельная ошибки выборки
Основное преимущество выборочного наблюдения среди прочих других — возможность рассчитать случайную ошибку выборки.
Ошибки выборки бывают систематические и случайные.
Систематические— в том случае, когда нарушен основной принцип выборки — случайности. Случайные— возникают обычно ввиду того, что структура выборочной совокупности всегда отличается от структуры генеральной совокупности, как бы правильно ни был произведен отбор, то есть, несмотря на принцип случайности отбора единиц совокупности, все же имеются расхождения между характеристиками выборочной и генеральной совокупности. Изучение и измерение случайных ошибок репрезентативности и является основной задачей выборочного метода.
Как правило, чаще всего рассчитывают ошибку средней и ошибку доли. При расчетах используются следующие условные обозначения:
— средняя, рассчитанная в пределах генеральной совокупности;
— средняя, рассчитанная в пределах выборочной совокупности;
р — доля данной группы в генеральной совокупности;
w — доля данной группы в выборочной совокупности.
Используя условные обозначения, ошибки выборки для средней и для доли можно записать следующим образом:
Выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать любые значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок μ.
В отличие от систематической, случайную ошибку можно определить заранее, до проведения выборки, согласно предельных теорем, рассматриваемых в математической статистике.
Средняя ошибка определяется с вероятностью 0,683. В случае другой вероятности говорят о предельной ошибке.
Средняя ошибка выборки для средней и для доли определяется следующим образом:
В этих формулах дисперсия признака является характеристикой генеральной совокупности, которые при выборочном наблюдении неизвестны. На практике их заменяют аналогичными xapaктеристиками выборочной совокупности на основании закона больших чисел, по которому выборочная совокупность большом объеме точно воспроизводит характеристики генеральной совокупности.
Формулы определения средней ошибки для различных способ отбора:
Способ отбора | Повторный | Бесповторный | ||
ошибка средней | ошибка доли | ошибка средней | ошибка доли | |
Собственно-случайный и механический | ![]() | ![]() | ![]() | ![]() |
Типический | ![]() | ![]() | ![]() | ![]() |
Серийный | ![]() | ![]() | ![]() | ![]() |
μ — средняя ошибка;
п — численность выборки;
N — численность генеральной совокупности;
— общая дисперсия;
w — доля данной категории в общей численности выборки:
— средняя из внутригрупповых дисперсии;
Δ 2 — межгрупповая дисперсия;
r — число серий в выборке;
R — общее число серий.
Предельная ошибкадля всех способов отбора связана со средней ошибкой выборки следующим образом:
где t — коэффициент доверия, функционально связанный с вероятностью, с которой обеспечивается величина предельной ошибки. В зависимости от вероятности коэффициент доверия t принимает следующие значения:
t | P |
0,683 | |
1,5 | 0,866 |
2,0 | 0,954 |
2,5 | 0,988 |
3,0 | 0,997 |
4,0 | 0,9999 |
Например, вероятность ошибки равна 0,683. Это значит, что генеральная средняя отличается от выборочной средней по абсолютной величине не более чем на величину μ с вероятностью 0,683, то если — выборочная средняя,
— генеральная средняя, то
с вероятностью 0,683.
Если мы хотим обеспечить большую вероятность выводов, тем самым мы увеличиваем границы случайной ошибки.
Таким образом, величина предельной ошибки зависит от следующих величин:
— колеблемости признака (прямая связь), которую характеризует величина дисперсии;
— численности выборки (обратная связь);
— доверительной вероятности (прямая связь);
Пример расчета ошибки средней и ошибки доли.
Для определения среднего числа детей в семье методом случайной бесповторной выборки из 1000 семей отобраны 100. Результаты приведены в таблице:
Число детей, чел. | Число семей |
Итого |
— с вероятностью 0,997 предельную ошибку выборки и границы, в которых находится средне число детей в семье;
— с вероятностью 0,954 границы, в которых находится удельный вес семей с двумя детьми.
1. Определим предельную ошибку средней с вероятностью 0,977. Для упрощения расчетов воспользуемся способом моментов:
p = 0,997 t = 3
средняя ошибка средней, 0,116 — предельная ошибка
2,12 – 0,116 ≤ ≤ 2,12+ 0,116
2,004 ≤ ≤ 2,236
Следовательно, с вероятностью 0,997 среднее число детей в семье в генеральной совокупности, то есть среди 1000 семей, находится в интервале 2,004 — 2,236.
2. Определим предельную ошибку доли с вероятностью 0,954.
p = 0,954 t = 2
29 — 8,6 ≤ d ≤ 29 +8,6
20,4% 2 = 0,2, а общая численность рабочих 10000 чел. Р = 0,954,значит t = 2
.
Выборочное наблюдение: понятие, виды, ошибки выборки, оценка результатов. Примеры решения задач
Как известно, в статистике существует два способа наблюдения массовых явлений в зависимости от полноты охвата объекта: сплошное и несплошное. Разновидностью несплошного наблюдения является выборочное наблюдение.
Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным образом.
Выборочное наблюдение ставит перед собой задачу – по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.
Совокупность отобранных для обследования единиц в статистике принято называть выборочной совокупностью, а совокупность единиц, из которых производится отбор, называют генеральной совокупностью. Основные характеристики генеральной и выборочной совокупности представлены в таблице 1.
Показатель | Обозначение или формула | |
---|---|---|
Генеральная совокупность | Выборочная совокупность | |
Число единиц | N | n |
Число единиц, обладающих каким-либо признаком | M | m |
Доля единиц, обладающих этим признаком | p = M/N | ω = m/n |
Доля единиц, не обладающих этим признаком | q = 1 — p | 1 — ω |
Средняя величина признака | ![]() | ![]() |
Дисперсия признака | ![]() | ![]() |
Дисперсия альтернативного признака (дисперсия доли) | pq | ω (1 — ω ) |
При проведении выборочного наблюдения возникают систематические и случайные ошибки. Систематические ошибки возникают в силу нарушения правил отбора единиц в выборку. Изменив правила отбора, от таких ошибок можно избавиться.
Случайные ошибки возникают в силу несплошного характера обследования. Иначе их называют ошибками репрезентативности (представительности). Случайные ошибки разделяют на средние и предельные ошибки выборки, которые определяются как при расчете признака, так и при расчете доли.
Средние и предельные ошибки связаны следующим соотношением: Δ = tμ, где Δ — предельная ошибка выборки, μ — средняя ошибка выборки, t — коэффициент доверия, определяемый в зависимости от уровня вероятности. В таблице 2 приведены некоторые значения t, взятые из теории вероятностей.
Вероятность, Р | 0,683 | 0,866 | 0,954 | 0,988 | 0,997 | 0,999 |
---|---|---|---|---|---|---|
Значение t | 1,0 | 1,5 | 2,0 | 2,5 | 3,0 | 3,5 |
Величина средней ошибки выборки рассчитывается дифференцированно в зависимости от способа отбора и процедуры выборки. Основные формулы для расчета ошибок выборки представлены в таблице 3.
Показатель | Обозначение и формула | |
---|---|---|
Генеральная совокупность | Выборочная совокупность | |
Средняя ошибка признака при случайном повторном отборе | ![]() | ![]() |
Средняя ошибка доли при случайном повторном отборе | ![]() | ![]() |
Предельная ошибка признака при случайном повторном отборе | ![]() | ![]() |
Предельная ошибка доли при случайном повторном отборе | ![]() | ![]() |
Средняя ошибка признака при случайном бесповторном отборе | ![]() | ![]() |
Средняя ошибка доли при случайном бесповторном отборе | ![]() | ![]() |
Предельная ошибка признака при случайном бесповторном отборе | ![]() | ![]() |
Предельная ошибка доли при случайном бесповторном отборе | ![]() | ![]() |
Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности.
![]() |
Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:
![]() |
— пределы доли признака в генеральной совокупности р.
Примеры решения задач по теме «Выборочное наблюдение в статистике»
Задача 1. Имеется информация о выпуске продукции (работ, услуг), полученной на основе 10% выборочного наблюдения по предприятиям области:
![]() |
Определить: 1) по предприятиям, включенным в выборку: а) средний размер произведенной продукции на одно предприятие; б) дисперсию объема производства; в) долю предприятий с объемом производства продукции более 400 тыс. руб.; 2) в целом по области с вероятностью 0,954 пределы, в которых можно ожидать: а) средний объем производства продукции на одно предприятие; б) долю предприятий с объемом производства продукции более 400 тыс. руб.; 3) общий объем выпуска продукции по области.
Решение
Для решения задачи расширим предложенную таблицу.
![]() |
1) По предприятиям, включенным в выборку, средний размер произведенной продукции на одно предприятие
![]() |
= 110800/400 = 277 тыс. руб.
Дисперсию объема производства вычислим упрощенным способом σ 2 = 35640000/400 – 277 2 = 89100 — 76229 = 12371.
Число предприятий, объем производства продукции которых превышает 400 тыс. руб. равно 36+12 = 48, а их доля равна ω = 48:400 = 0,12 = 12%.
2) Из теории вероятности известно, что при вероятности Р=0,954 коэффициент доверия t=2. Предельная ошибка выборки
![]() |
= 2√12371:400 = 11,12 тыс. руб.
Установим границы генеральной средней: 277-11,12 ≤Хср≤ 277+11,12; 265,88 ≤Хср≤ 288,12
Предельная ошибка выборки доли предприятий
![]() |
Определим границы генеральной доли: 0,12-0,03≤ р ≤0,12+0,03; 0,09≤ р ≤0,15
3) Поскольку рассматриваемая группа предприятий составляет 10% от общего числа предприятий области, то в целом по области насчитывается 4000 предприятий. Тогда общий объем выпуска продукции по области лежит в пределах 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480
Задача 2. По результатам контрольной проверки налоговыми службами 400 бизнес-структур, у 140 из них в налоговых декларациях не полностью указаны доходы, подлежащие налогообложению. Определите в генеральной совокупности (по всему району) долю бизнес-структур, скрывших часть доходов от уплаты налогов, с вероятностью 0,954.
Решение
По условию задачи число единиц в выборочной совокупности n=400, число единиц, обладающих рассматриваемым признаком m=140, вероятность Р=0,954.
Из теории вероятностей известно, что при вероятности Р=0,954 коэффициент доверия t=2.
Долю единиц, обладающих указанным признаком, определим по формуле: p=w+∆p, где w = m/n=140/400=0,35=35%,
а предельную ошибку признака ∆p получим из формулы: ∆p= t √w(1-w)/n = 2√0,35×0,65/400 ≈ 0,5 = 5%
Ответ: Доля бизнес-структур, скрывших часть доходов от уплаты налогов с вероятностью 0,954 равна 35±5%.
Другие статьи по данной теме:
- назад:Показатели вариации: понятие, виды, формулы для вычислений
- далее:Ряды динамики: понятие и классификация. Показатели уровней ряда динамики. Примеры решения задач
Список использованных источников
- Белобородова С.С. и др. Теория статистики: Типовые задачи с контрольными заданиями. Екатеринбург: Изд-во Урал. гос. экон. ун-та, 2001;
- Минашкин В.Г. и др. Курс лекций по теории статистики. / Московский международный институт эконометрики, информатики, финансов и права. — М., 2003;
- Сизова Т.М. Статистика: Учебное пособие. – СПб.: СПб ГУИТМО, 2005;
- Фёдорова Л.Н., Фёдорова А.Е. Методические указания по написанию контрольной работы по курсу «Статистика» для студентов экономических специальностей: УрГЭУ, 2007;
2012 © Лана Забродская. При копировании материалов сайта ссылка на источник обязательна
detector