Progress-servis55.ru

Новости из мира ПК
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Исправленное среднее квадратическое отклонение

Выборочная дисперсия. Выборочное среднее квадратическое отклонение. Свойства

Выборочная дисперсия в математической статистике — это оценка теоретической дисперсии распределения, рассчитанная на основе данных выборки. Виды выборочных дисперсий:

-несмещённая или исправленная.

Пусть — выборка из распределения вероятности. Тогда

выборочная дисперсия — это случайная величина

,

где символ обозначает выборочное среднее;

несмещённая (исправленная) дисперсия — это случайная величина

.

Свойства выборочных дисперсий

Выборочная дисперсия является теоретической дисперсией выборочного распределения. Более точно, пусть — выборочная функция распределения данной выборки. Тогда для любого фиксированного функция является (неслучайной) функцией дискретного распределения. Дисперсия этого распределения равна .

Обе выборочные дисперсии являются состоятельными оценками теоретической дисперсии. Если , то

,

где символ « » обозначает сходимость по вероятности.

Выборочная дисперсия является смещённой оценкой теоретической дисперсии, а исправленная выборочная дисперсия — несмещённой:

,

.

Выборочная дисперсия нормального распределения имеет распределение хи-квадрат. Пусть . Тогда

Среднеквадратическое отклонение равно квадратному корню из дисперсии:
При определении среднего квадратического отклонения при достаточно большом объеме изучаемой совокупности (n > 30) применяются формулы:
– среднее квадратическое отклонение простое (или невзвешенное);
– среднее квадратическое отклонение взвешенное, где:
xi – значения изучаемого признака (варианты);
n – объем статистической совокупности;
– средняя арифметическая величина.

Исправленные» выборочная дисперсия и с.к.о. Свойства.

Несмещённая оце́нка(исправленная выб дисп) в математической статистике — это точечная оценка, математическое ожидание которой равно оцениваемому параметру.

Пусть — выборка из распределения, зависящего от параметра . Тогда оценка называется несмещённой, если

,

— математическое ожидание;

— квантор всеобщности.

В противном случае оценка называется смещённой, и случайная величина называется её смеще́нием.

исправленное среднее квадратичное отклонение .

Основные понятия интервального оценивания.

Задачей математической статистики является установление закономерностей, которым подчиняются массовые случайные явления. Для этого надо собрать статистические данные (получить репрезентативную выборку) и провести анализ полученных результатов в зависимости от целей исследования. Характеристики выборки позволяют, с определенной долей уверенности, получить представление об аналогичных характеристиках генеральной совокупности. Например, среднее выборочное позволяет оценить математическое ожидание генеральной совокупности, выборочная дисперсия, в определенной мере, характеризует генеральную дисперсию, показывающую разброс значений случайной величины относительно математического ожидания. То есть мы хотим по случайной выборке определить, какова генеральная совокупность. Понятно, что характеристики выборки зависят от ее состава, и каждая новая выборка дает разные значения для выборочного среднего и выборочной дисперсии. Можно предполагать, что выборочные характеристики не будут заметно отличаться от аналогичных характеристик генеральной совокупности, но, тем не менее, такие отличия существуют. Поэтому, получив значение выборочного параметра в виде отдельного числа (точечной оценки), мы вынуждены оценивать отклонение этой оценки от реального значения в генеральной совокупности. Следовательно, наряду с точечной оценкой, состоящей из одного числа, мы можем рассматривать интервальную оценку.

Интервальный метод оценивания параметров распределения случайных величин заключается в определении интервала (а не единичного значения), в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра. Интервальная оценка характеризуется двумя числами – концами интервала, внутри которого, предположительно, находится истинное значение параметра. Иначе говоря, вместо отдельной точки для оцениваемого параметра можно установить интервал значений, одна из точек которого является своего рода «лучшей» оценкой. Интервальные оценки являются более полными и надежными по сравнению с точечными, они применяются как для больших, так и для малых выборок. Совокупность методов определения промежутка, в котором лежит значение искомого параметра, получила название методов интервального оценивания.

Пусть – какая-либо характеристика генеральной совокупности. Как мы знаем, точное определение по данной выборке невозможно. Но можно указать такой интервал , что в него, с заданной достаточно высокой вероятностью, будет попадать неизвестное значение . При этом, чем меньше этот интервал, тем более точную оценку мы сможем получить.

Постановка задачи нахождения интервальной оценки параметров заключается в следующем. Имеется: выборка наблюдений (x1, x2, …, xn) за случайной величиной Х. Объем выборки n фиксирован. Необходимо с доверительной вероятностью g = 1– a определить интервал , , который накрывает истинное значение неизвестного скалярного параметра . Полученный интервал называется интервальной оценкой или доверительным интервалом.

Предполагается, что выборка представительная, ее объем достаточен для оценки границ интервала.

Дисперсия: генеральная, выборочная, исправленная

Генеральная дисперсия

Пусть нам дана генеральная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Генеральная совокупность — совокупность случайно отобранных объектов данного вида, над которыми проводят наблюдения с целью получения конкретных значений случайной величины, проводимых в неизменных условиях при изучении одной случайной величины данного вида.

Генеральная дисперсия — среднее арифметическое квадратов отклонений значений вариант генеральной совокупности от их среднего значения.

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда генеральная дисперсия вычисляется по формуле:

Читать еще:  Расширение флеш плеер для гугл хром

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае генеральная дисперсия вычисляется по формуле:

С этим понятием также связано понятие генерального среднего квадратического отклонения.

Попробуй обратиться за помощью к преподавателям

Генеральное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

Выборочная дисперсия

Пусть нам дана выборочная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Выборочная совокупность — часть отобранных объектов из генеральной совокупности.

Выборочная дисперсия — среднее арифметическое значений вариант выборочной совокупности.

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда выборочная дисперсия вычисляется по формуле:

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае выборочная дисперсия вычисляется по формуле:

Задай вопрос специалистам и получи
ответ уже через 15 минут!

С этим понятием также связано понятие выборочного среднего квадратического отклонения.

Выборочное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

Исправленная дисперсия

Для нахождения исправленной дисперсии $S^2$ необходимо умножить выборочную дисперсию на дробь $frac$, то есть

С этим понятием также связано понятие исправленного среднего квадратического отклонения, которое находится по формуле:

. В случае, когда значение вариант не являются дискретными, а представляют из себя интервалы, то в формулах для вычисления генеральной или выборочной дисперсий за значение $x_i$ принимается значение середины интервала, которому принадлежит $x_i.$

Пример задачи на нахождение дисперсии и среднего квадратического отклонения

Выборочная совокупность задана следующей таблицей распределения:

Найдем для нее выборочную дисперсию, выборочное среднее квадратическое отклонение, исправленную дисперсию и исправленное среднее квадратическое отклонение.

Для решения этой задачи для начала сделаем расчетную таблицу:

Величина $overline$ (среднее выборочное) в таблице находится по формуле:

Найдем выборочную дисперсию по формуле:

Выборочное среднее квадратическое отклонение:

Исправленное среднее квадратическое отклонение:

Так и не нашли ответ
на свой вопрос?

Просто напиши с чем тебе
нужна помощь

Исправленное среднее квадратическое отклонение

Виктор Цекунов

Навигация

Affiliations

Template tips

8.2. Математическая статистика

Репетитор по математике, физике (Минск): Виктор Иванович.

Высшая математика и физика для студентов. Профессиональный репетитор окажет помощь в решении задач, подготовит к экзаменам. Занятия в Серебрянке, индивидуально. (90 мин) = 20 $.
Тел: +375(29) 127 61 86.

___________________________________________________________________________________

Оказываю платные услуги: решение задач по высшей математике. Оплата WebMoney.
Заказы направляйте сюда: Платные услуги
___________________________________________________________________________________

8.2.1. Выборочный метод и статистическое оценивание.
8.2.2. Проверка статистических гипотез.
8.2.3. Корреляционный и регрессионный анализ.
8.2.4. Дисперсионный анализ.
_______________________________________________________________________________________________

1. Статистическая (эмпирическая) функция распределения
nx
F * ( x ) = ––––
n
2. Среднее выборочное

3. Выборочная дисперсия

12. Доверительный интервал для оценки математического ожидания М нормального распределения при неизвестном σ (по найденному S или Dв) при повторном и бесповторном отборе соответственно

14. Формулы необходимого объёма выборки при повторном и бесповторном отборе соответственно

t ² σ ² Nt ² σ ² n
n ≈ ––– ; n ≈ –––––––– – , где 2Ф(t) = γ, S ² = ––– – σв .

δ ² Nδ ² + t ² σ ² n-1

8.2.1. Выборочный метод и статистическое оценивание.

8.2.1-1. Выборка задана в виде распределения частот:
xᵢ 4 7 8 12
nᵢ 5 2 3 10
Найти распределение относительных частот.

Решение:

Найдём объём выборки: n = ∑ nᵢ = 5 + 2 + 3 + 10 = 20. Найдём относительные частоты:
w ₁ = n ₁/ n = 5/20 = 0,25; w ₂ = n ₂/ n = 2/20 = 0,10; w ₃ = n ₃/ n = 3/20 = 0,15; w ₄ = n ₄/ n = 10/20 = 0,50.
Запишем искомое распределение относительных частот:
xᵢ 4 7 8 12
wᵢ 0,25 0,10 0,15 0,50
Контроль: ∑ wᵢ = 0,25 + 0,10 + 0,15 + 0,50 = 1. Верно!
Ответ: xᵢ 4 7 8 12
wᵢ 0,25 0,10 0,15 0,50.

8.2.1-2. Найти минимальный объём выборки, при котором с надёжностью 0,925 точность оценки математического ожидания нормально распределённой генеральной совокупности по выборочной средней равна 0,2, если известно среднее квадратическое отклонение генеральной совокупности σ = 1,5.

Решение:
γ = 0,925
δ = 0,2
σ = 1,5
n – ?
Воспользуемся формулой необходимого объёма выборки n при повторном отборе (см. (14) ) :
n = t ² σ ²/ δ ². (*)
Так как 2Ф( t ) = γ , ( Ф( t ) – функция Лапласа ), то 2Ф( t ) = 0,925 и Ф( t ) = 0,925/2 = 0,4625. По таблице функции Лапласа ( [1], стр. 389, Приложение 2 ) находим t = 1,78. Тогда по (*) получим искомый объём выборки n :
n = 1,78²·1,5²/0,2² = 178,2. Значит минимальный объём выборки nmin = 179.
Ответ: n = 179.

8.2.1-3. По данным 16 независимых равноточных измерений некоторой физической величины найдены среднее арифметическое результатов измерений

S = 8
γ = 0,999
( a b ) − ?
Истинное значение измеряемой величины равно её математическому ожиданию М. Задача сводится к оценке математического ожидания (при неизвестном среднем квадратическом отклонении σ генеральной совокупности и объёме выборки n (12) )

Читать еще:  Вытянутое видео как исправить

По таблице приложения 3 ([1], стр. 391) по γ = 0,999 и n = 16 находим tᵧ = 4,07.
Имеем

= 4,07·8/4 = 8,14. Тогда по (1) находим

8.2.1-4. Из генеральной совокупности извлечена выборка:

варианта xᵢ — 0,5 — 0,4 — 0,2 0 0,2 0,6 0,8 1 1,2 1,5
частота nᵢ 1 2 1 1 1 1 1 1 2 1

Оценить с надёжностью 0,95 математическое ожидание М нормально распределённого признака генеральной совокупности с помощью доверительного интервала.

Решение:

γ = 0,95
( a b ) − ?
Найдём объём выборки: n = ∑ nᵢ = 1+2+1+1+1+1+1+1+2+1 = 12.
По формуле (2) находим выборочное среднее:

= (1/12)(-0,5·1-0,4·2-0,2·1+0·1+0,2·1+0,6·1+0,8·1+1·1+1,2·2+1,5·1) = 0,417 = 0,42.

По формуле (3) находим выборочную дисперсию:

= (1/12)( (-0,5-0,42)²·1+(-0,4-0,42)²·2+(-0,2-0,42)²·1+(0-0,42)²·1+(0,2-0,42)²·1+(0,6-0,42)²·1+(0,8-0,42)²·1+(1-0,42)²·1+(1,2-0,42)²·2+(1,5-0,42)²·1 ) = 0,4747.
По формуле (9) находим “исправленное” среднее квадратическое отклонение S :

Тогда по (1) находим
0,42 — 0,457 M M M Ответ: — 0,04

8.2.1-5. С целью определения средней суммы вкладов в банке, имеющем 4300 вкладчиков, проведено выборочное обследование (бесповторная выборка) 207 вкладов, результаты которого даны в таблице:

Сумма вклада, тыс. у.е.

Пользуясь данными выборки, найти доверительные границы для генерального среднего, которые можно было бы гарантировать с вероятностью 0,98.

Решение:

N = 4300
n = 207
γ = 0,98
( a b ) − ?
В качестве значения признака Х берём середины интервалов: Х₁ = 5,5; Х₂ = 10,5; Х₃ = 15,5; Х₄ = 20,5; Х₅ = 25,5; Х₆ = 30,5.
По формуле (2) находим выборочное среднее:

По формуле (3) находим выборочную дисперсию:

= (1/207)( (5,5-14,65)²·53+(10,5-14,65)²·75+(15,5-14,65)²·17+(20,5-14,65)²·19+(25,5-14,65)²·2+ (30,5-14,65)²·41 ) = 81,77.
Доверительные границы для генерального среднего М (при неизвестном среднем квадратическом отклонении σ генеральной совокупности и бесповторном отборе) найдём по формуле (12) :

Для 2Ф( t ) = γ = 0,98, отсюда функция Лапласа Ф( t ) = 0,98/2 = 0,49.
По таблице приложения 2 ( [1], стр. 389 ) по Ф( t ) = 0,49 находим t = 2,33.
Имеем

Тогда по (1) находим
14,65 — 1,43 M M M

8.2.1-6. Найти центральный момент 5-го порядка!

Решение:
Центральным моментом 5-го порядка признака X называется величина
k
μ ₅ = M ( X — Ẋ )⁵ = ∑ ( xᵢ — Ẋ )⁵ mᵢ / n,
i=1

где M(X) = Ẋ – математическое ожидание признака X.

8.2.1-7. Как найти разность между генеральными и выборочными средними по исследуемым показателям?

Решение:
Пусть x ₒ⁻ (черта над x ₒ) – генеральная средняя, X ⁻ (черта над X ) – средняя выборки, ∆ – точность оценки, μ – мера точности выборки.
Тогда справедлива формула доверительной вероятности:
P ( | X ⁻ — x ₒ⁻| ≤ ∆) = 2Ф(∆/ μ ) или
P ( X ⁻ — ∆ ≤ x ₒ⁻ ≤ x ₒ⁻ + ∆) = 2Ф(∆/ μ ).
Здесь Ф(t) – функция Лапласа.
_______________________________________________________________________________________________

8.2.3. Корреляционный и регрессионный анализ.

8.2.3-1. Что означает значение коэффициента корреляции 0, 43 при уровне значимости 0, 001 ?

Решение:
Отвечаю на Ваш вопрос прямо: это ничего не означает.
Уровень значимости — это вероятность.
Выборочный коэффициент корреляции r служит для оценки силы линейной корреляционной связи между случайными величинами X и Y.
Как известно, | r | ≤ 1. Если r = 0, то между случайными величинами X и Y нет линейной корреляционной связи. Если r = ± 1, то между случайными величинами X и Y существует линейная функциональная связь.
Для обоснования суждения о наличии связи между случайными величинами X и Y следует проверить, значим ли вычисленный Вами выборочный коэффициент корреляции r = 0,43. Для этого Вам следует вычислить наблюдаемое значение критерия T набл = r √( n -2)/√(1- r ²) (где n — обьём выборки) и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α =0,001 и числу степеней свободы k = n -2 найти критическую точку t кр( α ; k ).
Если у Вас получится | T набл| > t кр( α ; k ), то коэффициент корреляции значимо отличается от нуля; следовательно, X и Y коррелированы. Если | T набл| t кр( α ; k ), то X и Y некоррелированы.
_______________________________________________________________________________________________

1. В. Е. Гмурман. Руководство к решению задач по теории вероятностей и математической статистике: Учеб. пособие для студентов вузов. Москва. «Высшая школа», 1999.

Как найти среднеквадратическое отклонение

В данной статье я расскажу о том, как найти среднеквадратическое отклонение. Этот материал крайне важен для полноценного понимания математики, поэтому репетитор по математике должен посвятить его изучению отдельный урок или даже несколько. В этой статье вы найдёте ссылку на подробный и понятный видеоурок, в котором рассказано о том, что такое среднеквадратическое отклонение и как его найти.

Среднеквадратическое отклонение дает возможность оценить разброс значений, полученных в результате измерения какого-то параметра. Обозначается символом (греческая буква «сигма»).

Формула для расчета довольно проста. Чтобы найти среднеквадратическое отклонение, нужно взять квадратный корень из дисперсии. Так что теперь вы должны спросить: “А что же такое дисперсия?”

Что такое дисперсия

Определение дисперсии звучит так. Дисперсия — это среднее арифметическое от квадратов отклонений значений от среднего.

Чтобы найти дисперсию последовательно проведите следующие вычисления:

  • Определите среднее (простое среднее арифметическое ряда значений).
  • Затем от каждого из значений отнимите среднее и возведите полученную разность в квадрат (получили квадрат разности).
  • Следующим шагом будет вычисление среднего арифметического полученных квадратов разностей (Почему именно квадратов вы сможете узнать ниже).
Читать еще:  Неисправности беспроводной мыши и их устранения

Рассмотрим на примере. Допустим, вы с друзьями решили измерить рост ваших собак (в миллиметрах). В результате измерений вы получили следующие данные измерений роста (в холке): 600 мм, 470 мм, 170 мм, 430 мм и 300 мм.

Порода собакиРост в миллиметрах
Ротвейлер600
Бульдог470
Такса170
Пудель430
Мопс300

Вычислим среднее значение, дисперсию и среднеквадратическое отклонение.

Сперва найдём среднее значение. Как вы уже знаете, для этого нужно сложить все измеренные значения и поделить на количество измерений. Ход вычислений:

Среднее мм.

Итак, среднее (среднеарифметическое) составляет 394 мм.

Теперь нужно определить отклонение роста каждой из собак от среднего:

Наконец, чтобы вычислить дисперсию, каждую из полученных разностей возводим в квадрат, а затем находим среднее арифметическое от полученных результатов:

Дисперсия мм 2 .

Таким образом, дисперсия составляет 21704 мм 2 .

Как найти среднеквадратическое отклонение

Так как же теперь вычислить среднеквадратическое отклонение, зная дисперсию? Как мы помним, взять из нее квадратный корень. То есть среднеквадратическое отклонение равно:

мм (округлено до ближайшего целого значения в мм).

Применив данный метод, мы выяснили, что некоторые собаки (например, ротвейлеры) – очень большие собаки. Но есть и очень маленькие собаки (например, таксы, только говорить им этого не стоит).

Самое интересное, что среднеквадратическое отклонение несет в себе полезную информацию. Теперь мы можем показать, какие из полученных результатов измерения роста находятся в пределах интервала, который мы получим, если отложим от среднего (в обе стороны от него) среднеквадратическое отклонение.

То есть с помощью среднеквадратического отклонения мы получаем “стандартный” метод, который позволяет узнать, какое из значений является нормальным (среднестатистическим), а какое экстраординарно большим или, наоборот, малым.

Что такое стандартное отклонение

Но… все будет немного иначе, если мы будем анализировать выборку данных. В нашем примере мы рассматривали генеральную совокупность. То есть наши 5 собак были единственными в мире собаками, которые нас интересовали.

Но если данные являются выборкой (значениями, которые выбрали из большой генеральной совокупности), тогда вычисления нужно вести иначе.

Если есть значений, то:

  • Когда мы имеем дело с генеральной совокупностью при вычислении дисперсии, мы делим на (как и было сделано в рассмотренном нами примере).
  • Когда мы имеем дело с выборкой, при вычислении дисперсии делим на .

Все остальные расчеты производятся аналогично, в том числе и определение среднего.

Например, если наших пять собак – только выборка из генеральной совокупности собак (всех собак на планете), мы должны делить на 4, а не на 5, а именно:

Дисперсия выборки = мм 2 .

При этом стандартное отклонение по выборке равно мм (округлено до ближайшего целого значения).

Можно сказать, что мы произвели некоторую “коррекцию” в случае, когда наши значения являются всего лишь небольшой выборкой.

Примечание. Почему именно квадраты разностей?

Но почему при вычислении дисперсии мы берём именно квадраты разностей? Допустим при измерении какого-то параметра, вы получили следующий набор значений: 4; 4; -4; -4. Если мы просто сложим абсолютные отклонения от среднего (разности) между собой … отрицательные значения взаимно уничтожатся с положительными:

.

Получается, этот вариант бесполезен. Тогда, может, стоит попробовать абсолютные значения отклонений (то есть модули этих значений)?

.

На первый взгляд получается неплохо (полученная величина, кстати, называется средним абсолютным отклонением), но не во всех случаях. Попробуем другой пример. Пусть в результате измерения получился следующий набор значений: 7; 1; -6; -2. Тогда среднее абсолютное отклонение равно:

.

Вот это да! Снова получили результат 4, хотя разности имеют гораздо больший разброс.

А теперь посмотрим, что получится, если возвести разности в квадрат (и взять потом квадратный корень из их суммы).

Для первого примера получится:

.

Для второго примера получится:

.

Теперь – совсем другое дело! Среднеквадратическое отклонение получается тем большим, чем больший разброс имеют разности … к чему мы и стремились.

Фактически в данном методе использована та же идея, что и при вычислении расстояния между точками, только примененная иным способом.

И с математической точки зрения использование квадратов и квадратных корней дает больше пользы, чем мы могли бы получить на основании абсолютных значений отклонений, благодаря чему среднеквадратическое отклонение применимо и для других математических задач.

О том, как найти среднеквадратическое отклонение, вам рассказал репетитор по математике в Москве, Сергей Валерьевич

Ссылка на основную публикацию
Adblock
detector