Progress-servis55.ru

Новости из мира ПК
11 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Исправленное выборочное среднее квадратическое отклонение

Дисперсия: генеральная, выборочная, исправленная

Генеральная дисперсия

Пусть нам дана генеральная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Генеральная совокупность — совокупность случайно отобранных объектов данного вида, над которыми проводят наблюдения с целью получения конкретных значений случайной величины, проводимых в неизменных условиях при изучении одной случайной величины данного вида.

Генеральная дисперсия — среднее арифметическое квадратов отклонений значений вариант генеральной совокупности от их среднего значения.

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда генеральная дисперсия вычисляется по формуле:

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае генеральная дисперсия вычисляется по формуле:

С этим понятием также связано понятие генерального среднего квадратического отклонения.

Попробуй обратиться за помощью к преподавателям

Генеральное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

Выборочная дисперсия

Пусть нам дана выборочная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Выборочная совокупность — часть отобранных объектов из генеральной совокупности.

Выборочная дисперсия — среднее арифметическое значений вариант выборочной совокупности.

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда выборочная дисперсия вычисляется по формуле:

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае выборочная дисперсия вычисляется по формуле:

Задай вопрос специалистам и получи
ответ уже через 15 минут!

С этим понятием также связано понятие выборочного среднего квадратического отклонения.

Выборочное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

Исправленная дисперсия

Для нахождения исправленной дисперсии $S^2$ необходимо умножить выборочную дисперсию на дробь $frac$, то есть

С этим понятием также связано понятие исправленного среднего квадратического отклонения, которое находится по формуле:

. В случае, когда значение вариант не являются дискретными, а представляют из себя интервалы, то в формулах для вычисления генеральной или выборочной дисперсий за значение $x_i$ принимается значение середины интервала, которому принадлежит $x_i.$

Пример задачи на нахождение дисперсии и среднего квадратического отклонения

Выборочная совокупность задана следующей таблицей распределения:

Найдем для нее выборочную дисперсию, выборочное среднее квадратическое отклонение, исправленную дисперсию и исправленное среднее квадратическое отклонение.

Для решения этой задачи для начала сделаем расчетную таблицу:

Величина $overline$ (среднее выборочное) в таблице находится по формуле:

Найдем выборочную дисперсию по формуле:

Выборочное среднее квадратическое отклонение:

Исправленное среднее квадратическое отклонение:

Так и не нашли ответ
на свой вопрос?

Просто напиши с чем тебе
нужна помощь

Исправленное выборочное среднее квадратическое отклонение

Виктор Цекунов

Навигация

Affiliations

Template tips

8.2. Математическая статистика

Репетитор по математике, физике (Минск): Виктор Иванович.

Высшая математика и физика для студентов. Профессиональный репетитор окажет помощь в решении задач, подготовит к экзаменам. Занятия в Серебрянке, индивидуально. (90 мин) = 20 $.
Тел: +375(29) 127 61 86.

___________________________________________________________________________________

Оказываю платные услуги: решение задач по высшей математике. Оплата WebMoney.
Заказы направляйте сюда: Платные услуги
___________________________________________________________________________________

8.2.1. Выборочный метод и статистическое оценивание.
8.2.2. Проверка статистических гипотез.
8.2.3. Корреляционный и регрессионный анализ.
8.2.4. Дисперсионный анализ.
_______________________________________________________________________________________________

1. Статистическая (эмпирическая) функция распределения
nx
F * ( x ) = ––––
n
2. Среднее выборочное

3. Выборочная дисперсия

12. Доверительный интервал для оценки математического ожидания М нормального распределения при неизвестном σ (по найденному S или Dв) при повторном и бесповторном отборе соответственно

14. Формулы необходимого объёма выборки при повторном и бесповторном отборе соответственно

t ² σ ² Nt ² σ ² n
n ≈ ––– ; n ≈ –––––––– – , где 2Ф(t) = γ, S ² = ––– – σв .

Читать еще:  Проверка и исправление жесткого диска

δ ² Nδ ² + t ² σ ² n-1

8.2.1. Выборочный метод и статистическое оценивание.

8.2.1-1. Выборка задана в виде распределения частот:
xᵢ 4 7 8 12
nᵢ 5 2 3 10
Найти распределение относительных частот.

Решение:

Найдём объём выборки: n = ∑ nᵢ = 5 + 2 + 3 + 10 = 20. Найдём относительные частоты:
w ₁ = n ₁/ n = 5/20 = 0,25; w ₂ = n ₂/ n = 2/20 = 0,10; w ₃ = n ₃/ n = 3/20 = 0,15; w ₄ = n ₄/ n = 10/20 = 0,50.
Запишем искомое распределение относительных частот:
xᵢ 4 7 8 12
wᵢ 0,25 0,10 0,15 0,50
Контроль: ∑ wᵢ = 0,25 + 0,10 + 0,15 + 0,50 = 1. Верно!
Ответ: xᵢ 4 7 8 12
wᵢ 0,25 0,10 0,15 0,50.

8.2.1-2. Найти минимальный объём выборки, при котором с надёжностью 0,925 точность оценки математического ожидания нормально распределённой генеральной совокупности по выборочной средней равна 0,2, если известно среднее квадратическое отклонение генеральной совокупности σ = 1,5.

Решение:
γ = 0,925
δ = 0,2
σ = 1,5
n – ?
Воспользуемся формулой необходимого объёма выборки n при повторном отборе (см. (14) ) :
n = t ² σ ²/ δ ². (*)
Так как 2Ф( t ) = γ , ( Ф( t ) – функция Лапласа ), то 2Ф( t ) = 0,925 и Ф( t ) = 0,925/2 = 0,4625. По таблице функции Лапласа ( [1], стр. 389, Приложение 2 ) находим t = 1,78. Тогда по (*) получим искомый объём выборки n :
n = 1,78²·1,5²/0,2² = 178,2. Значит минимальный объём выборки nmin = 179.
Ответ: n = 179.

8.2.1-3. По данным 16 независимых равноточных измерений некоторой физической величины найдены среднее арифметическое результатов измерений

S = 8
γ = 0,999
( a b ) − ?
Истинное значение измеряемой величины равно её математическому ожиданию М. Задача сводится к оценке математического ожидания (при неизвестном среднем квадратическом отклонении σ генеральной совокупности и объёме выборки n (12) )

По таблице приложения 3 ([1], стр. 391) по γ = 0,999 и n = 16 находим tᵧ = 4,07.
Имеем

= 4,07·8/4 = 8,14. Тогда по (1) находим

8.2.1-4. Из генеральной совокупности извлечена выборка:

варианта xᵢ — 0,5 — 0,4 — 0,2 0 0,2 0,6 0,8 1 1,2 1,5
частота nᵢ 1 2 1 1 1 1 1 1 2 1

Оценить с надёжностью 0,95 математическое ожидание М нормально распределённого признака генеральной совокупности с помощью доверительного интервала.

Решение:

γ = 0,95
( a b ) − ?
Найдём объём выборки: n = ∑ nᵢ = 1+2+1+1+1+1+1+1+2+1 = 12.
По формуле (2) находим выборочное среднее:

= (1/12)(-0,5·1-0,4·2-0,2·1+0·1+0,2·1+0,6·1+0,8·1+1·1+1,2·2+1,5·1) = 0,417 = 0,42.

По формуле (3) находим выборочную дисперсию:

= (1/12)( (-0,5-0,42)²·1+(-0,4-0,42)²·2+(-0,2-0,42)²·1+(0-0,42)²·1+(0,2-0,42)²·1+(0,6-0,42)²·1+(0,8-0,42)²·1+(1-0,42)²·1+(1,2-0,42)²·2+(1,5-0,42)²·1 ) = 0,4747.
По формуле (9) находим “исправленное” среднее квадратическое отклонение S :

Тогда по (1) находим
0,42 — 0,457 M M M Ответ: — 0,04

8.2.1-5. С целью определения средней суммы вкладов в банке, имеющем 4300 вкладчиков, проведено выборочное обследование (бесповторная выборка) 207 вкладов, результаты которого даны в таблице:

Сумма вклада, тыс. у.е.

Пользуясь данными выборки, найти доверительные границы для генерального среднего, которые можно было бы гарантировать с вероятностью 0,98.

Решение:

N = 4300
n = 207
γ = 0,98
( a b ) − ?
В качестве значения признака Х берём середины интервалов: Х₁ = 5,5; Х₂ = 10,5; Х₃ = 15,5; Х₄ = 20,5; Х₅ = 25,5; Х₆ = 30,5.
По формуле (2) находим выборочное среднее:

По формуле (3) находим выборочную дисперсию:

= (1/207)( (5,5-14,65)²·53+(10,5-14,65)²·75+(15,5-14,65)²·17+(20,5-14,65)²·19+(25,5-14,65)²·2+ (30,5-14,65)²·41 ) = 81,77.
Доверительные границы для генерального среднего М (при неизвестном среднем квадратическом отклонении σ генеральной совокупности и бесповторном отборе) найдём по формуле (12) :

Для 2Ф( t ) = γ = 0,98, отсюда функция Лапласа Ф( t ) = 0,98/2 = 0,49.
По таблице приложения 2 ( [1], стр. 389 ) по Ф( t ) = 0,49 находим t = 2,33.
Имеем

Тогда по (1) находим
14,65 — 1,43 M M M

8.2.1-6. Найти центральный момент 5-го порядка!

Решение:
Центральным моментом 5-го порядка признака X называется величина
k
μ ₅ = M ( X — Ẋ )⁵ = ∑ ( xᵢ — Ẋ )⁵ mᵢ / n,
i=1

где M(X) = Ẋ – математическое ожидание признака X.

8.2.1-7. Как найти разность между генеральными и выборочными средними по исследуемым показателям?

Решение:
Пусть x ₒ⁻ (черта над x ₒ) – генеральная средняя, X ⁻ (черта над X ) – средняя выборки, ∆ – точность оценки, μ – мера точности выборки.
Тогда справедлива формула доверительной вероятности:
P ( | X ⁻ — x ₒ⁻| ≤ ∆) = 2Ф(∆/ μ ) или
P ( X ⁻ — ∆ ≤ x ₒ⁻ ≤ x ₒ⁻ + ∆) = 2Ф(∆/ μ ).
Здесь Ф(t) – функция Лапласа.
_______________________________________________________________________________________________

Читать еще:  Как исправить вертикальное видео

8.2.3. Корреляционный и регрессионный анализ.

8.2.3-1. Что означает значение коэффициента корреляции 0, 43 при уровне значимости 0, 001 ?

Решение:
Отвечаю на Ваш вопрос прямо: это ничего не означает.
Уровень значимости — это вероятность.
Выборочный коэффициент корреляции r служит для оценки силы линейной корреляционной связи между случайными величинами X и Y.
Как известно, | r | ≤ 1. Если r = 0, то между случайными величинами X и Y нет линейной корреляционной связи. Если r = ± 1, то между случайными величинами X и Y существует линейная функциональная связь.
Для обоснования суждения о наличии связи между случайными величинами X и Y следует проверить, значим ли вычисленный Вами выборочный коэффициент корреляции r = 0,43. Для этого Вам следует вычислить наблюдаемое значение критерия T набл = r √( n -2)/√(1- r ²) (где n — обьём выборки) и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α =0,001 и числу степеней свободы k = n -2 найти критическую точку t кр( α ; k ).
Если у Вас получится | T набл| > t кр( α ; k ), то коэффициент корреляции значимо отличается от нуля; следовательно, X и Y коррелированы. Если | T набл| t кр( α ; k ), то X и Y некоррелированы.
_______________________________________________________________________________________________

1. В. Е. Гмурман. Руководство к решению задач по теории вероятностей и математической статистике: Учеб. пособие для студентов вузов. Москва. «Высшая школа», 1999.

Как найти среднеквадратическое отклонение

В данной статье я расскажу о том, как найти среднеквадратическое отклонение. Этот материал крайне важен для полноценного понимания математики, поэтому репетитор по математике должен посвятить его изучению отдельный урок или даже несколько. В этой статье вы найдёте ссылку на подробный и понятный видеоурок, в котором рассказано о том, что такое среднеквадратическое отклонение и как его найти.

Среднеквадратическое отклонение дает возможность оценить разброс значений, полученных в результате измерения какого-то параметра. Обозначается символом (греческая буква «сигма»).

Формула для расчета довольно проста. Чтобы найти среднеквадратическое отклонение, нужно взять квадратный корень из дисперсии. Так что теперь вы должны спросить: “А что же такое дисперсия?”

Что такое дисперсия

Определение дисперсии звучит так. Дисперсия — это среднее арифметическое от квадратов отклонений значений от среднего.

Чтобы найти дисперсию последовательно проведите следующие вычисления:

  • Определите среднее (простое среднее арифметическое ряда значений).
  • Затем от каждого из значений отнимите среднее и возведите полученную разность в квадрат (получили квадрат разности).
  • Следующим шагом будет вычисление среднего арифметического полученных квадратов разностей (Почему именно квадратов вы сможете узнать ниже).

Рассмотрим на примере. Допустим, вы с друзьями решили измерить рост ваших собак (в миллиметрах). В результате измерений вы получили следующие данные измерений роста (в холке): 600 мм, 470 мм, 170 мм, 430 мм и 300 мм.

Порода собакиРост в миллиметрах
Ротвейлер600
Бульдог470
Такса170
Пудель430
Мопс300

Вычислим среднее значение, дисперсию и среднеквадратическое отклонение.

Сперва найдём среднее значение. Как вы уже знаете, для этого нужно сложить все измеренные значения и поделить на количество измерений. Ход вычислений:

Среднее мм.

Итак, среднее (среднеарифметическое) составляет 394 мм.

Теперь нужно определить отклонение роста каждой из собак от среднего:

Наконец, чтобы вычислить дисперсию, каждую из полученных разностей возводим в квадрат, а затем находим среднее арифметическое от полученных результатов:

Читать еще:  Как сделать исправления в пдф файле

Дисперсия мм 2 .

Таким образом, дисперсия составляет 21704 мм 2 .

Как найти среднеквадратическое отклонение

Так как же теперь вычислить среднеквадратическое отклонение, зная дисперсию? Как мы помним, взять из нее квадратный корень. То есть среднеквадратическое отклонение равно:

мм (округлено до ближайшего целого значения в мм).

Применив данный метод, мы выяснили, что некоторые собаки (например, ротвейлеры) – очень большие собаки. Но есть и очень маленькие собаки (например, таксы, только говорить им этого не стоит).

Самое интересное, что среднеквадратическое отклонение несет в себе полезную информацию. Теперь мы можем показать, какие из полученных результатов измерения роста находятся в пределах интервала, который мы получим, если отложим от среднего (в обе стороны от него) среднеквадратическое отклонение.

То есть с помощью среднеквадратического отклонения мы получаем “стандартный” метод, который позволяет узнать, какое из значений является нормальным (среднестатистическим), а какое экстраординарно большим или, наоборот, малым.

Что такое стандартное отклонение

Но… все будет немного иначе, если мы будем анализировать выборку данных. В нашем примере мы рассматривали генеральную совокупность. То есть наши 5 собак были единственными в мире собаками, которые нас интересовали.

Но если данные являются выборкой (значениями, которые выбрали из большой генеральной совокупности), тогда вычисления нужно вести иначе.

Если есть значений, то:

  • Когда мы имеем дело с генеральной совокупностью при вычислении дисперсии, мы делим на (как и было сделано в рассмотренном нами примере).
  • Когда мы имеем дело с выборкой, при вычислении дисперсии делим на .

Все остальные расчеты производятся аналогично, в том числе и определение среднего.

Например, если наших пять собак – только выборка из генеральной совокупности собак (всех собак на планете), мы должны делить на 4, а не на 5, а именно:

Дисперсия выборки = мм 2 .

При этом стандартное отклонение по выборке равно мм (округлено до ближайшего целого значения).

Можно сказать, что мы произвели некоторую “коррекцию” в случае, когда наши значения являются всего лишь небольшой выборкой.

Примечание. Почему именно квадраты разностей?

Но почему при вычислении дисперсии мы берём именно квадраты разностей? Допустим при измерении какого-то параметра, вы получили следующий набор значений: 4; 4; -4; -4. Если мы просто сложим абсолютные отклонения от среднего (разности) между собой … отрицательные значения взаимно уничтожатся с положительными:

.

Получается, этот вариант бесполезен. Тогда, может, стоит попробовать абсолютные значения отклонений (то есть модули этих значений)?

.

На первый взгляд получается неплохо (полученная величина, кстати, называется средним абсолютным отклонением), но не во всех случаях. Попробуем другой пример. Пусть в результате измерения получился следующий набор значений: 7; 1; -6; -2. Тогда среднее абсолютное отклонение равно:

.

Вот это да! Снова получили результат 4, хотя разности имеют гораздо больший разброс.

А теперь посмотрим, что получится, если возвести разности в квадрат (и взять потом квадратный корень из их суммы).

Для первого примера получится:

.

Для второго примера получится:

.

Теперь – совсем другое дело! Среднеквадратическое отклонение получается тем большим, чем больший разброс имеют разности … к чему мы и стремились.

Фактически в данном методе использована та же идея, что и при вычислении расстояния между точками, только примененная иным способом.

И с математической точки зрения использование квадратов и квадратных корней дает больше пользы, чем мы могли бы получить на основании абсолютных значений отклонений, благодаря чему среднеквадратическое отклонение применимо и для других математических задач.

О том, как найти среднеквадратическое отклонение, вам рассказал репетитор по математике в Москве, Сергей Валерьевич

Ссылка на основную публикацию
Adblock
detector