точечные оценки параметров статистического распределения
Точечная оценка параметров распределения
Тема 7. Статистические оценки параметров распределения: точечные и интервальные оценки
Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема, то есть по некоторой части генеральной совокупности, высказать обоснованное суждение о ее свойствах целиком.
Естественно, что замена исследования генеральной совокупности исследованием выборки порождает ряд вопросов:
1. В какой степени выборка отражает свойства генеральной совокупности, т. е. в какой степени выборка репрезентативна по отношению к генеральной совокупности?
2. Какую информацию о значениях параметров генеральной совокупности могут дать параметры выборки?
3. Можно ли утверждать, что полученные выборочным путем статистические характеристики (средние величины, дисперсия или любые другие производные величины) равны тем характеристикам, которые могут быть получены из генеральной совокупности.
Проверка показывает, что значения параметров, полученных для разных выборок из одной генеральной совокупности, обычно не совпадают. Рассчитанные выборочным путем числовые значения параметров выборок являются лишь результатом приближенного статистического оценивания значений этих параметров в генеральной совокупности. Статистическое оценивание, в силу изменчивости наблюдаемых явлений, позволяет получать только их приближенные значения.
Примечание. Строго говоря, в статистике оценка — это правило вычисления оцениваемого параметра, а термин оценить, т. е. провести оценивание, означает указать приближенное значение.
Различают оценки точечные и оценки интервальные.
Точечная оценка параметров распределения
Пусть x1, x2, …, xn – выборка объема n из генеральной совокупности с функцией распределения F(x).
Числовые характеристики этой выборки называются выборочными (эмпирическими) числовыми характеристиками.
Отметим, что выборочные числовые характеристики являются характеристиками данной выборки, но не являются характеристиками распределения генеральной совокупности. Однако эти характеристики можно использовать для оценок параметров генеральной совокупности.
Точечной называют статистическую оценку, которая определяется одним числом.
Точечная оценка характеризуется свойствами:несмещенность, состоятельность и эффективность.
Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.
Точечная оценка называется состоятельной, если при неограниченном увеличении объема выборки (n ® ¥) она сходится по вероятности к истинному значению параметра, то есть стремится к истинному значению оцениваемого параметра генеральной совокупности.
Эффективной называют точечную оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию, те есть гарантирует наименьшее отклонение выборочной оценки от такой же оценки генеральной совокупности..
В математической статистике показывается, что состоятельной, несмещенной оценкой генерального среднего значения а является выборочное средне:
где хi – варианта выборки, ni – частота варианты хi, – объем выборки.
Несмещенной оценкой генеральной дисперсии служит исправления выборочная дисперсия
,
Более удобна формула .
Оценка s 2 для генеральной дисперсии является также и состоятельной, но не является эффективной. Однако в случае нормального распределения она является «асимптотически эффективной», то есть при увеличении n отношение ее дисперсии к минимально возможной неограниченно приближается к единице.
Точечные оценки имеют тот недостаток, что при малом объеме выборки могут значительно отличаться от оцениваемых параметров. Поэтому, чтобы получить представление о близости между параметром и его оценкой, в математической статистике вводятся, так называемые, интервальные оценки.
Доверительный интервал
Если при статистической обработке результатов требуется найти не только точечную оценку неизвестного параметра θ, но и охарактеризовать точность этой оценки, то находится доверительный интервал.
Доверительный интервал – это интервал, в котором заранее заданной доверительной вероятностью находится неизвестный параметр генеральной совокупности.
Доверительная вероятность – это вероятность, с которой неизвестный параметр генеральной совокупности принадлежит доверительному интервалу.
Обычно принимают р = 0,95 или (реже) 0,99. Эти вероятности признаны достаточными для уверенного суждения о генеральных параметрах на основании известных выборочных показателей.
Доверительный интервал для математического ожидания имеет вид: где S – СКО,
— критическое значение распределения Стьюдента (Смотри ПРИЛОЖЕНИЕ 1 к Теме 7)
Доверительный интервал для дисперсии имеет вид
где — обратное распределение хи-квадрат (Смотри ПРИЛОЖЕНИЕ 2 к Теме 7)
ЗАДАЧА. Дана выборка 5, 6, 8, 2, 3, 1, 1, 4. Записать данные в виде вариационного ряда. Определить оценки среднего, дисперсии, и стандартного отклонения а также построить доверительные интервалы для среднего и дисперсии на уровне значимости a=0,05.
Решение. Представим данные в виде вариационного ряда: 1, 1, 2, 3, 4, 5, 6, 8. Так как n = 8, то выборочное среднее и исправленная выборочная дисперсия равны
Стандартное отклонение .
По таблицам из ПРИЛОЖЕНИЯ 1 и ПРИЛОЖЕНИЯ 2 к Теме 7. находим: ,
Получаем доверительный интервал для математического ожидания
или
.
Доверительный интервал для дисперсии
или
Точечные статистические оценки параметров распределения
Пусть собранный и обработанный статистический материал представлен в виде статистического ряда.
Определение 1. Точечной статистической оценкой параметра а распределения случайной величины называется приближенное значение а* этого параметра, вычисленного по статистическим данным.
Замечание 1. Любая точечная статистическая оценка некоторого параметра, вычисляемая на основе статистического ряда, должна удовлетворять трём требованиям:
· при увеличении числа испытаний она должна сходиться по вероятности к оцениваемому параметру (свойство состоятельности);
· математическое ожидание статистической оценки (как случайной величины при изменении числа испытаний) равно оцениваемому параметру (свойство несмещенности);
· при заданном объёме выборки статистическая оценка имеет наименьшую дисперсию (свойство эффективности).
Определение 2.Статистической оценкой математического ожидания называется среднее арифметическое статистических значений изучаемой случайной величины:
=
,
Замечание 2. Эта оценка математического ожидания обладает всеми свойствами оценок: состоятельности, несмещенности, эффективности.
Определение 3. Смещенной оценкой дисперсии D(x) называется выборочная дисперсия:
Dв=
Замечание 3. Эта оценка является смещенной, так как
M(Dв )= D(x).
Определение 4. Несмещенной оценкой дисперсии D(x)называется исправленная выборочная дисперсия:
s 2 = Dв=
·
Замечание 4. При расчёте s 2 можно воспользоваться более удобной формулой:
s 2 =
Замечание 5. Выборочная дисперсия Dв и исправленная выборочная дисперсия s 2 обладают свойством состоятельности. Оценка s 2 не обладает свойством эффективности, но обладает свойством несмещенности, поэтому ее чаще чем Dв используют в качестве приближенного значения дисперсии D(x).
Определение 5. Оценкой среднего квадратического отклонения σ(х) называется квадратный корень из Dв или s 2 :
σв= в или s =
2
Определение 6. Оценкой вероятности события А в n независимых испытаниях является относительная частота события А:
P*= ,
где m – число появления события А в n испытаниях.
Замечание 6. Эта оценка вероятности события А в n независимых испытаниях обладает свойствами несмещенности, состоятельности и эффективности.
Замечание 7. Если выборка состоит из вариант xi громоздкого вида, то для упрощения расчета выборочных точечных оценок параметров следует перейти к условным вариантам:
ui = ,
где h – шаг между равноотстоящими вариантами; c – так называемый «ложный» нуль. Для них произвести расчет точечных оценок параметров:
=
, Dв (u) =
, su 2 =
· Dв (u).
Затем вычислить искомые точечные оценки:
В качестве числа c обычно выбирают варианту xi0 , которая расположена в середине статистического ряда или имеет наибольшую частоту.
СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ
ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ
Одной из задач математической статистики является оценка неизвестных параметров закона распределения генеральной совокупности X. Вид закона распределения X может быть известным или неизвестным, и задача сводится к нахождению приближенных значений искомых параметров распределения или числовых характеристик X с использованием выборки из генеральной совокупности.
Определение. Точечной оценкой параметра 0 распределения генеральной совокупности ^называется статистика 0 (л) (Х (л) ), реализации которой 0 (л) (х (и) ) используются как приближенные значения этого параметра.
Наряду со статистикой 0 (л) (Х (л) ) точечной оценкой параметра 0 называют и функцию п переменных 0 (л) (х (л) ).
Качество оценки характеризуется следующими основными свойствами.
1. Несмещенность точечной оценки
Определение. Статистику 0 (л) (Х (и) ) называют несмещенной оценкой параметра 0 распределения генеральной совокупности X, если ее математическое ожидание совпадает с 0 для любого п е N:
При выполнении этого требования в пределе, т.е. когда
оценку 0 (/,) называют асимптотически несмещенной.
Пример 25.1. Доказать, что выборочные начальные моменты 1 п
? Найдем математическое ожидание статистики ак(Х <п) ) = 1 «
Поскольку случайные величины Xt распределены по тому же закону, что и генеральная совокупность X, можно записать М[Х к = = М[Х к = ак[Х]. Поэтому
оценки х величины тх подставить саму эту величину, т.е. положить
Убедитесь, что выборочная дисперсия (25.2) является несмещенной оценкой дисперсии о 2 х генеральной совокупности X.
Пример 25.3. Пусть статистика X = — Xt есть выборочное сред-
нее, см. (24.4). Покажите, что
где а (/l) ) из (24.6) как оценки дисперсии о 2 х генеральной совокупности X.
Отсюда с учетом (25.3) получаем
т.е. Sq (х (я) ) — это смещенная оценка дисперсии о 2 х генеральной совокупности X. Однако lim mSq (X (w) )1 = g 2 x, что означает асимптоти-
1. Рассмотрим оценку iS’ 2 (x (w) ) = —— 5о(х (л) ), т.е.
Как уже отмечалось в п. 24.2, ее называют исправленной выборочной дисперсией. Из примера 25.4 следует, что М[5 2 (Х (/г) )] = 2 х, т.е. 5 2 (х (я) ) есть несмещенная оценка дисперсии а 2 х генеральной совокупности X.
2. Состоятельность точечной оценки
Определение. Статистику 0 ( ‘ г) (Х (/г) ) называют состоятельной оценкой параметра 0 распределения генеральной совокупности X, если с ростом объема выборки п она сходится по вероятности к этому параметру:
Замечание. Напомним: соотношение (25.6) означает, что для любого е > О
Отсюда следует, что для состоятельной оценки 0 (,,) (Х (,,) ) ее отклонение от 0 не менее чем на сколь угодно малую величину е становится при большом объеме выборки п событием, близким к невозможному. Иными словами, состоятельность оценки — это возможность определить с ее помощью искомый параметр с любой точностью и сколь угодно большой достоверностью за счет использования выборки достаточно большого объема п.
Пример 25.5. Выборочное среднее х = — У х,- — состоятельная
оценка математического ожидания тх генеральной совокупности X с конечной дисперсией 2 х.
Замечание. Состоятельность оценки х в конечном счете обеспе- о 2
вать следующее обобщение результата примера 25.5: если статистика 0(«)(Х Л )) является асимптотически несмещенной оценкой параметра 0 и lim Z)[0 (,,) (X (W) )] = 0, то эта статистика есть состоятельная оценка
Пример 25.6. Докажем, что выборочные дисперсии Sq =
= — Y (х,— х) 2 и S 2 =—‘V(xj-x) 2 являются состоятельными
оценками дисперсии o;v генеральной совокупности X, имеющей ко- нечный центральный момент р4[Лф
? Воспользуемся равенством (25.4):
Из состоятельности выборочного среднего как оценки параметра тх(см. пример 25.5) следует, что
Из (25.4), (25.7) и (25.8) следует, что Sq— ^ >ох при п —> ©о, т.е.
S0 — состоятельная оценка дисперсии ах. Далее S =-^, причем
Замечание. Можно доказать, что все выборочные начальные и центральные моменты (24.3), (24.5) являются состоятельными оценками соответствующих моментов генеральной совокупности, если последние существуют.
3. Эффективность точечной оценки
Пусть имеются две несмещенные оценки 0| л) (х (л) ) и 0 ( 2 и) (х (я) ) одного и того же параметра 0. Если для любого не N выполняется неравенство
то следует предпочесть оценку б< я) (х (я) ), так как ее разброс относительно искомого значения 0 в среднем меньше и, следовательно, она при одном и том же п дает в среднем более точный результат. В таких случаях говорят, что оценка 0|» ) (х (/,) ) эффективнее оценки 0 ( 2 w) (x (w) ).
Определение. Если существует такая несмещенная оценка 0i’°(x (/,) ) параметра 0, что для любой другой его несмещенной оценки 0 (,,) (х (я) ) при всех п е N выполняется неравенство
то 0 ( *’ г) (х (я) ) называют эффективной оценкой параметра 0.
1. В отличие от несмещенности и состоятельности эффективность оценки 0 ( ‘°(х (,,) ) зависит от закона распределения генеральной совокупности X: для одного закона 0 (,,) (х (,г) ) может оказаться эффективной, а для другого — нет.
2. При выполнении определенных требований кЛТи 0 ” ) (х (,,) ) (они выполняются для основных законов распределения и большинства оценок, используемых в приложениях), справедливо неравенство Крамера—Рао:
Это неравенство можно использовать для проверки эффективности оценок следующим образом. Пусть для некоторой несмещенной оценки 0 (л) (х (л) ) неравенство (25.9) превращается в равенство. Это означает, что дисперсия Z>[0 (w) (X (/,) )] достигла нижней границы для дисперсий всех несмещенных оценок параметра 0, т.е. оценка 0 ( /О(х ( «))
Пример 25.7. Пусть X
N(m, о). Исследуем эффективность не- 1 V
? Левая часть неравенства (25.9) уже найдена, см. (25.3): Подсчитаем выражение в правой части (25.9). В данном случае
Отсюда находим правую часть неравенства (25.9):-= —.
х = — ^Xj — это эффективная оценка математического ожидания т 1=1
Пример 25.8. Покажем, что выборочное среднее х = — яв-
ляется эффективной оценкой параметра X распределения Пуассона.
Левая часть неравенства (25.9) равна D[X] = = —.
Найдем правую часть:
Итак, правая часть в (25.9) равна —, т.е. совпадает с левой частью.
Поэтому выборочное среднее х = — является эффективной оценкой
параметра X для генеральной совокупности X
Пример 25.9. Пусть генеральная совокупность — это число появлений события А (успеха), вероятность которого Р(А) = р е (0; 1), в п испытаниях, т.е. X
Исследовать относительную частоту успеха р(х) = — как оценку
т.е. р есть несмещенная оценка параметра р.
б) Состоятельность. Из теоремы 23.4 (закон больших чисел в формулировке Бернулли) непосредственно следует, что
а это означает состоятельность оценки р параметра р.
в) Эффективность. С учетом того что D[X] = npq (см. п. 22.10), вычислим левую часть неравенства (25.9):
Найдем теперь правую часть (25.9). Для X
В(п, р) имеем (см. п. 22.10):
т.е. правая часть в (25.9) равна — и совпадает с левой частью. Это
означает, что р есть эффективная оценка параметра р.