ФОРМИРОВАНИЕ РЕЗУЛЬТАТОВ ОПРЕДЕЛИТЕЛЬНЫХ ИСПЫТАНИЙ
ЮЛ. Оценивание одномерных стационарных детерминированных параметров единичного образца
10.1.1. Основные определения и свойства оценок
Определительные испытания — это испытания, проводимые для определения значений характеристик объекта с заданными значениями показателей точности и (или) достоверности (ГОСТ 16504—81). Исходя из общей схемы формирования результата испытания (см. рис. 9.1) целью определительных испытаний можно считать получение статистических оценок основных параметров изделий. При этом выбор используемых оценок зависит от специфики объекта испытаний (единичного образца или партии продукции), характера исследуемых параметров (детерминированный — случайный; стационарный — нестационарный; одномерный — многомерный).
Термин «оценивание» относится к классу статистических методов, которые используются с целью получения представления о значении одного или нескольких параметров с максимально возможной точностью.
Пусть дана выборка наблюдений Z, zn, полученная из генеральной совокупности, распределение которой известно с точностью до параметра 0. Используя указанные наблюдения, необходимо определить 0, которое можно было бы взять в качестве значения параметра 0 (точечная оценка), или интервал [ 0В, вн ], о котором можно утверждать, что он с заданной вероятностью содержит это значение (интервальная оценка).
Поскольку наблюдения являются случайными, то результаты наблюдений (статистики), используемые для оценки параметра 0, для отдельных выборок будут отличаться от истинного. Поэтому нельзя найти оценку, принимающую для всех возможных выборок значения, близкие к 0. В этих случаях рекомендуется ограничиваться такой процедурой оценивания, которая давала бы «хорошие» результаты в среднем при многократном ее использовании или имела бы большую вероятность «успеха».
Основными свойствами, которым должны удовлетворять искомые оценки, являются состоятельность, несмещенность и эффективность.
Состоятельность — свойство оценки параметра сходиться по вероятности к его истинному значению при увеличении числа наблюдений п этого параметра, т. е. Иш /*{0-0 >е} = 0.
л—U I J
Несмещенность — свойство оценки не иметь систематического отклонения от истинного значения параметра, т. е. Л/Г§1 = 0 . Условием состоятельности несмещенной оценки является Z>Te —>0 при
Эффективность — свойство оценки обладать наименьшей диспер-
ложительным числом, зависящим от функции распределения P(z/Q)
объема выборки п и смещения оценки b = М
Приведенные неравенства (10.1), (10.2) носят название неравенств Рао-Крамера. Если в (10.2) достигается равенство, то дисперсия
оценки 2)Ге1 = Z>min достигает своего наименьшего значения и оценка 0 является эффективной. Эффективностью любой другой оценки называется отношение АшпГбІ/^Г®] • Если имеется единственная
несмещенная оценка с наименьшей дисперсией, то ее называют несмещенной оценкой с равномерно наименьшей дисперсией.
Общей характеристикой точности статистических оценок является средний риск. Для вычисления среднего риска необходимо задать функцию потерь — некоторую функцию от оценки и истинного значения оцениваемого параметра.
Наиболее распространенными функциями потерь являются:
• простая п(в, ё) = с-б(0-е), где с>0, 8 — дельта-функция;
•
квадратичная П (в, в)=(в—0j ;
Среднее по всем возможным выборкам значение функции потерь носит название условного риска: r(0)= [ п(0, 0Wz/0)dz ■ Точечная
оценка, минимизирующая условный риск при квадратичной функции потерь, называется оценкой наименьших квадратов.
В случае линейной зависимости между 0 и z оценки наименьших квадратов являются линейной функцией измерений Z — Эти оценки асимптотически нормальны и обладают свойствами состоятельности, несмещенности, эффективности для широкого класса распределений P(zl 0), имеющих конечные вторые моменты. Простота их нахождения и многообразие модификаций сделали эти оценки наиболее распространенными в практике обработки данных измерений и испытаний.
Мода распределения P(z/0) минимизирует условный риск при простой функции потерь и носит название оценки максимального правдоподобия. Оценки максимального правдоподобия также асимптотически нормальны и обладают асимптотическими свойствами состоятельности, несмещенности и эффективности. Однако при малых объемах выборок эти свойства могут не сохраняться. В том случае, если плотность вероятности (функция правдоподобия) может быть представлена в виде P(z/в) = P(T/Q)giz), несмещенную оценку с минимальной дисперсией всегда можно найти в виде функции достаточной статистики, если последняя существует (где Т — достаточная
статистика, такая, что условное распределение величины z при заданном значении Т не зависит от 0). Способ нахождения этой оцен-
А
ки состоит в следующем: если 0 — некоторая несмещенная оценка параметра 0, то M[Q/T(z)] и является искомой оценкой.
Если оценка максимального правдоподобия единственна, она зависит от измерений только через достаточную статистику. В этом случае способ нахождения оценки максимального правдоподобия следующий: если уравнение M[T(z) = T(z) имеет решение 0, то 0 — оценка максимального правдоподобия.
Если об оцениваемом параметре есть некоторые априорные сведения, описываемые априорным распределением Р0 (0), то условный риск осредняют по параметру 0 и получают средний риск:
оо оо
R= J J П(0,0)Лг/0)/о(0)^0-
—оо — оо
Оценки, полученные из условия минимизации среднего риска, называются байесовскими, так как основаны на формуле Байеса, согласно которой P(z/Q)P0(Q) = P(0/z)P(z) . Так, математическое ожидание апостериорного распределения P(Q/z) минимизирует средний риск при квадратичной функции потерь, а мода этого распределения — при простой функции потерь.
Перечисленные оценки являются наиболее распространенными в практике обработки данных испытаний. Заметим, что при нормальном законе распределения P(z/0) оценки наименьших квадратов, максимального правдоподобия и байесовские совпадают.
В табл. 10.1 приведены примеры получения несмещенных и эффективных оценок стационарных одномерных детерминированных параметров различных распределений, в табл. 10.2 указаны области применения различных распределений.