Спросить
Войти
Категория: Математика

ОЦЕНКИ БИНОМИАЛЬНОЙ ВЕРОЯТНОСТИ С ОГРАНИЧЕНИЯМИ НА ИХ D-РИСКИ

Автор: Салимов Рустем Фаридович

УЧЕНЫЕ ЗАПИСКИ КАЗАНСКОГО УНИВЕРСИТЕТА. СЕРИЯ ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

2020, Т. 162, кн. 1 С. 91-97

ISSN 2541-7746 (Print) ISSN 2500-2198 (Online)

УДК 519.233.22

doi: 10.26907/2541-7746.2020.1.91-97

ОЦЕНКИ БИНОМИАЛЬНОЙ ВЕРОЯТНОСТИ С ОГРАНИЧЕНИЯМИ НА ИХ d-РИСКИ

Р.Ф. Салимое, И.А. Кареев

Казанский (Приволжский) федеральный университет, г. Казань, 420008, Россия

Рассмотрена стандартная для аттестации штучной продукции задача оценки доли некондиционных изделий в рамках байесовской парадигмы к проблеме оптимального оценивания. Эта задача сведена к оценке вероятности успеха испытания в биномиальной схеме при квадратичной функции потерь при априорном бета-распределении. В отличие от классического подхода к оцениванию параметра, предложено использовать й-апостериорный подход к построению гарантийных статистических решений. Построены оценки с равномерно минимальным й-риском, а также байесовская оценка, которая необходима для построения й-гарантийной последовательной процедуры «первого перескока». Последовательная процедура приводит к значительному уменьшению объёму инспекции партии продукции. В связи с этим решается задача планирования объёма испытаний, гарантирующего заданное ограничение на й-риск.

Оценка вероятности в осуществления некоторого события по данным наблюдений в схеме Бернулли - классическая задача математической статистики [4]. В ряде прикладных исследований, например при аттестации продукции, выпускаемой предприятием, по качественному признаку, значение вероятности в является реализацией случайной величины. В таком случае более естественно решать задачу оценки в в рамках байесовской парадигмы. В настоящей статье в случае выборки фиксированного объёма п строятся байесовская и с равномерно минимальным ё-риском (см. [5-7]) оценки параметра в при квадратичной функции потерь (определение функции ё-риска процедуры статистического вывода см. [8]). В качестве априорного распределения выбирается бета-распределение, которое обладает большим разнообразием форм функции плотности [9] и которое обычно используется при построении статистических процедур приёмочного контроля [10]. Вычисляются ё-риски этих оценок, развиваются методы определения минимального объёма выборки, гарантирующие заданные ограничения на ё-риск оценки.

Планирование объёма испытаний с заданным ограничением на квадратичный риск представляет незначительный интерес для практики, более естественно использовать функцию потерь типа 1-0, определяющую относительную ошибку оценки. Как известно, необходимый объём выборки как наименьший объём наблюдений, при котором существует гарантийный статистический вывод, определяется по риску минимаксной оценки [11]. Построение такой оценки обычно основывается

Аннотация

Введение

на отыскании так называемого «наименее благоприятного априорного распределения», которое при функции потерь типа 1-0 является дискретным и сосредоточенным в конечном числе точек [12]. Таким образом, в рамках небайесовской статистики планирование объёма наблюдений по заданным ограничениям на точность и надёжность оценки является практически неразрешимой задачей. В настоящей статье предлагается решение этой задачи в рамках с!-апостериорного подхода к проблеме гарантийности статистического вывода, когда ограничения делаются на дисперсию оценки.

1. Оценка вероятности по фиксированному объёму выборки

Пусть (Хх,... ,Хп) - случайная выборка объёма п из двухточечного распределения (Бернулли) и в = Р(Хх = 1). Предполагается, что в есть реализация случайной величины $ с априорным бета-распределением, функция плотности которого

1

[(1 - ву-\\ в € [0; 1], р,д> 0.

в(р,д)

В схеме испытаний Бернулли существует достаточная статистика

5>

имеющая биномиальное распределение с параметрам в и п так, что апостериорное распределение $ зависит только от значения этой статистики. Априорное бета-распределение является сопряженным, и, как известно, апостериорное распределение является также бета-распределением с параметрами Т + р и п — Т + р + д.

Предложение 1. Баейсовская оценка параметра в при квадратичной функции потерь имеет вид

Т + р

вв (Т)= + + + , (1)

п + р + д

в то время как оценка с равномерно минимальным !-риском (и-оценка) имеет следующем вид:

р + 1

& п + 1 + р + д р + п

п + 1 + р + д&

р + к р + к +1 п +1+ р + д& п +1+ р + д

если г = 0,

если г = п,

если 1 < г < п — 1.

Доказательство. При квадратичной функции потерь апостериорный риск равен сумме дисперсии апостериорного распределения и квадрата отклонения апостериорного среднего от принятого решения:

м(! | г)

(г + р)(п — г + д)

(п + р + д)2(п + 1 + р + д)

+ ! —

г + р

п + р + д

2

Таким образом, байесовская оценка, которая минимизирует (3) по с!, равна правой части (1).

Чтобы найти оценку с равномерно минимальным 3-риском, представим (3) в виде квадратичной функции г

М(3 I г) = (_*_т + ; + +1+ р + £ +

(п + р + д)(п + 1 + р + д) (п + р + д)(п + 1 + р + д)

-р(1+ р)- - 2р3 +

(п + р + д)(1+ п + р + д) п + р + д

Минимум этой функции достигается в точке

г* = 3(п +1+ р + д) - р - 2.

Так как Т может принимать только целые числа от 0 до п, минимум апостериорного риска будет достигаться в ближайшей к г* точке от 0 до п

р + 1

0, для любых 3 <

п, для любых 3 ^

п + 1 + р + д

р + п п + 1 + р + д

1 Л р + к ^ Л ^ р + к +1 71 1

к, для любых --- ^ а < ---, к = 1,... ,п — 1.

п+1+р+д п+1+р+д

Таким образом, любая оценка, удовлетворяющая условию (2), будет являться оценкой с равномерно минимальным 3-риском.

Предложение 2. 3 -риск байесовской оценки равен

*(3 I вв ) = а(1 — !) , (4)

V & В п + 1+ р + д& У 7

а 3 -риск оценки с равномерно .минимальным 3 -риском 3,(1 — 3) 1

ЭТ(3I0и)=

п + р + д 4(п + р + д)(п +1+ р + д)

Наименьший объём наблюдений, при котором существует оценка в с заданным ограничением г на квадратичный риск, равен

п = п(г) = 4--1 — р — д. (5)

Доказательство. 3-риск байесовской оценки можно найти, если подставить точку г = 3(п+р+д)—р, в которой достигается равенство в в (г) = 3, в уравнение (3) для апостериорного риска. После несложных преобразований получаем, что 3-риск байесовской оценки имеет вид (4).

Пусть

©в = ! 3 : 3 = г = о, 1,..., п

п + р + д

есть множество значений байесовской оценки. Если 1/2 € ©в, то максимум 3-риска равен 1/4(п + 1 + р + д). Таким образом, целая часть (с округлением вверх)

п = п(г) =--1 — р — д

есть минимальный объём выборки, обеспечивающим заданное ограничение г на 3 -риск байесовской оценки: Ш(31 в в) ^ г.

Легко видеть, что байесовская оценка вв может быть представлена в том же виде (2), что и оценка с равномерно минимальным 3-риском, то есть её можно было бы назвать оценкой с равномерно минимальным 3-риском. Однако такое название претенциозно, поскольку относится только к оценкам, которые принимают все свои значения внутри носителя байесовской оценки. Понятно, что из всевозможных оценок этому свойству удовлетворяет только байесовская оценка.

Другая оценка, претендующая на звание и-оценки [5, 6], получается из выражения для г*:

Т + р +1/2

ви = —ГТ1-1—.

п + 1 + р + д

Ясно, что 3-риск этой оценки имеет вид

3,(1 — 3) 1

| ви) =

п + р + д 4(п + р + д)(п +1+ р + д) при 3, принадлежащих носителю ви . □

Сравнивать в в, ви по 3-риску в каждой точке 3 не имеет смысла, но их можно сравнить по максимальным значениям 3-рисков. Если не обращать внимание на возможные значения 3, а считать 3 € [0; 1], то, как и у байесовской оценки, максимум 3-риска оценки ви достигается при 3 = 1/2 и равен тому же значению 1/4(п + 1 + р + д). Следовательно, минимальный требуемый объём наблюдений для гарантийной оценки ви не превосходит целой части (с округлением вверх) числа п, то есть совпадает с минимальным требуемым объёмом гарантийности баейсовской оценки.

Оценка с равномерно-минимальным 3-риском является минимальной в классе всех оценок, 3-риск которых имеет носитель, совпадающий с 3-риском оценки ви, следовательно, п является необходимым объёмом выборки п* , то есть наименьшим объёмом наблюдений, при котором существует 3-гарантийная оценка в [11].

2. Последовательная 3-гарантийная процедура оценивания

В соответствии с определением процедуры первого перескока [8] её область продолжения наблюдений определяется заданным ограничением г на апостериорный риск (3), в который вместо 3 подставляется байесовская оценка. Следовательно, момент остановки этой процедуры определяется как

(£ X* + р)(п — £ X* + д)

V = шт < п : ---2:-г < г

(п + р + д)2 (п + 1 + р + д)

Поскольку апостериорный риск есть монотонно убывающая функция от статистики Т, процедура первого перескока всегда останавливается на шаге, не превосходящем необходимый объём выборки (5).

Если истинное значение в превосходит 0.1, то естественно ограничение г должно иметь порядок 0.01 (точность оценки вероятности должна быть хотя бы на порядок меньше самого значения вероятности). Когда априорное распределение не является вырожденным (практически сосредоточенным в одной точке), то необходимый объём выборки имеет порядок 2 • 103 - 2.5 • 103 . Таким образом, как и в случае классических (небайесовских) оценок вероятности, приемлемые ограничения

на точность и надёжность оценивания возможны лишь при практически огромных объёмах наблюдений. Процедура первого перескока в среднем даёт несколько меньший объём наблюдений, но, как показывают результаты статистического моделирования, порядок объёма наблюдений 103 остаётся неизменным.

Благодарности. Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 18-31-00094.

Литература

1. Salimov R.F., Turilova E.A., Volodin I.N. Sequential procedures for assessing the percentage of harmful impurities with the given limitations on the accuracy and reliability of statistical inference // 16th Int. Multidiscip. Sci. GeoConf. SGEM 2016, SGEM Vienna GREEN Ext. Sci. Sess.: SGEM2016 Conf. Proc. - 2016. - Book 1, V. 4. - P. 175-180. -doi: 10.5593/SGEM2016/HB14/S01.023.
2. Salimov R.F., Yang S.-F., Turilova E.A., Volodin I.N. Estimation of the mean value for the normal distribution with constraints on d-risk // Lobachevskii J. Math. - 2018. -V. 39, No 3. - P. 377-387. - doi: 10.1134/S1995080218030174.
3. Salimov R.F., Volodin I.N., Nasibullina N.F. Sequential d-guaranteed estimate of the normal mean with bounded relative error // Учен. зап. Казан. ун-та. Сер. Физ.-матем. науки. - 2019. - Т. 161, кн. 1. - С. 145-151. - doi: 10.26907/2541-7746.2019.1.145-151.
4. Леман Э. Теория точечного оценивания. - М.: Наука, 1991. - 448 c.
5. Simushkin S.V., Volodin I.N. Statistical inference with a minimal d-risk // Lect. Notes Math. - 1983. - V. 1021. - P. 629-636. - doi: 10.1007/BFb0072958.
6. Симушкин С.В., Володин И.Н. Статистические выводы с минимальным d-риском // Исслед. по прикл. матем. - 1984. - Вып. 11, ч. 2. - С. 25-39.
7. Заикин A.A. Оценки с асимптотически равномерно минимальным d-риском // Теория вероятностей и ее применение. - 2018. - Т. 63, Вып. 3. - C. 609-618. - doi: 10.4213/tvp5193.
8. Володин И.Н. Гарантийные процедуры статистического вывода (определение объема выборки) // Исслед. по прикл. матем. - 1984. - Вып. 10. - С. 13-53.
9. Gupta A.K., Nadarajah S. Handbook of Beta Distribution and Applications. - N. Y.: Marcel Dekker, 2004. - 600 p.
10. Беляев Ю.К. Вероятностные методы выборочного контроля. - М.: Наука, 1975. -408 c.
11. Володин И.Н. Оптимальный объем выборки в процедурах статистического вывода // Изв. вузов. Матем. - 1978. - № 21. - С. 33-45.
12. Луценко М.М. Теоретико-игровой метод оценки параметра биномиального закона // Теория вероятностей и ее применение. - 1990. - Т. 35, Вып. 3. - С. 471-481.

Поступила в редакцию 24.12.2019

Салимов Рустем Фаридович, старший преподаватель кафедры математической статистики

Казанский (Приволжский) федеральный университет ул. Кремлевская, д. 18, г. Казань, 420008, Россия

E-mail: rustem.salimov@kpfu.ru

Кареев Искандер Амирович, кандидат физико-математических наук, доцент кафедры математической статистики

Казанский (Приволжский) федеральный университет

ул. Кремлевская, д. 18, г. Казань, 420008, Россия E-mail: kareevia@gmail.com

ISSN 2541-7746 (Print) ISSN 2500-2198 (Online) UCHENYE ZAPISKI KAZANSKOGO UNIVERSITETA. SERIYA FIZIKO-MATEMATICHESKIE NAUKI (Proceedings of Kazan University. Physics and Mathematics Series)

2020, vol. 162, no. 1, pp. 91-97

doi: 10.26907/2541-7746.2020.1.91-97

Binomial Probability Estimates with Restrictions on Their d-Risks

R.F. Salimov* , I.A. Kareev**

Kazan Federal University, Kazan, 420008 Russia E-mail: * rustem.salimov@kpfu.ru, ** kareevia@gmail.com

Received December 24, 2019 Abstract

The standard problem of assessing the proportion of substandard products was considered in the framework of the Bayesian paradigm in the sense of the problem of optimal estimation. This problem was reduced to assessing the probability of success in a binomial scheme with a quadratic loss function for which a prior beta distribution applies. Unlike the classical approach to parameter estimation, we used the d-posterior approach to construct statistical guarantee solutions. Estimates with the uniformly minimal d-risk and the Bayesian estimate are constructed. The last one is necessary for designing a d-guaranteed sequential "first crossing" procedure. The sequential procedure leads to significant reduction of the inspection volume of products batch. In this regard, the task of planning the volume of tests that guarantees a given restriction on d-risk was solved.

Acknowledgments. The study was supported by the Russian Foundation for Basic Research (project no. 18-31-00094).

References

1. Salimov R.F., Turilova E.A., Volodin I.N. Sequential procedures for assessing the percentage of harmful impurietes with the given limitations on the accuracy and reliability of statistical inference. Proc. 16th Int. Multidiscip. Sci. GeoConf. SGEM 2016, SGEM Vienna GREEN Ext. Sci. Sess., 2016, book 1, vol. 4, pp. 175-180. doi: 10.5593/SGEM2016/HB14/S01.023.
2. Salimov R.F., Yang S.-F., Turilova E.A., Volodin I.N. Estimation of the mean value for the normal distribution with constrains on d-risk. Lobachevskii J. Math., 2018, vol. 39, no. 3, pp. 377-387. doi: 10.1134/S1995080218030174.
3. Salimov R.F., Volodin I.N., Nasibullina N.F. Sequential d-guaranteed estimate of the normal mean with bounded relative error. Uchenye Zapiski Kazanskogo Universiteta. Seriya Fiziko-Matematicheskie Nauki, 2019, vol. 161, no. 1, pp. 145-151. doi: 10.26907/25417746.2019.1.145-151.
4. Lehmann E.L. Theory of Point Estimation. John Wiley Sons, 1983. 506 p.
5. Simushkin S.V., Volodin I.N. Statistical inference with a minimal d-risk. Lect. Notes Math., 1983, vol. 1021, pp. 629-636. doi: 10.1007/BFb0072958.
6. Simushkin S.V., Volodin I.N. Statistical inference with minimum d-risk. J. Sov. Math, 1988, vol. 42, no. 1, pp. 1464-1472. doi: 10.1007/BF01098858.
7. Zaikin A.A. Estimates with asymptotically uniformly minimal d-risk. Theory Probab. Its Appl., 2019, vol. 63, no. 3, pp. 500-505. doi: 10.1137/S0040585X97T989192.
8. Volodin I.N. Guaranteed statistical inference procedures (determination of the optimal sample size). J. Sov. Math., 1989, vol. 44, no. 5, pp. 568-600. doi: 10.1007/BF01095166.
9. Gupta A.K., Nadarajah S. Handbook of Beta Distribution and Applications. New York, Marcel Dekker, 2004. 600 p.
10. Belyayev Yu.K. Veroyatnostnyye metody vyborochnogo kontrolya [Probabilistic Methods in Sample Control]. Moscow, Nauka, 1975. 408 p. (In Russian)
11. Volodin I.N. Optimum sample size in statistical inference procedures. Izv. Vyssh. Uchebn. Zaved., Mat., 1978, no. 21, pp. 33-45. (In Russian)
12. Lutsenko M.M. A game theoretic method for estimation of a parameter of the binomial law. Theory Probab. Its Appl., 1990, vol. 35, no. 3, pp. 467-477. doi: 10.1137/1135066.

/ Для цитирования: Салимов Р.Ф., Кареев И.А. Оценки биномиальной вероятности ( с ограничениями на их й-риски // Учен. зап. Казан. ун-та. Сер. Физ.-матем. науки. -\\ 2020. - Т. 162, кн. 1. - С. 91-97. - doi: 10.26907/2541-7746.2020.1.91-97.

/ For citation : Salimov R.F., Kareev I.A. Binomial probability estimates with restrictions \\ ( on their d-risks. Uchenye Zapiski Kazanskogo Universiteta. Seriya Fiziko-Matematicheskie \\ \\ Nauki, 2020, vol. 162, no. 1, pp. 91-97. doi: 10.26907/2541-7746.2020.1.91-97. (In Russian) /

ОЦЕНКА БИНОМИАЛЬНОЙ ВЕРОЯТНОСТИ БАЙЕСОВСКАЯ ОЦЕНКА ОЦЕНКА С РАВНОМЕРНО-МИНИМАЛЬНЫМ d-РИСКОМ КВАДРАТИЧНАЯ ФУНКЦИЯ ПОТЕРЬ АПРИОРНОЕ БЕТА-РАСПРЕДЕЛЕНИЕ НЕОБХОДИМЫЙ ОБЪЁМ ВЫБОРКИ binomial probability estimate bayesian estimate estimate with uniformly minimal d-risk quadratic loss function
Другие работы в данной теме:
Контакты
Обратная связь
support@uchimsya.com
Учимся
Общая информация
Разделы
Тесты