"Статистика Петуніна" (p-статистика) - міра близькості між вибірками. Використовується для перевірки гіпотези про рівність функція розподілуфункцій розподілу двох вибірок.
Розглянемо дві Генеральна сукупність вимірівгенеральні сукупності G та G' та відповідні функції розподілу F_G та F_(G'). Нехай x=(x_1, x_2, ..., x_n)\in(G) та x=((x')_1, (x')_2, ..., (x')_m)\in(G'), а (x)_((1))\leq(x)_((2))\leq...\leq(x)_((n)) та (x')_((1))\leq(x')_((2))\leq...\leq(x')_((m)) - відповідні порядкові статистики. Припустимо, що F_G(u)=F_(G')(u), тоді
p(A_(ij))=P((x')_(k)\in(x_((i)), x_((j))))=p_(ij)=\frac(j-i)(n+1).
Якщо маємо вибірку (x')\in((x')_((1)), (x')_((2)), ..., (x')_((m))), можемо знайти частоту h_(ij) випадкові події A_(ij) та довірчі інтервали ((p)^((1))_(ij), (p)^((2))_(ij)) для ймовірності p_(ij) при заданому рівні значущості \beta, тобто B=\(p_(ij)\in((p)^((1))_(ij), (p)^((2))_(ij))\), p(B)=1-\beta. Згідно з . Van der Waerden B.L. Mathematische Statistic. - Springer-Verlag, Berlin, 1957; English. transl. of 2nd (1965) ed. Springer-Verlag, Berlin and New York, 1969
p^((1))_(ij)=\frac(h_(ij)m+\frac(g^2)(2)-(g)\sqrt(h_(ij)(1-h_(ij))m+\frac(g^2)(4)(m+g^2)p^((2))_(ij)=\frac(h_(ij)m+\frac(g^2)(2)+(g)\sqrt(h_(ij)(1-h_(ij))m+\frac(g^2)(4)(m+g^2)
,
де g задовольняє умову \phi(g)=1-\frac(\beta)(2) (\phi(g) - щільність нормального розподілу). Згідно з Петунін Ю.І., Клюшин Д.А., Ганіна К.П., Бородай Н.В., Андрушків Р.І. Комп’ютерна діагностика раку молочної залози // Вісник Київскього університету. Сер. кібернетика. — 2001. —- Вип. 2. — С. 58–68. покладемо g=3.
Позначимо через N всі довірчі інтервали I_(ij)=(p^((1))_(ij), p^((2))_(ij)) (N=\frac(n(n-1))(2)) та L - число інтервалів I_(ij), які містять ймовірність p_(ij), тобто p_(ij)\in(I_(ij. Покладемо
h=\rho(x,x')=\frac(L)(N)
Статистика h називаєтся p-статистикою (статистикою Петуніна), вона є мірою близькості \rho(x,x') між вибірками x та x'.
Примітки
Джерела
Клюшин Д.А., Петунин Ю.И. Непараметрический критерий эквивалентности генеральных совокупностей, основанный на мере близости между выборками // Український математичний журнал. - 2003. - т.55, № 2. - С.147-163.
uk.wikipedia.org