Непараметрическая статистика
Непараметрическая статистика — совокупность методов, работающих при относительно слабых допущениях функции распределения исходных данных[1].
Используется для проверки гипотез, где вероятностная модель ситуации не может быть определена в терминах какого-либо параметрического семейства распределений вероятностей[2].
По мнению Орлова А. И. непараметрическая статистика структурно состоит из[2]:
- методов, совмещающих параметрические и непараметрические элементы;
- ранговых статистических методов;
- непараметрических оценок функций.
Область применения[править]
Холландер[3] выделяет ряд задач, по которым применяются непараметрические методы решения:
- Задачи о распределении дихотомических (вида да/нет) данных для одной и более выборок и их сравнении;
- Задачи о разнице средних значений для одной выборки;
- Задачи о разнице средних значений для двух и более выборок;
- Задачи о разнице двух и более выборок по иным признакам (распределение и др.);
- Задачи о влияния одного и более факторов на разницу средних значений для двух и более выборок;
- Задачи о взаимосвязи/независимости двух выборов;
- Задачи о регрессионном анализе отношений между зависимой и независимыми переменными;
- Задачи о проверке гипотез на естественных классах распределения, таких как:
- класс с повышением вероятности отказа (increasing failure rate class — IFR),
- класс с повышением усредненной вероятности отказа (increasing failure rate average class — IFRA),
- класс с принципом «новый лучше старого» (new better than used class — NBU),
- класс с принципом «новый лучше старого в ожидании» (new better than used in expectation class — NBUE),
- класс с уменьшением среднего остаточного ресурса (decreasing mean residual life class — DMRL),
- класс с возврастающе-убывающим средним остаточным ресурсом (initially increasing then decreasing mean residual life class — IDMRL).
- Задачи об оценке плотности распределения генеральной совокупности по выборке;
- Задачи об вейвлет анализе функции неизвестного распределения;
- Задачи об анализе функций распределения с использованием сглаживания;
- Задачи о выборки множеств ранжированных наборов;
- Задачи с использованием байесовской статистики и метода байесовского обновления.
История[править]
Среди ранних непараметрических статистик — медиана (13-й век или ранее, использовалась в оценке Эдварда Райта, 1599) и критерий знаков Джона Арбетнота (1710) при анализе соотношения полов человека при рождении.[4]
Согласно Холландеру[5] начало разработки непараметрической статистики можно оценить с нескольких позиций:
- с 1936 года — по мнению Сэвиджа[6] 1936 год можно обозначить как истинное начало разработки непараметрической статистики, означенное публикацией статьи Хотеллинга и Пабста[7] о ранговой корреляции;
- с 1900, 1911, 1925 года — по мнению Шеффе[8] с опорой на содержание статей Пирсона[9][10] и на наличие критерия знака в первом издании Фишера «Статистические методы для научных работников» Фишера[11].
Профильные источники[править]
Согласно Холландеру[12] по данной теме издается «Журнал непараметрической статистики» (Journal of Nonparametric Statistics)[13].
Примечания[править]
- ↑ Тюрин Ю.Н., Шмерлинг Д.С. Непараметрические методы статистики // Социология. — 2004. — № 18. — С. 154.
- ↑ 2,0 2,1 Орлов, 2015
- ↑ Hollander, 2013, vii - xi
- ↑ Conover W.J. Practical Nonparametric Statistics. — Wiley, 1999. — 157–176 с. — ISBN 0-471-16068-7.
- ↑ Hollander, 2013, с. 9
- ↑ Savage, I. R. Bibliography of nonparametric statistics and related topics // Journal of the American Statistical Association. — 1953. — № 48. — С. 844–906.
- ↑ Hotelling, H., M. R. Pabst Rank correlation and tests of significance involving no assumption of normality // Annals of Mathematical Statistics. — 1936. — № 7. — С. 29–43.
- ↑ Scheffe H. Statistical inference in the non-parametric case // Annals of Mathematical Statistics. — 1943. — № 14. — С. 305–332.
- ↑ Pearson K. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling // Philosophical Magazine Series 5. — № 50. — С. 157–175.
- ↑ Pearson K. On the probability that two independent distributions of frequency are really samples from the same population // Biometrika. — 1911. — № 8. — С. 250–254.
- ↑ Fisher, R. A. Statistical Methods for Research Workers. — Edinburgh: Oliver & Boyd, 1925.
- ↑ Hollander, 2013, с. 10
- ↑ Journal of Nonparametric Statistics англ.. Taylor & Francis Group.
Литература[править]
- Myles Hollander, Douglas A. Wolfe, Eric Chicken Nonparametric Statistical Methods. — John Wiley & Sons, Inc., 2013. — 848 с. — ISBN 978-1-119-19603-7.
- Орлов А.И. Структура непараметрической статистики (обобщающая статья) // Заводская лаборатория. Диагностика материалов. — 2015. — Vol. 81. — № 7. — С. 68. — ISSN 2588-0187.
![]() | Одним из источников, использованных при создании данной статьи, является статья из википроекта «Руниверсалис» («Руни», руни.рф) под названием «Непараметрическая статистика», расположенная по адресу:
Материал указанной статьи полностью или частично использован в Циклопедии по лицензии CC BY-SA. Всем участникам Руниверсалиса предлагается прочитать «Обращение к участникам Руниверсалиса» основателя Циклопедии и «Почему Циклопедия?». |
---|