Непараметрическая статистика

Материал из Циклопедии
Перейти к навигации Перейти к поиску

Непараметрическая статистика — совокупность методов, работающих при относительно слабых допущениях функции распределения исходных данных[1].

Используется для проверки гипотез, где вероятностная модель ситуации не может быть определена в терминах какого-либо параметрического семейства распределений вероятностей[2].

По мнению Орлова А. И. непараметрическая статистика структурно состоит из[2]:

  • методов, совмещающих параметрические и непараметрические элементы;
  • ранговых статистических методов;
  • непараметрических оценок функций.

Область применения[править]

Холландер[3] выделяет ряд задач, по которым применяются непараметрические методы решения:

  • Задачи о распределении дихотомических (вида да/нет) данных для одной и более выборок и их сравнении;
  • Задачи о разнице средних значений для одной выборки;
  • Задачи о разнице средних значений для двух и более выборок;
  • Задачи о разнице двух и более выборок по иным признакам (распределение и др.);
  • Задачи о влияния одного и более факторов на разницу средних значений для двух и более выборок;
  • Задачи о взаимосвязи/независимости двух выборов;
  • Задачи о регрессионном анализе отношений между зависимой и независимыми переменными;
  • Задачи о проверке гипотез на естественных классах распределения, таких как:
    • класс с повышением вероятности отказа (increasing failure rate class — IFR),
    • класс с повышением усредненной вероятности отказа (increasing failure rate average class — IFRA),
    • класс с принципом «новый лучше старого» (new better than used class — NBU),
    • класс с принципом «новый лучше старого в ожидании» (new better than used in expectation class — NBUE),
    • класс с уменьшением среднего остаточного ресурса (decreasing mean residual life class — DMRL),
    • класс с возврастающе-убывающим средним остаточным ресурсом (initially increasing then decreasing mean residual life class — IDMRL).
  • Задачи об оценке плотности распределения генеральной совокупности по выборке;
  • Задачи об вейвлет анализе функции неизвестного распределения;
  • Задачи об анализе функций распределения с использованием сглаживания;
  • Задачи о выборки множеств ранжированных наборов;
  • Задачи с использованием байесовской статистики и метода байесовского обновления.

История[править]

Среди ранних непараметрических статистик — медиана (13-й век или ранее, использовалась в оценке Эдварда Райта, 1599) и критерий знаков Джона Арбетнота (1710) при анализе соотношения полов человека при рождении.[4]

Согласно Холландеру[5] начало разработки непараметрической статистики можно оценить с нескольких позиций:

  • с 1936 года — по мнению Сэвиджа[6] 1936 год можно обозначить как истинное начало разработки непараметрической статистики, означенное публикацией статьи Хотеллинга и Пабста[7] о ранговой корреляции;
  • с 1900, 1911, 1925 года — по мнению Шеффе[8] с опорой на содержание статей Пирсона[9][10] и на наличие критерия знака в первом издании Фишера «Статистические методы для научных работников» Фишера[11].

Профильные источники[править]

Согласно Холландеру[12] по данной теме издается «Журнал непараметрической статистики» (Journal of Nonparametric Statistics)[13].

Примечания[править]

  1. Тюрин Ю.Н., Шмерлинг Д.С. Непараметрические методы статистики // Социология. — 2004. — № 18. — С. 154.
  2. 2,0 2,1 Орлов, 2015
  3. Hollander, 2013, vii - xi
  4. Conover W.J. Practical Nonparametric Statistics. — Wiley, 1999. — 157–176 с. — ISBN 0-471-16068-7.
  5. Hollander, 2013, с. 9
  6. Savage, I. R. Bibliography of nonparametric statistics and related topics // Journal of the American Statistical Association. — 1953. — № 48. — С. 844–906.
  7. Hotelling, H., M. R. Pabst Rank correlation and tests of significance involving no assumption of normality // Annals of Mathematical Statistics. — 1936. — № 7. — С. 29–43.
  8. Scheffe H. Statistical inference in the non-parametric case // Annals of Mathematical Statistics. — 1943. — № 14. — С. 305–332.
  9. Pearson K. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling // Philosophical Magazine Series 5. — № 50. — С. 157–175.
  10. Pearson K. On the probability that two independent distributions of frequency are really samples from the same population // Biometrika. — 1911. — № 8. — С. 250–254.
  11. Fisher, R. A. Statistical Methods for Research Workers. — Edinburgh: Oliver & Boyd, 1925.
  12. Hollander, 2013, с. 10
  13. Journal of Nonparametric Statistics англ.. Taylor & Francis Group.

Литература[править]

Руниверсалис

Одним из источников, использованных при создании данной статьи, является статья из википроекта «Руниверсалис» («Руни», руни.рф) под названием «Непараметрическая статистика», расположенная по адресу:

Материал указанной статьи полностью или частично использован в Циклопедии по лицензии CC BY-SA.

Всем участникам Руниверсалиса предлагается прочитать «Обращение к участникам Руниверсалиса» основателя Циклопедии и «Почему Циклопедия?».