Расширение данных
Расширение данных (англ. data augmentation) — одна из процедур искусственного увеличения объёмов данных, задействованных в задачах машинного обучения для тренировки классификационной схемы на основе нейронной сети.
Краткая информация[править]
Расширение данных заключается в дополнении тренировочного массива синтетическими данными, сгенерированными на основе существующих данных с помощью какой-либо их трансформации. Как правило, расширение данных применяется в тех случаях, когда доступный объём тренировочной информации недостаточен для проведения эффективного машинного обучения нейронной сети[1]. Полученные расширенные данные не следует путать с синтетическими данными, так как синтетические данные полностью генерируются искусственно, а расширенные — на базе реальной информации путём её непринципиальной в рамках решаемой задачи модификации[2].
В ряде случаев расширение данных позволяет внести в данные дополнительное разнообразие и уменьшить вероятность возникновения эффекта переобучения (оверфиттинга), таким образом осуществляя регуляризацию решения. Помимо этого, также повышается шанс обнаружения неявных закономерностей, которые могут не проявить себя на исходном тренировочном наборе[3].
Стандартные алгоритмы расширение данных представлены во многих библиотеках и различных программных пакетах обработки данных, таких как, например, TenzorFlow.
Источники[править]
- ↑ Abid Ali Awan A Complete Guide to Data Augmentation англ.. Проверено 23 октября 2024.
- ↑ Data augmentation: What is it? What’s it for? англ. (2014-05-07). Проверено 23 октября 2024.
- ↑ Abhishek Jain Data Augmentation англ.. Проверено 23 октября 2024.
![]() | Одним из источников, использованных при создании данной статьи, является статья из википроекта «Руниверсалис» («Руни», руни.рф) под названием «Расширение данных», расположенная по адресу:
Материал указанной статьи полностью или частично использован в Циклопедии по лицензии CC BY-SA. Всем участникам Руниверсалиса предлагается прочитать «Обращение к участникам Руниверсалиса» основателя Циклопедии и «Почему Циклопедия?». |
---|