Расширение данных

Материал из Циклопедии
Перейти к навигации Перейти к поиску
Расширение данных с помощью эластичных преобразований изображения

Расширение данных (англ. data augmentation) — одна из процедур искусственного увеличения объёмов данных, задействованных в задачах машинного обучения для тренировки классификационной схемы на основе нейронной сети.

Краткая информация[править]

Расширение данных заключается в дополнении тренировочного массива синтетическими данными, сгенерированными на основе существующих данных с помощью какой-либо их трансформации. Как правило, расширение данных применяется в тех случаях, когда доступный объём тренировочной информации недостаточен для проведения эффективного машинного обучения нейронной сети[1]. Полученные расширенные данные не следует путать с синтетическими данными, так как синтетические данные полностью генерируются искусственно, а расширенные — на базе реальной информации путём её непринципиальной в рамках решаемой задачи модификации[2].

В ряде случаев расширение данных позволяет внести в данные дополнительное разнообразие и уменьшить вероятность возникновения эффекта переобучения (оверфиттинга), таким образом осуществляя регуляризацию решения. Помимо этого, также повышается шанс обнаружения неявных закономерностей, которые могут не проявить себя на исходном тренировочном наборе[3].

Стандартные алгоритмы расширение данных представлены во многих библиотеках и различных программных пакетах обработки данных, таких как, например, TenzorFlow.

Источники[править]

  1. Abid Ali Awan A Complete Guide to Data Augmentation англ.. Проверено 23 октября 2024.
  2. Data augmentation: What is it? What’s it for? англ. (2014-05-07). Проверено 23 октября 2024.
  3. Abhishek Jain Data Augmentation англ.. Проверено 23 октября 2024.
Руниверсалис

Одним из источников, использованных при создании данной статьи, является статья из википроекта «Руниверсалис» («Руни», руни.рф) под названием «Расширение данных», расположенная по адресу:

Материал указанной статьи полностью или частично использован в Циклопедии по лицензии CC BY-SA.

Всем участникам Руниверсалиса предлагается прочитать «Обращение к участникам Руниверсалиса» основателя Циклопедии и «Почему Циклопедия?».