Данные

Материал из Циклопедии
Перейти к навигации Перейти к поиску
Сколько в мире данных? // ПостНаука (17 апр. 2018 г.) [1:57]
Данные — новая нефть: как big data изменила нашу жизнь / Ольга Максименкова и Антон Чунаев // ПостНаука (9 дек. 2021 г.) [1:24:25]

Данные (от лат. data [1]) — аналог многозначному понятию информация: либо полный синоним, либо такой синоним, что лишён («очищен от») некоторых оценочных смыслов в отношении пользы, точности, адекватности, информационной сложности, достоверности, подверженности толкованию и подобного.

Данные, как информация в наиобщем смысле[править]

Данные выдаются датчиками и передатчиками, собираются и хранятся на носителях, сообщаются в сигнальных системах, анализируются и преобразуются согласно условиям и правилам вычислений, абстрагируются в знаковых системах. Данные могут быть доступны человеческому восприятию, мышлению — через схемы представления данных. Наиобщее понятие о данных обращает внимание на то, как информация и знания выдаются откуда-то и принимаются чем-то или кем-то в конкретном виде, подлежащем обработке, абстракции или анализу, дабы в итоге предстать информацией для конечного адресата: сознания либо информационной технологии.

Данные могут нести информацию целиком и непосредственно; могут — условно, неявно; однако, в общем случае, — также могут быть лишены известной информационной ценности. Неполнота или бесполезность данных может быть обусловлена по-разному: данные бывают неполными (недополученными), испорченными (от шума, помех, побочных эффектов…), периодическими, устаревшими, закодированными, зашифрованными, фрагментированными, зависимыми, обфусцированными («запутанными»)… Польза конкретных данных, помимо всего этого, может быть скомпрометирована контекстом их обработки, — в частности, например, при порче или утере вспомогательных сопроводительных данных, которые по отношению к первичному объёму данных представляются в особом качестве: как так называемые метаданные.

Цифровые данные[править]

В тьюрингской модели о механическом вычислении, программируемом инструкциями произвольного алфавита, «данные» строго и однозначно определены. Говоря об «объёме данных» в памяти компьютера, указывают на количество цифровой информации. Это фундаментальная дискретная мера, наименьшая единица которой — бит, булева единица. Конечный и замкнутый набор данных может кодировать информацию. Код уберегает и обфусцирует прообраз информационной сущности в ходе некоего вычислительного освоения:

В таком смысле данные целиком анализируются, как любая последовательность из одного или нескольких символов (во внекультурном значении, как абстрактные «буквы» или «цифры») некоторого фиксированного алфавита. Наиболее часто задействованы в вычислениях двоичные данные — те данные, что представлены последовательностями символов алфавита {0,1}: «истина» XOR «ложь», tertium non datur. Изначально и поныне (2023 год) данные внутри компьютера в огромном большинстве случаев представлены в двоичном коде и преобразуются параллельно: операции проводятся не поочерёдно над каждым из битов, но сразу, за один вычислительный цикл над множеством бит. Это настолько преобладающий вариант, что, говоря о параллельных вычислениях явно, обычно подразумевают более выраженные случаи параллелизма. Данные, полученные сигналом от аналогового устройства, — такого, как устройство пользовательсткого ввода или датчик сенсора, — могут быть преобразованы в цифровую последовательность через аналого-цифровое преобразование.

Данные, представляющие величи́ны или символы, с которыми операции выполняются цифровым компьютером, представлены физическими состояниями магнитных, оптических, электронных или механических носителей, либо в неявной форме — совокупностью состояний некоторой вычислительной системы. Передача данных проводится ритмичным чередованием формы дискретных сигналов: электрических или оптических.[2]

Данные, перемещаемые по сетям коммуникации: от одного компьютера другому, — в большинстве случаев перемещаются, как фрагментированные последовательные данные, целостность которых восстанавливается вычислительно на основе метаданных, подчинённых той или ной совокупности сетевых протоколов.

Данные, код, программа, текст[править]

Программа — это данные в виде закодированных инструкций для управления работой компьютера или другой машины.[3] Элементы памяти физического компьютера состоят из адреса и машинного сло́ва хранения данных. Высокоструктурированные цифровые данные часто хранятся и сортируются в базах данных: реляционных, таких, как базы данных SQL, или объектно-ориентированных, начиная с MUMPS.

Данные могут быть организованы во множество различных типов структур данных, например: массивы, кортежи, XOR-связные списки, объекты на куче,… Структуры данных могут хранить данные самых разных типов, включая числа, строки, исполняемый машинный код, и, рекурсивно, прочие структуры данных. Данные передаются на компьютер и выводятся из него через периферийные устройства.

При альтернативном использовании двоичные файлы (которые не читаются человеком) иногда называют «данными», в отличие от «текста», удобочитаемого человеком[4]. Общий объем цифровых данных в 2007 году оценивался в 281 миллиард гигабайт (= 281 эксабайт).[5][6] Цифровые данные находятся в трех состояниях: данные в состоянии покоя, данные в пути и данные в использовании.

Аналоговые данные[править]

В аналоговых компьютерах и искусствах обработки сигналов данные — это сигналы, в противопоставление шумам, помехам, интерференции… — всем эффектам среды́, которые решительно не участвуют в вычислениях. Недостаточное освоение сигналов приводит к полной или частичной потере данных, а неверное распознание сигналов среди эффектов ведёт к искажению.

Данные и информация в прикладных областях[править]

Необработанные данные — это произвольные материальные эффекты, воспринятые в качестве хранителя или источника данных, так или иначе. В общем случае, это состояния, периодичные колебания или исторически уникальные развития материальных систем. Состояния психики, покуда они могут нести данные, воспринимаются в таком же ключе: данные объективны, а не субъективны по определению. Абстрактную — символьную, вычислительную, информационную — природу данные обретают, будучи «очищены», обработаны в некоторой области применения. Необработанные данные требуется скорректировать, исключая погрешности и ошибки, неизбежно вносимые материальными процессами добычи данных. Например, показания термометра из открытого арктического местоположения, регистрирующие тропическую температуру. Обработка данных обычно происходит поэтапно, и «обработанные данные» одного этапа могут считаться «необработанными данными» следующего этапа. Полевые данные — это необработанные данные, которые собираются в неконтролируемой среде «на месте».

Данные были охарактеризованы как новая нефть цифровой экономики.[7][8]

Многозначность термина и связанные понятия[править]

Данные, данное, данность в философии — наиболее абстрактная совокупность условий, происходящих непосредственно из среды́, области познания, а не произвольно, не лишь «на веру», минуя собственные побуждения.

Данные, data, DATA — формальный объект в абстрактно-алгебраических теориях категорий и аллегорий, обосновывающих дизайн языков программирования. Дуальный по отношению к данным математический объект — коданные, codata, CODATA.

Источники[править]

  1. «Данные», data, в заявленном тут смысле — поначалу отпричастное существительное plurale tantum. «Данное», как калька жаргонного англоязычного термина datum, — исчислимое, и во множественном числе целиком совпадает исходному термину «данные».
  2. data. Oxford Dictionaries. Проверено 11 октября 2012.
  3. computer program. The Oxford Pocket Dictionary of Current English. Проверено 11 октября 2012.
  4. file(1). OpenBSD Manual Pages (2015-12-24). Проверено 4 февраля 2018.
  5. Paul, Ryan. Study: amount of digital info > global storage capacity, Ars Technics (март 2008 года).
  6. Gantz, John F. The Diverse and Exploding Digital Universe. International Data Corporation via EMC (2008). Проверено 12 марта 2008.
  7. Yonego, Joris Toonders Data Is the New Oil of the Digital Economy (July 23, 2014).
  8. Data is the new oil (July 16, 2018).
 
Общие понятия

Данные · Метаданные · Знания · Метазнание · Представление знаний · База знаний · Онтология · Семантическая паутина

Жёсткие модели

Продукции · Семантические сети · Фреймы · Логическая модель

Мягкие методы

Нейросети · Эволюционное моделирование · Нечёткая логика

Применения

Экспертные системы · Интеллектуальный анализ данных · Извлечение информации · Виртуальные собеседники · Гибридные интеллектуальные системы

Искусственный интеллект · Машинное обучение · Обработка естественного языка