Данные
Данные (от лат. data [1]) — аналог многозначному понятию информация: либо полный синоним, либо такой синоним, что лишён («очищен от») некоторых оценочных смыслов в отношении пользы, точности, адекватности, информационной сложности, достоверности, подверженности толкованию и подобного.
Данные, как информация в наиобщем смысле[править]
Данные выдаются датчиками и передатчиками, собираются и хранятся на носителях, сообщаются в сигнальных системах, анализируются и преобразуются согласно условиям и правилам вычислений, абстрагируются в знаковых системах. Данные могут быть доступны человеческому восприятию, мышлению — через схемы представления данных. Наиобщее понятие о данных обращает внимание на то, как информация и знания выдаются откуда-то и принимаются чем-то или кем-то в конкретном виде, подлежащем обработке, абстракции или анализу, дабы в итоге предстать информацией для конечного адресата: сознания либо информационной технологии.
Данные могут нести информацию целиком и непосредственно; могут — условно, неявно; однако, в общем случае, — также могут быть лишены известной информационной ценности. Неполнота или бесполезность данных может быть обусловлена по-разному: данные бывают неполными (недополученными), испорченными (от шума, помех, побочных эффектов…), периодическими, устаревшими, закодированными, зашифрованными, фрагментированными, зависимыми, обфусцированными («запутанными»)… Польза конкретных данных, помимо всего этого, может быть скомпрометирована контекстом их обработки, — в частности, например, при порче или утере вспомогательных сопроводительных данных, которые по отношению к первичному объёму данных представляются в особом качестве: как так называемые метаданные.
Цифровые данные[править]
В тьюрингской модели о механическом вычислении, программируемом инструкциями произвольного алфавита, «данные» строго и однозначно определены. Говоря об «объёме данных» в памяти компьютера, указывают на количество цифровой информации. Это фундаментальная дискретная мера, наименьшая единица которой — бит, булева единица. Конечный и замкнутый набор данных может кодировать информацию. Код уберегает и обфусцирует прообраз информационной сущности в ходе некоего вычислительного освоения:
- алгоритмического, например, как прогаммный код, вводимый в компьютерную систему и процедурно генерирующий предназначенные данные;
- криптографского, то есть, предмета процедуры, исчисляющей ключа расшифровки;
- обратно-распознательного: например, как графический штрих-код или кюар-код.
В таком смысле данные целиком анализируются, как любая последовательность из одного или нескольких символов (во внекультурном значении, как абстрактные «буквы» или «цифры») некоторого фиксированного алфавита. Наиболее часто задействованы в вычислениях двоичные данные — те данные, что представлены последовательностями символов алфавита {0,1}: «истина» XOR «ложь», tertium non datur. Изначально и поныне (2023 год) данные внутри компьютера в огромном большинстве случаев представлены в двоичном коде и преобразуются параллельно: операции проводятся не поочерёдно над каждым из битов, но сразу, за один вычислительный цикл над множеством бит. Это настолько преобладающий вариант, что, говоря о параллельных вычислениях явно, обычно подразумевают более выраженные случаи параллелизма. Данные, полученные сигналом от аналогового устройства, — такого, как устройство пользовательсткого ввода или датчик сенсора, — могут быть преобразованы в цифровую последовательность через аналого-цифровое преобразование.
Данные, представляющие величи́ны или символы, с которыми операции выполняются цифровым компьютером, представлены физическими состояниями магнитных, оптических, электронных или механических носителей, либо в неявной форме — совокупностью состояний некоторой вычислительной системы. Передача данных проводится ритмичным чередованием формы дискретных сигналов: электрических или оптических.[2]
Данные, перемещаемые по сетям коммуникации: от одного компьютера другому, — в большинстве случаев перемещаются, как фрагментированные последовательные данные, целостность которых восстанавливается вычислительно на основе метаданных, подчинённых той или ной совокупности сетевых протоколов.
Данные, код, программа, текст[править]
Программа — это данные в виде закодированных инструкций для управления работой компьютера или другой машины.[3] Элементы памяти физического компьютера состоят из адреса и машинного сло́ва хранения данных. Высокоструктурированные цифровые данные часто хранятся и сортируются в базах данных: реляционных, таких, как базы данных SQL, или объектно-ориентированных, начиная с MUMPS.
Данные могут быть организованы во множество различных типов структур данных, например: массивы, кортежи, XOR-связные списки, объекты на куче,… Структуры данных могут хранить данные самых разных типов, включая числа, строки, исполняемый машинный код, и, рекурсивно, прочие структуры данных. Данные передаются на компьютер и выводятся из него через периферийные устройства.
При альтернативном использовании двоичные файлы (которые не читаются человеком) иногда называют «данными», в отличие от «текста», удобочитаемого человеком[4]. Общий объем цифровых данных в 2007 году оценивался в 281 миллиард гигабайт (= 281 эксабайт).[5][6] Цифровые данные находятся в трех состояниях: данные в состоянии покоя, данные в пути и данные в использовании.
Аналоговые данные[править]
В аналоговых компьютерах и искусствах обработки сигналов данные — это сигналы, в противопоставление шумам, помехам, интерференции… — всем эффектам среды́, которые решительно не участвуют в вычислениях. Недостаточное освоение сигналов приводит к полной или частичной потере данных, а неверное распознание сигналов среди эффектов ведёт к искажению.
Данные и информация в прикладных областях[править]
Необработанные данные — это произвольные материальные эффекты, воспринятые в качестве хранителя или источника данных, так или иначе. В общем случае, это состояния, периодичные колебания или исторически уникальные развития материальных систем. Состояния психики, покуда они могут нести данные, воспринимаются в таком же ключе: данные объективны, а не субъективны по определению. Абстрактную — символьную, вычислительную, информационную — природу данные обретают, будучи «очищены», обработаны в некоторой области применения. Необработанные данные требуется скорректировать, исключая погрешности и ошибки, неизбежно вносимые материальными процессами добычи данных. Например, показания термометра из открытого арктического местоположения, регистрирующие тропическую температуру. Обработка данных обычно происходит поэтапно, и «обработанные данные» одного этапа могут считаться «необработанными данными» следующего этапа. Полевые данные — это необработанные данные, которые собираются в неконтролируемой среде «на месте».
Данные были охарактеризованы как новая нефть цифровой экономики.[7][8]
Многозначность термина и связанные понятия[править]
Данные, данное, данность в философии — наиболее абстрактная совокупность условий, происходящих непосредственно из среды́, области познания, а не произвольно, не лишь «на веру», минуя собственные побуждения.
Данные, data, DATA — формальный объект в абстрактно-алгебраических теориях категорий и аллегорий, обосновывающих дизайн языков программирования. Дуальный по отношению к данным математический объект — коданные, codata, CODATA.
Источники[править]
- ↑ «Данные», data, в заявленном тут смысле — поначалу отпричастное существительное plurale tantum. «Данное», как калька жаргонного англоязычного термина datum, — исчислимое, и во множественном числе целиком совпадает исходному термину «данные».
- ↑ data. Oxford Dictionaries. Проверено 11 октября 2012.
- ↑ computer program. The Oxford Pocket Dictionary of Current English. Проверено 11 октября 2012.
- ↑ file(1). OpenBSD Manual Pages (2015-12-24). Проверено 4 февраля 2018.
- ↑ Paul, Ryan. Study: amount of digital info > global storage capacity, Ars Technics (март 2008 года).
- ↑ Gantz, John F. The Diverse and Exploding Digital Universe. International Data Corporation via EMC (2008). Проверено 12 марта 2008.
- ↑ Yonego, Joris Toonders Data Is the New Oil of the Digital Economy (July 23, 2014).
- ↑ Data is the new oil (July 16, 2018).