Курсовая работа: Теория определения информации и данных

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Теория определения информации и данных

Введение

Определение понятий данные и информация приводятся во многих учебниках по информатике /152…157/ и литературных источниках, посвященных описанию IT-технологий /там же/. При различных структурных выражениях семантика понятий одинакова у всех авторов.

Приведем общие определения данных и информации /158…160/.

Н. Винер: «Информация есть информация, а не материя и энергия. Тот материализм, который не признает этого, не может быть жизнеспособным в настоящее время».

Т. Сарацевич: «Все недовольны тем, что информационная наука не хочет потрудиться над определением информации … на самом деле ни одна современная наука не имеет определений своих основных феноменов. В биологических науках нет определения жизни, в медицинских - здоровья, в физике - энергии, в электротехнике - электричества, в ньютоновских законах - противодействия. Это просто основные явления, и эта их первичность и служит им определением».

Н.Н. Моисеев: «Ныне существует обширная наука, именуемая информатикой. И ей посвящает свои усилия едва ли не половина всего научного персонала (даже не осознавая этого). А феномен этой дисциплины состоит в том, что центральное ее понятие «информация» до сих пор не имеет четкого и общепринятого определения - его используют главным образом на интуитивном уровне … я уверен, что строгого и достаточного универсального определения информатики не только нет, но и быть не может».

А.Д. Урсул, К.К. Колин и др.: Информация является неотъемлемым свойством (атрибутом) материи, может проявлять себя во всех объектах, процессах и явлениях как живой, так и неживой природы.

Н. Винер, Н.Н. Моисеев и др.: Информация присуща только объектам живой природы, для которых характерны целенаправленные действия (принятие решений).

Обобщим сказанное.

Данные - сведения /162…167/ (знание, представление о чем-либо) необходимые для какого-либо вывода, решения или свойства, способности, качества как условия или основания для чего-либо. Данные могут рассматриваться как признаки, используемые для уменьшения неопределенности.

Информация - /162…167 / сведения об окружающем мире и протекающих в нем процессах на основе совокупности данных. Сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний. Или коротко - информацией является совокупность используемых данных.

Информация - это самое ценное достижение человечества. Информация помогает нам жить. На сегодня можно сказать, что получение новых данных и знаний является основной задачей человечества.

Основополагающая роль информации в целенаправленной человеческой деятельности осознана уже давно. Любая деятельность начинается с получения и осмысления информации: прежде чем что-то сделать человек это должен представить, смоделировать. Академик А.А. Харкевич писал: «Никакая организованная форма деятельности немыслима без обмена информацией. Без информации невозможно ни планирование, ни управление» /168/.

На современном этапе со всей очевидностью вскрылось явное противоречие между важностью информации для организации любой деятельности и уровнем понимания её сущности, свойств и методов анализа. С одной стороны, на любом предприятии, в любой области деятельности накоплены и используются большие объёмы данных, реализуются всё более сложные методы и средства для их хранения, оперативного поиска и доступа, представления в удобном виде, преобразования, обмена. А с другой стороны, мы пока плохо представляем, когда данные можно считать информацией, какими информационными свойствами и особенностями можно воспользоваться для повышения эффективности деятельности. В связи с этим остановимся кратко на основных свойствах и особенностях информации.

Как мы уже определились, информация - это адекватные результаты отражения. Информация может быть и ресурсом, и продуктом человеческой деятельности, а в условиях рыночных отношений - и товаром. У информации, как ресурса, есть замечательное свойство: одна и та же информация может использоваться многократно и многими пользователями. То есть коэффициент использования (полезного действия) информации может быть безграничен.

Информация, как продукт деятельности, способна удовлетворять определённые потребности, а значит должна характеризоваться совокупностью свойств, то есть качеством. Способность информации удовлетворять определённые потребности иногда называют не качеством, а пертинентностью.

Основные показатели качества информации:

материальность - способность воздействовать на органы чувств;

объективность - независимость от потребителя и целей использования;

доступность - возможность использования различными потребителями;

безопасность - способность сохраняться при воздействии угроз;

защищённость - способность быть доступной для одних и недоступной для других потребителей;

временные характеристики - сроки получения, подтверждения идентичности, хранения, поиска и т.п.;

актуальность - необходимость для удовлетворения уже существующих потребностей и др.

Главным атрибутивным свойством информации, наличие которого позволяет данные перевести на уровень информации, является адекватность (или неопределённость), характеризующая степень соответствия результата отражения отображаемому объекту. И вот здесь нужно признать, что в практической деятельности предприятий информации используется немного: как правило, мы имеем дело с описаниями, сведениями, сообщениями, изображениями и пр., уровень определённости (или неопределённости) которых охарактеризовать очень непросто. Пока ещё не предложены даже атрибутивы к данным, способные выработать к ним определённый уровень доверия. Более того, даже количественные данные, как правило, представляются не в интервальном, а точечном виде и без указания уровня неопределённости. Типичной является ситуация, когда вообще о погрешности количественных данных сведений просто нет: данные представляются как точные и без указания степени округления.

Таким образом, из трёх уровней представления данных (рис. 1) мы, в основном, работаем на самом нижнем, то есть с сообщениями, сведениями и пр., степень неопределённости которых обычно трудно оценить.

Несомненно, на предприятиях накоплены большие объёмы описательной (в том числе изобразительной) и измерительной информации, которая всесторонне проверена практикой, экспериментальными работами. Такую информацию нужно выделить, определить к ней соответствующий уровень доверия и при переводе в электронный вид этой информации присвоить соответствующие атрибуты, правильно выбрать методы и средства её последующего хранения и преобразования. В то же время сомнительные данные нужно подвергнуть дополнительной проверке, оценить их качество.

Восхождение на информационные уровни может быть только последовательным. Чтобы перейти на описательный информационный уровень, нужно полученные сведения (например, текст) строго упорядочить: проверить соответствие описываемых объектов принятым определениям (понятиям), в случае необходимости ввести новые определения, выделить свойства объектов. С помощью логических схем проверить непротиворечивость сведений, их соответствие уже имеющимся данным.

Рис. 1. Описательные и количественные уровни представления данных

Для перехода на уровень измерительной информации необходимо выбрать количественные показатели для отражения рассматриваемых свойств, обосновать методы, методики, алгоритмы для измерений или расчётов, выбрать необходимые метрологические средства, получить результаты измерений, представить их в интервальном виде и оценить количество измерительной информации.

К сожалению, алгоритмы перевода данных на информационные уровни практически не отработаны. О правильности (грамотности) представления описательных материалов сейчас заботятся редко: понятийный аппарат, как правило, не поясняется, нормативная база (в виде ГОСТов, ОСТов) совершенствуется слабо. В результате специализированные тексты обычно требуют уточнений и пояснений, а логические процедуры проверки не используются вообще. В итоге даже описательной информации на предприятиях значительно меньше, чем общего объёма описательных данных. Количественные данные для перевода на уровень измерительной информации малопригодны: потребители результатов измерений редко интересуются метрологическими свойствами используемых измерительных средств, а методы, модели, методики, алгоритмы и программы расчётов вообще не подвергаются метрологической аттестации. То есть перейти к обоснованному интервальному представлению количественных данных весьма не просто.

1. Неопределённость данных

Все данные, используемые на практике, по уровню определённости могут быть отнесены к одному из следующих трёх классов:

1. Точно определённые;

2. Вероятностные или статистические;

3. Приближённые данные, не имеющие статистических (вероятностных) характеристик.

З...5% 2...3%

Рис. 2. Примерное соотношение точных, вероятностных и приближенных данных

- Приближенные данные

- Точные данные

- Вероятностные данные

Точные данные получают либо в результате элементарного счёта (в цехе 10 станков, в неделе 7 дней, в отделе 15 человек и т.п.), либо на основе результатов измерений, погрешностью которых можно пренебречь (если она не отражается на результатах решения конкретной прикладной задачи): округляя результаты измерений, мы избавляемся от приближённости (неопределённости). Точных данных в жизни встречается не много, а вот к округлению данных мы настолько привыкли, что, как правило, даже не задумываемся, можно ли не учитывать объективно существующую погрешность.

Данные, имеющие вероятностные (статистические) характеристики, на практике встречаются ещё реже. Для получения таких данных требуется соблюдение 2-х принципов: массовости данных и статистической однородности (одинаковости) условий их получения. На практике эти принципы часто оказываются трудновыполнимыми. Вместе с тем целый ряд очень важных задач решается именно на вероятностном уровне. К таким задачам относится, например, задача метрологической аттестации измерительных средств, ставшая обязательной нормативной процедурой: в результате решения этой задачи для каждого типа измерительных средств строится вероятностный закон распределения погрешностей, приводимый в технических паспортах.

По разным оценкам доля точных и вероятностных данных в общем объёме данных в различных областях составляет не более 10%.

Наиболее многочисленную группу в жизни обычно составляют приближённые данные - единичные результаты измерений и оценки расчётов. Погрешностью этих данных пренебрегать нельзя, её необходимо учитывать.

А из-за единичности (не массовости) этих данных нет возможности перейти на уровень статистических оценок и применить аппарат теории вероятностей. К числу задач, использующих подобные данные, относятся, в первую очередь, многочисленные задачи анализа качества продукции, планирования, прогнозирования, управления. Причём, учёт неопределённости в этих задачах играет принципиальную роль: при детерминированном представлении, когда всё точно известно и неопределённости нет многие важные практические задачи вырождаются до некорректных, а получить вероятностные оценки даже с помощью моделирования сложных объектов либо очень трудоёмко и дорого, либо просто невозможно. Характерным примером подобных задач являются широко распространённые задачи управления социально-экономическими системами (предприятиями, компаниями, организациями), которые при ближайшем рассмотрении оказываются уникальными (не массовыми), а деятельность их приходится организовывать в динамично меняющихся условиях (правовых, административных, кадровых, технологических, производственных, информационных и т.п.).

Приближённые данные по особенностям получения подразделяются на 2 группы. Первую группу составляют результаты измерений, получаемые на выходе аттестованных метрологических средств с известными вероятностными законами распределения погрешностей. В этом случае по имеющейся оценке Х измеренной величины можно только заключить, что действительное значение X этой величины с определённой (гарантированной) вероятностью РД находится в соответствующем интервале Д, т.е. получить только интервальное представление об измеренной величине. Например, при нормальном законе распределения погрешностей измерений

(4)

где - погрешность измерений;

- математическое ожидание и среднеквадратическая ошибка измерений.

По полученной оценке Х можно лишь заключить, например, что действительное значение измеренной величины:

с вероятностью находится в интервале 6

с вероятностью находится в интервале 4

с вероятностью находится в интервале 2

В последующих расчётах, когда погрешностью измерений пренебречь нельзя, необходимо использовать именно интервальную оценку измеренной величины, представляющую эту величину в виде интервала неопределённости Д и соответствующего ему уровня гарантированной вероятности РД.