Информация (от лат. informatio – разъяснение, изложение, осведомленность) – одно из наиболее общих понятий науки, обозначающее некоторые сведения, совокупность каких-либо данных, знаний и т. п. В связи с широким распространением этого понятия трудно дать его однозначное определение. Существует много определений информации, отображающих разные точки зрения на нее.
Отметим, что понятие информации рассматривается всегда не само по себе, а в связи с представлением о так называемой коммуникации, когда нечто передается от источника к получателю.
Самое лаконичное определение выглядит так: «Информация – сведения, передаваемые источником получателю».
Это определение легко запомнить, но на самом деле необходимо разобраться в значении всех терминов этого определения: что такое «сведения», «передача сведений», «источник», «получатель».
Прежде всего, укажем на двойственный характер понятия «информация».
Широко известно определение, данное в Большой Советской Энциклопедии (БСЭ):
«Информация, первоначально – сведения, передаваемые людьми устным, письменным или другим способом (с помощью условных сигналов, технических средств и т.д.); с середины 20 века – общенаучное понятие, включающее обмен сведениями между людьми, человеком и автоматом, автоматом и автоматом, обмен сигналами в животном и растительном мире, передачу признаков от клетки к клетке, от организма к организму».
В приведенном определении информация – это то, что источник передает получателю.
Не менее известным является определение, данное в ГОСТ 7.0—99 «Информационно-библиотечная деятельность. Термины и определения»:
«Информация – сведения, воспринимаемые человеком и (или) специальными устройствами как отражение фактов материального или духовного мира в процессе коммуникации».
В этом определении информация – это то, что воспринимает получатель.
Указанные различия в определениях, двойственность подхода к понятию информации не случайны. Дело в том, что процесс информационной коммуникации содержит, как минимум, два этапа, два взаимодействия:
Этап 1 – сведения от источника информации доходят до некоего материального объекта (носителя данных), преобразуются и фиксируются на нем в виде данных.
Этап 2 – данные передаются получателю, который воспринимает содержащуюся в данных информацию.
Источник информации. В вышеприведенном определении из БСЭ в качестве источника информации упоминаются достаточно сложные системы: человек, животное, организм, автомат. Однако следует отметить, что роль источника могут играть любые объекты реального мира: камень, следы пожара, пейзаж за окном, пейзаж на картине художника, сам художник и т. п.
Сведения. По определению В. М. Глушкова «информация в самом общем ее понимании представляет собой меру неопределенности распределения материи и энергии в пространстве и во времени, меру изменений, которыми сопровождаются все протекающие в мире процессы». Эти процессы протекают как в материальном мире, так и в духовном мире, в мышлении людей.
А. Д. Урсул называет неоднородность распределения материи в пространстве и времени, неравномерность протекания процессов на всех уровнях движения и эволюции в мироздании разнообразием. С каждым объектом реального мира связано свое разнообразие, т.е. своя совокупность характеристик неоднородности распределения материи и неравномерности протекания процессов.
Например, камень может характеризоваться массой, Луна – особенностями рельефа поверхности, результаты мыслительной деятельности человека – неким «текстом» в мозгу.
Между объектами реального мира постоянно осуществляются различные взаимодействия. В ходе взаимодействия объектов А и В в зависимости от значений характеристик объекта А происходит изменение некоторых вещественно-энергетических характеристик объекта В. Эти изменения реализуются либо в виде изменения параметров динамических процессов, либо в виде изменения свойств физических объектов (характеристик их внутренней структуры).
Например, взаимодействие между Луной и фотоаппаратом заключается в том, что электромагнитное излучение (лучи Солнца), отражаясь от поверхности Луны, преобразуется в отраженные лучи, параметры которых зависят от того, от какого участка рельефа они отразились. В свою очередь, эти лучи, попав на Земле в объектив фотоаппарата, произведут изменения в характеристиках светочувствительного слоя пленки в этом аппарате. Взаимодействие между мозгом и бумагой: результаты мыслительной деятельности человека преобразуются в механические движения руки, создающие текст на бумаге – специальным образом организованную совокупность черных и белых участков. Взаимодействие между бумагой и мозгом: лучи света по-разному отражаются от чистой поверхности бумаги и от букв текста, написанного на бумаге, попадают в глаз, воспринимаются его рецепторами, далее преобразуются в определенные нервные импульсы и поступают в мозг.
Изменения в характеристиках объекта В неким образом зависят от характеристик объекта А и тем самым отражают состояние разнообразия RА. Те значения характеристик объекта А, которые повлияли на изменение характеристик объекта В, суть сведения об объекте А. Объект А выступает как источник информации, а сведения о нем и есть информация, передаваемая источником.
Передача информации (сведений) с точки зрения теории отражения. Взаимодействие между объектами А и В и есть процесс передачи сведений: сведения о состоянии объекта А в результате взаимодействия отразились в изменении значений каких-то характеристик состояния объекта В.
Процесс передачи сведений от объекта А к объекту В, как правило, представляется как последовательность нескольких (элементарных) отражений, связанных с последовательностью физических взаимодействий – физических процессов. Каждое физическое взаимодействие, как уже упоминалось, приводит к изменению либо параметров динамических процессов, либо свойств физических объектов. Разнообразие, характеризуемое значениями параметров динамических процессов, само динамично, постоянно меняется, преобразуется в разнообразие, связанное с последующими процессами взаимодействия. Результаты же изменения характеристик физических объектов статичны, они могут сохраняться во времени до тех пор, пока не будут изменены в процессе какого-нибудь другого взаимодействия.
Два физических объекта могут взаимодействовать друг с другом только посредством связывающего их динамического процесса. В этом случае взаимодействие объектов А и В состоит, как минимум, из двух взаимодействий: объекта А с динамическим процессом ψ и процесса ψ с объектом В. Параметры динамического процесса ψ отражают сведения об объекте А, а сведения о процессе ψ (а, значит, и об объекте А) фиксируются в значениях характеристик физического объекта В.
Если объект В – физический объект, то состояние его вещественно-энергетических характеристик, возникшее в результате взаимодействия, представляет собой данные, в которых отражены сведения об объекте А.
Подытоживая обсуждение процесса передачи информации от объекта А к объекту В, можно ввести следующие определения.
– Процесс передачи информации от А к В – физическое взаимодействие, в результате которого значения некоторых характеристик объекта А отражаются в изменении значений каких-либо характеристик объекта В.
– Передаваемая информация – сведения об источнике, т.е. совокупность тех значений характеристик объекта А, которые повлияли на изменение характеристик объекта В.
– Сигнал – динамический физический процесс, реализующий взаимодействие объектов А и В, влияющий на изменение характеристик объекта B в соответствии с состоянием объекта А.
– Фиксация (регистрация) сигнала – изменение свойств физических объектов (характеристик их внутренней структуры) под действием сигнала.
– Материальный носитель данных – физический объект, характеристики которого меняются под действием сигнала.
– Данные – результат фиксации (регистрации) сигнала на материальном носителе, т.е. совокупность тех характеристик объекта В, в которых отражаются сведения об объекте А.
Более коротко определения сигнала и данных могут быть сформулированы так:
– Сигнал – динамический физический процесс, реализующий процесс передачи информации.
– Данные – результат фиксации, представления информации на материальном носителе.
Например, данные – это и текст книги или письма (в рукописном, печатном или электронном виде), и фотография поверхности Луны, и картина художника, и молекула ДНК, и следы падения Тунгусского или Челябинского метеорита.
Передача информации с точки зрения коммуникационного подхода. Процесс информационной коммуникации разбивается на два этапа. На первом этапе сведения об источнике S фиксируются на материальном носителе в виде данных D (от Data). На втором этапе получатель R воспринимает переданную информацию, т.е. извлекает сведения, зафиксированные в данных D, и преобразует их в сведения об источнике.
Передача информации происходит:
– либо в режиме непосредственного общения (синхронно), когда события материального мира, результаты духовной или мыслительной деятельности немедленно передаются получателю;
– либо, в режиме отложенного общения (диахронно), когда сначала создается некий текст (результат фиксации событий или текст, сочиненный человеком), а затем, через неопределенный отрезок времени этот текст воспринимается получателем.
Очевидно, что в режиме отложенного общения исходящий от источника текст вначале должен быть зарегистрирован на носителе в виде данных, а через некоторое время извлечен из этих данных получателем (а, может быть, и никогда никем не извлечен). В режиме непосредственного общения, казалось бы, не требуется использование промежуточной сущности – данных. Однако на самом деле сигналы, получаемые человеком, после первичного преобразования на короткое время откладываются (фиксируются) в кратковременной (оперативной) памяти, а затем уже поступают в дальнейшую обработку, результаты которой загружаются в долговременную память.
Получатель информации. На втором этапе коммуникационного процесса сведения, содержание (смысл), зафиксированное в данных, извлекается из данных, если нужно, преобразуется и поступает в распоряжение воспринимающей системы – получателя информации. Роль такой системы может играть конкретный человеческий мозг, конкретный мозг животного, наследственная система конкретного организма или совокупность специальных программ в компьютере. Последний вид воспринимающей системы при желании можно считать подвидом первого – ведь исполнение программ в компьютере можно считать особым способом проявления деятельности человеческого мозга, инструментально поддерживаемой компьютером.
Воспринимающая система может быть и более простой. Например, в механическом будильнике весьма простая подсистема управления звонком реагирует на информацию (когда включать звонок), заданную устанавливаемым извне положением одной из деталей.
Восприятие информации. Для того чтобы воспринять сведения, отраженные в данных, необходимо сначала выявить какие-то неоднородности в свойствах материального носителя данных, а затем понять их смысл, т.е. понять, какие свойства источника повлияли на возникновение этих неоднородностей. Для понимания этого получатель информации должен обладать определенным набором знаний.
Например, рассматривая снимок Луны, нужно сначала выявить наличие более светлых и более темных участков снимка. Затем суметь понять, как они отражают особенности рельефа, что соответствует низменным областям, а что – гористым (для этого необходимо иметь некоторые предварительные знания о Луне, о свойствах световых лучей, об особенностях их отражения от разных поверхностях, об особенностях изменения свойств фотопленки под действием света и пр.).
Другой пример. Пусть на клочке бумаги нанесены штрихи, образующие такую картину: maximum. Во-первых, нужно понять, что эти штрихи изображают последовательность букв, во вторых, надо понять, что это за буквы, какое слово, какого языка они изображают, в-третьих – каков смысл этого слова. Если предварительно известно, что это обрывок дореволюционного текста на русском языке, то это слово можно прочесть как «тахитит», т.е. слово, не имеющее смысла. Однако, если еще известно, что текст математический, то это слово можно прочесть как имеющее вполне определенный смысл слово «максимум».
Вышеупомянутые «неоднородности в свойствах материального носителя данных», смыслом которых являются некие сведения об источнике, образуют «знаки».
Знаком может быть буква, слово, пиктограмма, рисунок и пр.
Информацию, циркулирующую в человеческом обществе, в настоящее время часто называют «семантической». В «Философии информации» А.В.Соколов приводит определение:
«Семантическая информация – смысловое сообщение, выраженное знаками (одним знаком или их организованной последовательностью). Под смыслом сообщения понимаются знания, умения, эмоции, волевые побуждения, фантазии, являющиеся продуктами индивидуальной психической деятельности, которые могут быть поняты другими людьми». Организованную совокупность знаков принято называть текстом.
Таким образом, информация, фиксируемая на первом этапе коммуникационного процесса, выражается текстом. И, следовательно, данные (т.е. те характеристики объекта В, которые отображают сведения об объекте А), образуют некоторый текст.
Под расширенно толкуемое понятие текста подпадают и обычные письменные и печатные тексты, и результаты регистрации показаний прибора, и картина художника, и запись симфонического концерта и пр.
На втором этапе коммуникационного процесса текст, отображаемый данными, играет роль входной информации, которая далее обрабатывается совместно с другой информацией (знаниями), известной воспринимающей системе.
Совокупность сведений (знаний), которыми располагает получатель (человек или система) называется тезаурус. Тезаурус обычно включает некое представление воспринимающей системы о той предметной области, к которой принадлежит источник данных, и о самом источнике данных.
В процессе обработки входной информации, сопоставления ее с тезаурусом получателя происходит понимание информации (выявление ее смысла) и выделение в ней полезной информации, т.е. сведений, новых для получателя, еще не включенных в его тезаурус. Пополнение тезауруса получателя вновь выявленными сведениями и является результатом восприятия информации.
Для понимания полученной информации получатель (называемый также пользователем) должен изначально обладать определенным запасом знаний о некоторой предметной области.
Количество семантической информации, извлекаемой пользователем из поступающих сообщений, зависит от степени подготовленности его тезауруса для восприятия такой информации. Полное незнание предмета не позволяет извлечь полезную информацию из принятого сообщения об этом предмете. По мере роста знаний пользователя о предмете растет количество полезной информации, извлекаемой из сообщения.
В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic, воспринимаемой пользователем и включаемой им в свой тезаурус. Характер такой зависимости показан на рис.1.1. Этот рисунок демонстрирует следующее:
– при Sp = 0 пользователь не имеет знаний о предметной области, поэтому не понимает поступившее сообщение S и количество полученной им семантической информации равно нулю (Ic = 0);
– если тезаурус пользователя Sp, т.е. он уже «все знает» о предметной области, то очередное сообщение не содержит для него ничего нового, и Ic = 0;
– вначале по мере роста объема тезауруса Sp возрастает количество информации, понимаемой пользователем, и, следовательно, растет количество извлекаемой полезной информации Ic, пополняющей тезаурус пользователя;
– максимальное количество семантической информации пользователя получает тогда, когда объем тезауруса Sp позволяет ему понимать всю поступающую информацию (это значение Sp обозначено как Sp opt);
– при дальнейшем увеличении Sp количество понятой информации уже не увеличивается, но все больше информации из поступающего сообщения оказывается пользователю известной; поэтому количество Ic начинает уменьшаться.
Рис. 1.1. Зависимость Ic (количества семантической информации, воспринимаемой пользователем) от его тезауруса Sp.
Из вышесказанного следует, что количество новых знаний, получаемых пользователем информации, является величиной относительной. Одно и то же сообщение может иметь определенный смысл для компетентного пользователя и быть бессмысленным для пользователя некомпетентного.
Так, например, источником информации может быть китайский врач, написавший книгу (данные) об особенностях китайской медицины. Открыть эту книгу может каждый, прочесть – только тот, кто умеет читать по-китайски. Такой читатель сумеет воспринять текст, составленный автором. Но, чтобы понять и воспринять этот текст необходимо иметь знания по медицине вообще, и китайской медицине в частности. Эти знания отсутствуют в исходном тексте, но автор, когда писал свой текст, имел их в виду, рассчитывал на то, что читатель тоже будет в той или иной мере иметь эти знания. Получить из книги информацию, адекватную той, которую вложил автор, может лишь соответствующим образом подготовленная, владеющая необходимыми знаниями воспринимающая система (конкретный читатель).
Содержимое тезауруса пользователя в начале процесса информационной коммуникации называют также априорной информацией, а семантическую информацию, полученную пользователем в результате коммуникации – актуальной информацией. Т.е. актуальная информация – это сведения, расширяющие состав априорной информации.
Таким образом, в процессе информационной коммуникации выделяются три основных компонента:
исходная информация – отражаемые сведения об источнике, т.е. совокупность тех значений характеристик источника, которые повлияли на изменение данных;
данные – представление переданных сведений, т.е. совокупность характеристик промежуточного материального носителя, изменившихся в результате фиксации передаваемых сведений;
воспринятая информация – актуальные сведения, полученные воспринимающей системой в результате совместной обработки сведений, зафиксированных в данных, со сведениями, знаниями, априорно доступными воспринимающей системе.
Как видим, информация в этом процессе предстает в двух видах, разделенных во времени: исходная и воспринятая информация. Эта особенность информации называется ее дуализмом. Третий компонент – данные выступает как канал передачи информации во времени.
Информация, т.е. сведения о распределении материи и энергии, об изменениях в процессах – суть знания человека об окружающем мире, в том числе о человеческой деятельности. Информация – это знание, которое существует не только для данного человека, но и для других людей.
Способом, обеспечивающим доступность знаний, информации разным людям, является представление и хранение информации в виде данных на материальном носителе. Таким образом, вся информация, употребляемая человечеством в его деятельности, воплощающая интеллектуальный и духовный потенциалы человечества, хранится в форме данных. Отсюда следует, что и третий компонент информационной коммуникации (данные) может рассматриваться как вид представления информации – хранимая информация (см. схему на рис.1.2.).
Рис. 1.2. Информационная коммуникация
Свойства информации. Любая информация обладает рядом свойств, которые в совокупности определяют степень ее соответствия потребностям пользователя (качество информации). В научной литературе описывается немало разнообразных свойств информации, так как каждая научная дисциплина рассматривает те свойства, которые ей наиболее важны.
Рассмотрим свойства информации с точки зрения основных этапов коммуникационного процесса.
– Свойства исходной информации.
В зависимости от способа восприятия исходная информация подразделяется на визуальную, аудиальную, тактильную, обонятельную, вкусовую; в соответствии с видами воспринимающих ее органов чувств -зрения, слуха, ощущения, запаха, вкуса.
– Свойства хранимой информации (данных).
Данные фиксируются в некоторой материальной запоминающей среде посредством изменения ее физических, химических или механических свойств.
По видам носителей данные подразделяются, во-первых, по материалу носителя. Издавна известны, такие носители как камень (наскальные рисунки, каменные плиты), глиняные таблички, пергамент, папирус, береста и другие. Затем появились следующие носители: бумага, пластмасса, фотоматериалы, магнитные и оптические материалы и другие.
Кроме того носители делятся на традиционные и машиночитаемые. Под традиционными понимаются: бумага, холст, пластмасса (грампластинка), магнитная лента (аудио и видеокассета), фотографические материалы (фотопленка, фото-пластина, фотоотпечаток, микро-носитель) и т. п.
К машиночитаемым носителям относятся: дискеты (гибкие магнитные диски), жёсткие магнитные и компактные (оптические, магнитооптические и иные) диски, флеш -карты и другие носители информации, предназначенные для использования в компьютерных устройствах, комплексах, системах и сетях.
По форме представления данных на материальном носителе данные подразделяются на:
– изобразительные (или графические): наскальные рисунки, картины, схемы, фотографии и пр.
– текстовые, изображающие речь с помощью символов (букв) в виде лексем естественного языка,
– числовые, в виде комбинаций цифр и математических знаков,
– звуковые, отображающие записанную с помощью звукозаписывающих устройств аудиальную информацию,
– музыкальные тексты – разновидность звуковой информации, записанной с использованием специальных символов (нот),
– видеоинформация – способ хранения «живых», динамичных картин окружающего мира в виде видеозаписи.
– Фиксация информации в виде данных
Взаимодействие различных объектов в реальности происходит постоянно, и поэтому постоянно реализуются процессы фиксации следов этих взаимодействий на материальных носителях. Эти процессы могут происходить непреднамеренно, целенаправленно или сознательно.
Непреднамеренный процесс фиксации информации. В реальном мире обычно процесс взаимодействия объектов «не имеет цели» нести информацию, «не знает», что он связан с отражением (оценкой разнообразия) и с информацией. Он просто происходит. Результаты изменения характеристик материального носителя «не знают», что они данные и отражают информацию. Они просто возникают в процессе взаимодействия. Однако может найтись некий получатель, который захочет извлечь информацию из результатов этого взаимодействия. Тогда эти результаты станут играть роль данных на втором этапе процесса информационной коммуникации.
Целенаправленная фиксация информации происходит в системах, в которых одни процессы используют результаты других процессов. Например, в системе «родители – дети» в одном организме происходит порождение молекул ДНК, содержащих генетическую информацию, которая предназначена для использования другими организмами. Или: результаты протекания некоторого наблюдаемого процесса регистрируются специальными устройствами для последующей обработки наблюдений. Обработка результатов опирается на некоторую модель процесса, которую учитывали разработчики системы обработки. При этом происходит объективная потеря информации, обусловленная характеристиками аппаратуры, ее точности и пр.
Процесс отражения результатов духовной или мыслительной деятельности человека предусматривает сознательное порождение одним человеком текстов, предназначенных для последующего их восприятия другим человеком. В этом случае возможно искажение смысла. Как сказано Ф. Тютчевым: «Мысль изреченная есть ложь». Это искажение определяется возможностями автора («регистрирующего устройства»): его мастерством «изречения» и умением переносить мысль в данные.
Как видим, в любом случае зафиксированная информация несколько отличается от исходной, передает свойства отображаемой реальности с искажением. И чем больше шагов преобразования происходит на пути от отображаемой реальности к данным, тем больше оказывается степень искажения. Но при этом процесс фиксации информации характеризуется довольно высокой степенью объективности – он зависит от условий фиксации и «технических характеристик» процесса фиксации, но не зависит от чьего-нибудь мнения или сознания. Даже если человек выдает заведомо лживое сообщение (дезинформацию), запись этого сообщения есть объективное отображение того, что произнесено (а определение истинности сказанного – это уже другой вопрос).
– Свойства воспринятой информации.
Результаты восприятия информации всегда субъективны, определяются возможностями получателя, его знаниями, прагматическими целями, с которыми он воспринимает информацию, и т. п. Одни и те же данные могут быть использованы различными людьми (и даже одним и тем же человеком в разные моменты времени) по-разному; информация, заложенная в молекуле ДНК, может по-разному использоваться здоровым и больным организмом; одни и те же данные в памяти компьютера по-разному используются разными программами и т. п. Восприятие непреднамеренно оставленных следов физических процессов заключается в том, что сначала воспринимающей системой создается некая модель источника – принимаются соглашения о правилах соответствия этих следов (данных), характеристикам источника, о том, как эти следы структурируются (каков их синтаксис) и как осмысливаются (какова их семантика); а потом уже происходит непосредственное восприятие и осмысление данных.
Отметим также, что передача исходной информации (создание данных) осуществляется один раз, а использование данных может осуществляться многократно и по-разному.
Свойства информации с точки зрения восприятия подразделяют на две группы: прагматические и атрибутивные.
Прагматические свойства информации – это те свойства, которые характеризуют степень полезности информации для пользователя в его практике. С прагматической точки зрения информация может быть:
– Объективная – существующая вне и независимо от человеческого сознания.
– Актуальная – информация, ценная в данный момент времени.
– Достоверная – информация, полученная без искажений.
– Понятная – информация, выраженная на языке, понятном тому, кому она предназначена.
– Полная – информация, достаточная для принятия правильного решения или понимания.
– Полезная – полезность информации определяется субъектом, получившим информацию в зависимости от объёма возможностей её использования.
Атрибутивные свойства – это те влияющие на восприятие свойства информации, которые отображают особенности информации, связанные с ее хранением в совокупностях данных и в тезаурусах пользователей. Эти свойства следующие:
– Кумулятивность информации – накопление информации; способность к более строгому, обобщенному и компактному восприятию накопленной информации в процессе создания новой информации
– Преемственность информации – способность освоения новой информации с учетом уже накопленной.
– Концентрация информации проявляется в том, что по мере накопления определенных единиц информации они имеют тенденцию к объединению в более информационно-ёмкие формы.
– Эмерджентность информации – проявление в результате совместного рассмотрения элементов информации таких смыслов, которые не наблюдаются ни в одном из элементов, если они рассматриваются отдельно. То есть система больше суммы своих элементов.
– Неассоциативность и некоммутативность информации – любая информация это не арифметическая сумма составляющих её элементов, эти элементы нельзя использовать в другой последовательности. Как говорится, сначала надо думать, а потом делать, но никак не наоборот.
– Старение информации – с течением времени хранимая информация начинает устаревать, утрачивать ценность для пользователя. Абсолютно устаревшая информация – это информация, которая с появлением новой информацией оказалась недостоверной. Относительно устаревшей информация называется тогда, когда она может быть дополнена новой информацией.
Структура данных. Как уже говорилось, данные представляют собой результаты отражения, как процессов реального мира, так и результатов осознанной деятельности человека. Происходит это в режиме как непосредственного, так и отложенного общения.
В режиме отложенного общения данные фиксируются на материальном носителе и через некоторое время воспринимаются получателем (пользователем). Выше отмечалось, что при этом воспринимающая система извлекает из сообщения полезную актуальную информацию и расширяет свой тезаурус. Казалось бы, после этого сведения, отраженные в данных, уже не содержат полезной информации, являются бесполезными. Однако, во-первых, эти же сведения могут быть использованы тем же пользователем в других целях, для решения других задач, а, во-вторых, они могут быть полезными другим пользователям. Поэтому возникает необходимость длительного сохранения данных на материальном носителе.
Таким образом, огромное количество информации хранится в виде данных на различных материальных носителях: в книгах, тетрадях, архивных документах, файлах интернета и пр. В этом море информации выделяются большие хранилища данных: библиотеки, архивы, базы данных, информационные фонды.
Для того, чтобы указать, где находится необходимая информация, необходимо назвать соответствующее хранилище. Но, кроме того, нужно указать конкретный элемент данных, содержащий нужную информацию, назвать необходимую «порцию» информации.
В процессе фиксации информации происходит занесение некоторой «порции информации» на какой-то материальный носитель в виде текста, представляющего собой «порцию данных». Будем далее «порцию информации» обозначать термином «сообщение».
При непосредственном общении «порция данных» сразу же поступает в «обработку», т.е. реализуется передача данных в режиме «адресант – адресат». При отложенном общении «порция хранимых данных» поступает к получателю в режиме поиска: «запрос – ответ». По инициативе получателя задается запрос, в соответствии с которым воспринимающая система выдает ответ. Для обеспечения этого процесса необходимо, чтобы воспринимающая система могла найти ту «порцию данных», где зафиксировано нужное сообщение.
Поэтому важнейшими вопросами построения процесса обработки информации (данных) являются вопросы о том, какова структура хранимых данных и как сопоставляются «порция информации» (сообщение) и соответствующая ей «порция данных» (текст).
Структура данных определяется, прежде всего, структурой материального носителя, на котором находятся данные. Материальный носитель представляется как совокупность некоторых «кусков», т.е. материальных объектов с определенными физическими свойствами. В качестве материального объекта может выступать лист бумаги, сброшюрованная пачка листов бумаги, магнитный или оптический диск, кусок холста и др.
Все пространство хранения данных – это совокупность материальных объектов, на которых зафиксированы те или другие данные. Таким образом, основным структурным элементом данных является совокупность данных, расположенных на одном материальном объекте. Такую совокупность обычно связывают с понятием «документ».
Не всякий материальный объект с зафиксированными на нем данными является документом. Например, только что найденный в Великом Новгороде кусочек бересты с текстом не является документом, и станет им тогда, когда будет зафиксировано, где и когда он был найден, а сам кусочек получит учетный номер.
Для того чтобы выбрать объект, идентифицировать, т.е. однозначно обозначить его, нужно знать его характеристики, отличающие его от других объектов. Если выбор осуществляет непосредственно человек, то он может ориентироваться как на «информационные» характеристики объекта (название, автор, год издания, текстовое описание и пр.), так и на характеристики, воспринимаемые чувственно (цвет, форма, размер, вид носителя и пр.). Например: «Дедушкина толстая синяя записная книжка». Если же поиск осуществляется с помощью вспомогательных средств (каталоги, компьютер), то объект можно идентифицировать только «информационно», с помощью таких характеристик как шифр, инвентарный номер, и т. п.
Документ – это идентифицируемый материальный объект, содержащий информацию.
Это определение имеет наиболее общий характер. В разных отраслях деятельности человек имеет дело с документами разного вида, к ним применяются различные дополнительные требования. Например, юридически значимые документы должны быть оформлены специальным образом, содержать подписи, печати и т. д. Документом является и паспорт человека, и завещание, и надгробная плита, и книга, и картина художника, и аудиозапись, и файл на магнитном носителе.
Определение документа отражает две разные ипостаси документа, в соответствии с которыми он может быть интересен потребителю: «что это за информационный объект» и «про что он». А именно: иногда интересно иметь сведения о документе как объекте, о его правовом статусе и других характеристиках, в том числе, может быть, и об информации, отражаемой в этом документе. В других случаях потребителя интересует собственно информация о чем-то, в том числе, может быть, сведения о документе (объекте), содержащем эту информацию.
Чаще всего, конечно, документ интересен с точки зрения его информации. Но чтобы найти нужный документ, необходимо найти тот материальный объект, на котором зафиксирована эта информация.
Документ является особым типом объектов. Объект – это нечто, существующее в реальной действительности. Объекты характеризуются какими-то свойствами: цвет, форма, размер, назначение и пр. Объекты отличаются друг от друга разными значениями их свойств. Для того, чтобы обозначить объект, следует назвать отличающие его значения некоторых свойств. Например: марка, год выпуска, цвет, номер регистрации автомобиля; фамилия, должность, табельный номер сотрудника. Значения некоторых свойств однозначно определяют объект (номер регистрации автомобиля или табельный номер сотрудника), значения других свойств позволяют найти несколько объектов (все красные автомобили или все инженеры).
Документы представляют собой особый тип объектов: «Документ – это объект, отличающийся от обычного объекта тем, что он содержит информацию». Поэтому для того, чтобы описать документ, необходимо, во-первых, описать некий материальный объект, а во-вторых, описать содержащуюся на нем информацию. И при поиске документов можно задавать как их свойства, характеризующие объект (год издания книги, название, автор), так и характеристики информации, содержащейся в документе. Например: найти произведения А.С.Пушкина, изданные в 1999 г, в которых говорится о Пугачеве и о заячьем тулупчике.
Операции с данными. В ходе информационного процесса данные преобразуются из одного вида в другой. Обработка данных включает в себя множество различных операций. В ходе развития человечества усложняются условия управления производством и обществом, увеличивается и объем обрабатываемых данных. Появляются и внедряются новые носители данных, средства их хранения и доставки. В структуре возможных операций с данными можно выделить следующие основные:
– Сбор данных – накопление информации с целью обеспечения достаточной полноты ее для принятия решений;
– Формализация данных – приведение данных, поступающих из различных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;
– Фильтрация данных – отсеивание «лишних» данных, в которых нет необходимости для принятия решений;
– Сортировка данных – упорядочение данных по заданному признаку с целью удобства использования, повышает доступность информации;
– Архивация данных – организация хранения данных в удобной и легко доступной форме;
– Защита данных – комплекс мер, направленных на предотвращения утраты, воспроизведения и модификации данных;
– Транспортировка данных – прием и передача данных между удаленными участками информационного процесса, при этом источник данных принято называть сервером, а потребителя — клиентом;
– Преобразование данных – перевод данных их одной формы в другую или из одной структуры в другую.
Преобразование данных часто связано с изменением типа носителя, например книги можно хранить в обычной бумажной форме или в электронной. Необходимость в многократном преобразовании данных возникает также при транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных. Например, для транспортировки цифровых потоков данных по каналам телефонных сетей необходимо преобразование цифровых данных в некое подобие звуковых сигналов. Этим занимаются специальные устройства – телефонные модемы.
Кодирование данных двоичным кодом. Для автоматизации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления – для этого обычно используется прием кодирования, то есть выражение данных одного типа через данные другого типа. Естественные человеческие языки – это не что иное, как системы кодирования понятий для выражения мыслей посредством речи. К языкам близко примыкают азбуки – системы кодирования компонентов языка графическими символами. Системы универсального кодирования существуют в отдельных отраслях науки и техники. Например, система записи математических выражений, телеграфная азбука, морская флажковая азбука, система Брайля для слепых и многое другое.
Своя система существует и в вычислительной технике – она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называются двоичными цифрами.
Двоичная структура информации весьма просто реализуется на электронных схемах с двумя устойчивыми состояниями элементов: есть сигнал – 1, нет сигнала – 0, и поэтому именно бит принят как единица измерения хранимой информации.
Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, белое или черное, истина или ложь и т.д.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия: 00 01 10 11
Тремя битами можно закодировать восемь различных значений:
000 001 010 011 100 101 110 111
Единицы измерения информации. За минимальную единицу информации принят один бит (англ. bit – BInary digiT— двоичная цифра). Это минимальное количество информации, подлежащее рассмотрению, его смысл – логическая «1» или «0».
Бит очень малая единица измерения информации, поэтому на практике используются составные, более крупные единицы, например – байт, являющийся последовательностью из восьми бит. Байт – сокращенное словосочетание от BinarY TErm, (терм – выражение).
Широко используются еще более крупные производные единицы информации. Старшие производные единицы представляют собой соответствующие степени основания числа 2, названия их формируются по общим принципам формирования названий единиц (приставки кило, мега, гига и т.д.), при этом проявляется несоответствие «десятичных приставок» и степени основания.
Таблица 1.1.Единицы информации
Термин «информатика» предложен Карлом Штейнбухом в 1957. В 1962 этот термин был введён во французский язык Ф. Дрейфусом. Отдельной наукой информатика была признана в 1970-х; до того она развивалась в составе математики и электроники. Сейчас информатика обладает собственными методами и терминологией.
Как наука, информатика изучает общие закономерности, свойственные информационным процессам. При разработке новых носителей информации, каналов связи, приёмов кодирования, визуального отображения информации и т.п., конкретная природа информации не имеет значения. Здесь важны общие принципы организации и эффективность поиска данных, а не то, какие конкретно данные будут заложены в базу пользователями.
Эти общие закономерности есть предмет информатики как науки.
Инфоpматика – научная дисциплина с широким диапазоном применения. Её основные направления:
– pазpаботка вычислительных систем и пpогpаммного обеспечения;
– теоpия инфоpмации, изучающая процессы, связанные с передачей, приёмом, преобразованием и хранением информации;
– методы искусственного интеллекта, позволяющие создавать программы для решения задач, требующих определённых интеллектуальных усилий при выполнении их человеком (логический вывод, обучение, понимание речи, визуальное восприятие, игры и др.);
– системный анализ, заключающийся в анализе назначения проектируемой системы и в установлении требований, которым она должна отвечать; методы машинной графики, анимации, средства мультимедиа;
– средства телекоммуникации, в том числе, глобальные компьютерные сети, объединяющие всё человечество в единое информационное сообщество; разнообразные пpиложения, охватывающие производство, науку, образование, медицину, торговлю, сельское хозяйство и все другие виды хозяйственной и общественной деятельности.
Информатика – совокупность научных направлений, изучающих информацию, информационные процессы в природе, обществе, технике, формализацию и моделирование, методы познания, способы представления, накопления, обработки и передачи информации.
Способы получения, переработки, передачи, хранения и воспроизведения информации с помощью технических средств составляют сущность информационных технологий.
Теоретическую основу информатики образует группа фундаментальных наук, которую в равной степени можно отнести как к математике, так и к кибернетике: теория информации, теория алгоритмов, математическая логика, теория формальных языков и грамматик, комбинаторный анализ, теория вероятностей и математическая статистика и т. д.
Главная функция информатики заключается в разработке методов и средств преобразования информации и их использовании в организации технологического процесса переработки информации.
Сюда входит исследование информационных процессов любой природы; создание новейших технологий переработки информации на базе полученных результатов исследования информационных процессов; решение научных и инженерных проблем создания, внедрения и обеспечения эффективного использования компьютерной техники и технологии во всех сферах общественной жизни.
Предметная область науки «информатика» – информационные процессы и системы, модели, языки их описания, технологии их актуализации, направленные как на получение знаний (это – внутренняя сущность информатики), так и на применение знаний, принятие на их основе решений в различных предметных областях (это – внешняя сущность информатики). Эти информационные процессы могут происходить в живых существах (организмах), автоматах (технических устройствах), обществе, в индивидуальном и общественном сознании.
– Дайте определение сигнала, информации.
– Какие свойства характеризуют информацию?
– Какое свойство информации характеризует ее способность менять способ и форму своего существования?
– Какое свойство информации характеризует ее независимость от чьего-либо мнения?
– Какие операции могут производиться с данными?
– Что такое двоичная цифра?
– Для чего применяются дискретизация и квантование сигналов?
– Какие единицы измерения информации вы знаете?
– Перевести 1,5 MB в KB, 20 KB в bit.
– Почему информация в ПК представлена в двоичном коде?
– Что изучает информатика?
– Какова главная функция информатики?