logo
Информатика-лекц-2012

Тема 6. Организация информации в компьютерных системах

Для того чтобы эффективно работать с информацией, необходимо знать, как она организована, то есть где она находится. А находится она в документах.

В современной информатике это понятие значительно более широкое, чем то, которое традиционно применяется в области делопроизводства.

Документпоименованный объект, содержащий определенную информацию. Имя документа используется для его поиска и идентификации. Используя такое широкое определение, документами можно назвать книгу, письмо, кинофильм, аудиозапись, файл и даже любой экспонат музея.

Электронный документдокумент, в котором информация представлена в электронно-цифровой форме.3

В компьютерных технологиях электронный документ часто называют файлом. Аналогично, одно и то же обозначают такие понятия каккаталог, папка и директория.

Различные способы организации информации называют моделями представления информации (данных).

Иерархическая модель (дерево)

Иерархия– подчиненность нижних структур верхним.

Так же как по папкам раскладывают бумаги, электронные документы (файлы) группируются по каталогам (папкам). Каталоги располагаются на диске. Один каталог может быть вложен в другой.

Корневымназывается каталог, в который вложены все другие каталоги.. Каталог, который вложен в корневойкаталогом первого уровня. Каталог, вложенный в каталог первого уровня, называется каталогом второго уровня и т. д.

Деревом каталогов называется разветвленная, иерархическая система каталогов всех уровней.Текущиминазываются диск и каталог, с которыми в данный момент происходит работа.

Полное имя файла состоит из пути к файлу, его имени и расширения.Путь указывает диск и последовательность каталогов, ведущих к файлу.

Имя файла используется для поиска и идентификации файла.Расширение указывает тип файла.Файлы с расширениями exe, com, bat запускают выполнение программ. Файл может и не иметь расширения.

Например, файл с именем proba.txt находится в каталоге TEXT, который вложен в каталог LEX корневого каталога, и все это размещено на диске С.

Тогда полное имя файла будет: C:\Документы\Отчеты\Годовой.doc

В этой записи отражено следующее:

Путь к файлу:

С: Диск С,

\ корневой каталог,

Документы каталог 1-ого уровня,

Отчеты каталог второго уровня,

Годовой имя файла,

doc– расширение.

С:\

Документы

Отчеты

Письма

Рисунки

Рис. Дерево папок

Только указав полное имя файла (с путем к нему), вы можете рассчитывать, что операционная система, как опытный библиотекарь, найдет «нужную полку» с вашим файлом.

Описанная выше система организации информации напоминает дерево. Если корневой каталог – это ствол, то каталог первого уровня – это ветвь, идущая от ствола, ветвь от нее – каталог второго уровня и т. д. На конце ветки дерева листок – документ. Такая организация информации по принципу дерева хороша тем, что позволяет быстро находить документ, если известен путь к нему (полное имя документа). По этому принципу организована информация не только в компьютерных системах, но и в обычных библиотеках (систематический каталог с индексами УДК).

Достоинство модели– адекватное описания иерархических систем и быстрый поиск информации, если известно полное имя файла.

Недостаток– трудности с поиском, если полное имя файла неизвестно.

Сетевая модель (паутина)

Однако, в том случае, когда неизвестны точные имена документов, поиск затруднен. В этом случае удобнее использовать другой принцип организации информации – сетевой или принцип «паутины».

Рис. 3.Паутина

Принцип паутины – такая организация информации, при которой информация на определенную тему сосредоточена в информационных узлах, связанных между собой множественными связями, ссылками (нитями паутины).

Рассмотрим принцип «паутины» на примере книги. Каждая научная книга, помимо текста, имеет список литературы и ссылки на него. То есть каждая книга через ссылки связана с множеством других книг, а те, в свою очередь, с другими и так далее. Книга является узлом информационной паутины, а ссылки – её нитями. В компьютерных технологиях документы тоже имеют ссылки, а точнее гиперссылки. Документы, содержащие гиперссылки, называются гипердокументамиилиWeb-страничками.Гиперссылка– это выделенный текст или графика, активизация которых (щелчком мыши) открывает документ, на который сделана ссылка. Отличие гиперссылки от обычной ссылки чисто техническое. Для того чтобы найти нужную книгу согласно ссылки, читателю придется идти в библиотеку, а пользователь компьютера автоматически получит запрашиваемый документ, лишь щелкнув по гиперссылке. Конечно, во втором случае процесс поиска информации значительно ускоряется, ведь документ может быть быстро получен по сетям из другого города, другой страны и даже другого континента.

Всемирная информационная паутина (WWW) - это совокупность гигантского количества взаимосвязанных Web-страничек в сети Интернет.

Пользователь, подключенный к Интернет, получает доступ к необъятным информационным ресурсам всего человечества.

Использование принципа «паутины» эффективно на стадии начального знакомства с новой темой. Ведь достаточно найти один подходящий по теме документ (что не сложно сделать с помощью специальных поисковых машин) и затем, открывая с помощью гиперссылок другие документы, довольно быстро получить нужную информацию.

Эффективная технология поиска информациизаключается в том, что на первом этапе используя принцип паутины, происходит поиск наиболее «богатых» (в смысле наличия информации по заданной теме) узлов, записываются их точные адреса, а затем отслеживается вновь появляющаяся в этих узлах информация, используя принцип «дерева».

  1. Реляционная модель

Реляционная модель данных используется для создания баз данных.

Реляционная модель данных представляет собой множество взаимосвязанных двумерных реляционных таблиц, в каждой из которых содержатся сведения об одной сущности автоматизируемой предметной области.

(Relation – связь, отношение).

Сущность – объекты, процессы, события, явления. Например: товар, поставщик, заказчик, поставка, отгрузка. Сущность описывается в виде информационного объекта.

Информационный объект – это информационное описание некоторой сущности предметной области.

Информационные объекты описываются с помощью реквизитов.

Реквизит – элементарная (неделимая на смысловом уровне) характеристика ИО (поле в таблице БД). Содержимое поля отображается в столбце таблицы и содержит данные одного типа. Структура реляционной таблицы определяется составом полей.

Информационный объект имеет множество реализаций – экземпляров объекта (запись в БД).

Запись – строка таблицы, содержащая данные о конкретном экземпляре сущности.

Правила построения таблиц (пример – оценки школьников, что в поле, а что в строку?)

Таблица «Товар»

Код товара

Название товара

Цена

Ед. изм

Налог (НДС)

Т001

Компьютер

30000

Штука

15%

Т002

Монитор

9000

Штука

20%

Т003

Диски DVD

40

Коробка

20%

Т004

Монитор

7500

Штука

5%

Т005

Принтер

3500

Штука

10%

Таблица «Поставка товаров»

№ Договора

Код товара

Срок поставки

Объем поставки

Д001

Т003

1.01.2009

20

Д001

Т001

5.03.2009

5

Д002

Т002

7.04.2009

10

Д003

Т001

20.06.2009

12

Рис. Реляционная БД.

Таблица «Договоры»

Для однозначного определения каждой записи каждая таблица должна иметь уникальный ключ. Ключ идентифицирует запись и не может иметь одинаковое значение для разных записей в таблице.

Простой ключ состоит из одного поля, а составной из нескольких.

Ключ связи обеспечивается одинаковыми полями в паре таблиц.

Логические связи между таблицами дают возможность объединять данные из разных таблиц. Таким образом, обеспечивается рациональное хранение данных и их объединение.

Достоинства реляционных таблиц:

  1. Компактные таблицы легче воспринимаются.

  2. Коррекция данных затрагивает небольшую часть БД.

Связь таблиц может быть двух типов: один-к-одному (1:1)или один-ко-многим (1:М).

В первом случае каждой записи в одной таблице соответствует одна запись в другой таблице, а во втором, одной записи в одной таблице может соответствовать несколько записей в другой. В этом случае сторона «один» является «главной таблицей», а сторона М – «подчиненной».

Информационно-логическая модель данных отображается в виде схемы данных.

Схема данных – графическое изображение таблиц и связей между ними.

Рис. Схема данных

Этапы проектирования и создания базы данных

  1. Построение информационно-логической модели данных (ИЛМ).

    1. Анализ документов предметной области и выделение информационных объектов (ИО).

    2. Определение связей между ИО.

    3. Построение ИЛМ.

  2. Конструирование таблиц БД.

  3. Ввод данных в таблицы.

Каждый информационный объект предметной области адекватно отображается реляционной таблицей, а связям между ИО соответствуют логические связи между парой соответствующих таблиц. Такие связи устанавливаются по уникальному ключу главной таблицы.

Обработка информации с помощью базы данных

Запросы

Запрос – основной инструмент выборки данных из БД в соответствии с указанными реквизитами и условиями.

Запрос позволяет выбрать необходимые данные из одной или нескольких взаимосвязанных таблиц, произвести вычисления и получить результат в виде таблицы.

Пример. Необходима информация о товарах запланированных к поставке покупателям по всем договорам. Результат должен содержать:

  1. Наименование покупателя из таблицы Покупатель.

  2. Месяц поставки из таблицы Поставка.

  3. Название товаров из таблицы Товар.

  4. Стоимость поставляемых товаров, рассчитанная по количеству из таблицы Поставка, умноженному на цену из таблицы Товар.

Еще более сложный анализ можно сделать на основании и нескольких запросов. Например, для анализа выполнения договоров можно сформировать сложный запрос сравнивающий результаты запросов по договорам и реальным поставкам и получить информацию о недопоставках товаров.

Формы

Формы – это средства диалога пользователя с базой данных.

Через формы осуществляются следующие действия:

  1. Ввод данных в таблицы БД.

  2. Просмотр данных и их изменение.

  3. Установка ограничений на доступ к данным.

  4. Вывод необходимых сообщений.

Формы могут быть однотабличными и много табличными.

Отчеты – форма представления данных для печати на стандартных листах бумаги.

Yandex.RTB R-A-252273-3
Yandex.RTB R-A-252273-4