Лекция 1
Предыстория появления баз данных
Примеры баз данных
- штрих-код;
- паспорт;
- кредитная карта;
- библиотека;
- сведения о студентах.
Два направления развития и применения вычислительной техники (ВТ):
1. выполнение численных расчетов – развитие методов численного решения математических задач, развитие языков программирования;
2. автоматические и автоматизированные информационные системы – большие объемы информации, достаточно сложная структура информации.
Информационная система – комплекс аппаратного и программного обеспечения, функции которого состоят в поддержке надежного хранения информации, выполнении специфических для данного приложения преобразований информации и/или вычислений, предоставлении пользователям удобного и легко осваиваемого интерфейса.
Автоматическая ИС – ИС, функционирующая самостоятельно, без участия человека.
Автоматизированная ИС – ИС, предназначенная для автоматизации различных процессов, связанных с деятельностью человека. Человек – звено АИС.
Автоматизация – комплекс мероприятий, направленных на повышение производительности труда человека посредство замены части этого труда работой машин.
Второе направление появилось позже первого по техническим причинам – отсутствие устройств постоянной памяти: магнитная лента (последовательный доступ) и барабан (малый объем). С появлением сменных магнитных дисков с подвижными головками получили развитие системы управления данными во внешней памяти. На смену низкоуровневым функциям обмена данными между прикладной программой и внешней памятью, пришли функции работы с системами управления файлами.
Файл - это именованная область внешней памяти, в которую можно записывать и из которой можно считывать данные.
Файловые системы (система управления файлами) – набор программ, которые выполняют для пользователей некоторые операции. Каждая программа определяет свои собственные данные и управляет ими.
Файловая система – аналог картотек.
Правила именования файлов, способ доступа к данным, хранящимся в файле, и структура этих данных зависят от конкретной системы управления файлами и, возможно, от типа файла. Файловая система берет на себя распределение внешней памяти, отображение имен файлов в соответствующие адреса во внешней памяти и обеспечение доступа к данным.
Структуры файлов – блоки (самая медленная операция при работе с файлами – позиционирование), файл – последовательность записей, файл – последовательность байтов.
Именование файлов – система каталогов и файлы данных.
Защита файлов – авторизация доступа к файлам. Пользователи и группы пользователей.
Многопользовательский доступ.
Сферы применения файлов – хранение различных слабоструктурированных данных, структура которых известна лишь прикладной программе.
Преимущества: наличие простых, стандартных и сравнительно дешевых средств файловой системы для реализации тех структур хранения, которые наиболее естественно соответствуют специфике данной прикладной области.
Недостатки:
- разделение и изоляция данных (в нескольких файлах);
- дублирование данных (ведет к неэкономному расходу памяти и к нарушению целостности данных);
- зависимость от данных (прикладных программ, т.к. структура данных фиксированы в коде прикладной программы);
- несовместимость форматов файлов (из-за зависимости от языка программирования);
- фиксированные запросы ведут к быстрому увеличению количества приложений (и нарушениям безопасности, восстановления, многопользовательского доступа).
Целостность данных – непротиворечивость данных.
ИС главным образом ориентированы на хранение, выбор и модификацию постоянно существующей информации. Структура информации зачастую очень сложна, и хотя структуры данных различны в разных информационных системах, между ними часто бывает много общего. На начальном этапе использования вычислительной техники для управления информацией проблемы структуризации данных решались индивидуально в каждой информационной системе – производились необходимые надстройки над файловыми системами: библиотеки программ, которые являлись существенной частью информационных систем и практически повторялись от одной системы к другой. Возникла объективная необходимость в выделении и обобщении общей части информационных систем, ответственной за управление сложно структурированными данными. Общая часть должна решать множество проблем, которые затруднительно или вообще невозможно решить при использовании файловых систем. При этом существуют приложения, для которых вполне достаточно файлов; приложения, для которых необходимо решать, какой уровень работы с данными во внешней памяти для них требуется, и приложения, для которых безусловно нужна такая часть.
Возможности: поддержание логически согласованного набора файлов; обеспечение языка манипулирования данными; восстановление информации после разного рода сбоев; реально параллельная работа нескольких пользователей. Файлам присуща избыточность данных. Данные и информация.
Основные понятия и определения
База данных – совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, не зависимая от прикладных программ.
БД – информационная модель (формализованное описание информационных структур и операций над ними) предметной области (множество всех предметов, свойства которых и отношения между которыми исследуются).
Система управления базами данных – комплекс программ и языковых средств, предназначенный для:
1. создания, ведения и использования баз данных на основе некоторой модели данных,
2. обеспечения логической и физической целостности содержащихся в них данных,
3. надежного и эффективного использования ресурсов,
4. предоставления к ним санкционированного доступа для приложений и конечных пользователей,
5. а также для поддержки функций администратора базы данных.
Модель данных – интегрированный набор понятий для описания данных, связей между ними и ограничений, накладываемых на данные в некоторой организации.
В этом определении утверждается, что СУБД:
- предназначена для многоцелевого использования, а не решения какой-либо одной задачи для одного пользователя
- отражение определенной части реального мира, доступное всем пользователям, которым эта информация нужна
- имеет специальные языковые и программные средств, облегчающие для пользователей выполнение всех операций, связанных с организацией хранения данных, их корректировки и доступа к ним – СУБД
- имеет механизм централизованного управления данными.
Отделение прикладных программ от СУБД. Независимость СУБД от физических данных. Независимость данных от прикладной программы.
Преимущества:
- единое целостное отображение определенной части реального мира
- сокращение избыточности хранимой информации
- централизация управления
- независимость данных от прикладной программы.
Предпосылки использования:
- объекты реального мира находятся в сложной взаимосвязи между собой, следовательно, их информационное отражение должно представлять единое взаимоувязанное целое
- рост числа пользователей
- универсальность функций при решении различных задач
- теоретические исследования в ИТ
Требования:
- адекватность отражения п.о.
- разно уровневый доступ в различных режимах
- дружественность интерфейсов
- защищенность данных
- взаимная независимость данных и программ
- надежность функционирования
- быстродействие и т.п.
|