Все шпаргалки / Экзамен по информатике / 

Модели данных: определение модели данных; основные модели данных (иерархическая, сетевая, реляционная), понятие нормализации отношений.

Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности и операций манипулирования данными. С помощью модели данных могут быть представлены объекты предметной области и взаимосвязи между ними. Модель данных - совокупность структур данных и операций их обработки.По способу установления связей между данными СУБД основывается на использовании трёх основных видов модели: иерархической, сетевой или реляционной; на комбинации этих моделей или на некотором их подмножестве. Каждая из указанных моделей обладает характеристиками, делающими ее наиболее удобной для конкретных приложений. Одно из основных различий этих моделей состоит в том, что для иерархических и сетевых СУБД их структура часто не может быть изменена после ввода данных, тогда как для реляционных СУБД структура может изменяться в любое время. С другой стороны, для больших БД, структура которых остается длительное время неизменной, и постоянно работающих с ними приложений с интенсивными потоками запросов на БД-обслуживание именно иерархические и сетевые СУБД могут оказаться наиболее эффективными решениями, ибо они могут обеспечивать более быстрый доступ к информации БД, чем реляционные СУБД.Иерархическая структура представляет совокупность элементов, связанных между собой по определенным правилам. Объекты, связанные иерархическими отношениями, образуют ориентированный граф (перевернутое дерево). К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь. Узел - это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа. Следует отметить, что в настоящее время не разрабатываются СУБД,поддерживающие на концептуальном уровне только иерархические модели. Какправило, использующие иерархический подход системы, допускают связываниедревовидных структур между собой и/или установление связей внутри них. Этоприводит к сетевым даталогическим моделям СУБД. К основным недостаткам иерархических моделей следует отнести:неэффективность реализации отношений типа N:N, медленный доступ к сегментамданных нижних уровней иерархии, четкая ориентация на определенные типызапросов и др. В связи с этими недостатками ранее созданные иерархическиеСУБД подвергаются существенным модификациям, позволяющим поддерживать болеесложные типы структур и, в первую очередь, сетевые и их модификации. Сетевая модель СУБД во многом подобна иерархической: если виерархической модели для каждого сегмента записи допускается только одинвходной сегмент при N выходных, то в сетевой модели для сегментовдопускается несколько входных сегментов наряду с возможностью наличиясегментов без входов с точки зрения иерархической структуры. Графическое изображение структуры связей сегментов такого типа моделейпредставляет собой сеть. Сегменты данных в сетевых БД могут иметьмножественные связи с сегментами старшего уровня. При этом направление ихарактер связи в сетевых БД не являются столь очевидными, как в случаеиерархических БД. Поэтому имена и направление связей должныидентифицироваться при описании БД. В рамках сетевых СУБД легко реализуются и иерархические даталогическиемодели. Сетевые СУБД поддерживают сложные соотношения между типами данных, чтоделает их пригодными во многих различных приложениях. Однако пользователитаких СУБД ограничены связями, определенными для них разработчиками БДприложений. Более того, подобно иерархическим сетевые СУБД предполагают разработкуБД приложений опытными программистами и системными аналитиками. Среди недостатков сетевых СУБД следует особо выделить проблемуобеспечения сохранности информации в БД, решению которой уделяетсяповышенное внимание при проектировании сетевых БД. Реляционная модель ориентирована на организацию данных в видедвумерных таблиц. Каждая реляционная таблица представляет собой двумерныймассив и обладает следующими свойствами: - каждый элемент таблицы - один элемент данных; повторяющиеся группы отсутствуют; - все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип (числовой, символьный и т.д.) и длину; - каждый столбец имеет уникальное имя; - одинаковые строки в таблице отсутствуют; - порядок следования строк и столбцов может быть произвольным. Таблица такого рода называется отношением. База данных, построенная с помощью отношений, называется реляционнойбазой данных. Отношения представлены в виде таблиц, строки которых соответствуюткортежам или записям, а столбцы - атрибутам отношений, доменам, полям.Одни и те же данные могут группироваться в таблицы (отношения) различными способами, т.е. возможна организация различных наборов отношений взаимосвязанных информационных объектов. Определенный набор отношений обладает лучшими свойствами при включении, модификации, удалении данных, чем все остальные возможные наборы отношений, если он отвечает требованиям нормализации отношений. Нормализация отношений – формальный аппарат ограничений на формирование отношений (таблиц), который позволяет устранить дублирование, обеспечивает непротиворечивость хранимых в базе данных, уменьшает трудозатраты на ведение (ввод, корректировку) базы данных.Выделены три нормальные формы отношений и предложен механизм, позволяющий любое отношение преобразовать к третьей (самой совершенной) нормальной форме 1. Отношение называется нормализованным или приведенным к первой нормальной форме, если все его атрибуты простые (далее неделимы). Преобразование отношения к первой нормальной форме может привести к увеличению количества реквизитов (полей) отношения и изменению ключа. 2. Чтобы рассмотреть вопрос приведения отношений ко второй нормальной форме, необходимо дать пояснения к таким понятиям, как функциональная зависимость и полная функциональная зависимость. Описательные реквизиты информационного объекта логически связаны с общим для них ключом, эта связь носит характер функциональной зависимости реквизитов. Функциональная зависимость реквизитов – зависимость, при которой в экземпляре информационного объекта определенному значению ключевого реквизита соответствует только одно значение описательного реквизита.Такое определение функциональной зависимости позволяет при анализе всех взаимосвязей реквизитов предметной области выделить самостоятельные информационные объекты. 3. Понятие третьей нормальной формы основывается на понятии нетранзитивной зависимости. Транзитивная зависимость наблюдается в том случае, если один из двух описательных реквизитов зависит от ключа, а другой описательный реквизит зависит от первого описательного реквизита.