Какие правила действуют после обеспечения целостности данных при заданных настройках

Обновлено: 19.05.2024

Целостность данных обеспечивается набором специальных предложений, называемых ограничениями целостности. Ограничения целостности обеспечивают непротиворечивость данных при переводе системы БД из одного состояния в другое и позволяют адекватно отражать ПО данными, хранимыми в БД. Ограничения делятся на явные и неявные.Неявные ограничения определяются самой структурой данных. Например, тот факт, что записи типа СОТРУДНИК являются обязательными членами какого-либо экземпляра набора данных ПОДРАЗДЕЛЕНИЕ, служит, по существу, ограничением целостности, означающим, что каждый сотрудник организации непременно должен быть в штате некоторого подразделения.Явные ограничения задаются в схеме базы данных с помощью средств языка описания данных (DDL, Data Definition Language). В качестве явных ограничений чаще всего выступают условия, накладываемые на значения данных. Например, заработная плата не может быть отрицательной, а дата приема сотрудника на работу обязательно будет меньше, чем дата его перевода на другую работу. За выполнением этих ограничений следит СУБД в процессе своего функционирования.Также различают статические и динамические ограничения целостности. Статические ограничения присущи всем состояниям ПО, а динамические определяют возможность перехода ПО из одного состояния в другое. Примерами статических ограничений целостности могут служить требования уникальности номера паспорта или ограничения на дату рождения, которая не может быть больше текущей даты. В качестве примера динамического ограничения целостности можно привести ограничение банковской системы, в соответствии с которым нельзя удалить сведения о клиенте, пока у него не закрыт счёт.В настоящее время разработано много различных моделей данных. Основные – это сетевая, иерархическая и реляционная модели.Возможны два вида изменений, которые приведут к утере связей между записями в родительской и дочерней таблицах:1.изменение значения поля связи в записи родительской таблицы без изменения значений полей связи в соответствующих записях дочерней таблицы;2.изменение значения поля связи в одной из записей дочерней таблицы без соответствующего изменения значения полей связи в родительской и дочерней таблицах.Чтобы предотвратить потерю ссылочной целостности, используется механизм каскадных изменений. Он состоит в обеспечении следующих требований:1.необходимо запретить изменение поля связи в записи дочерней таблицы без синхронного изменения полей связи в родительской и дочерней таблицах. Обычно инициатива изменения поля связи реализуется в записи родительской таблицы;2.при изменении поля связи в записи родительской таблице, следует синхронно изменить значения полей связи в соответствующих записях дочерней таблицы;3.при удалении записи в родительской таблице, следует удалить соответствующие записи в дочерней таблице. Для обеспечения ссылочной целостности в дочерней таблице создается внешний ключ. Во внешний ключ входят поля связи дочерней таблицы. Для связей типа один-ко-многим внешний ключ по составу полей должен совпадать с первичным ключом родительской таблицы или — реже — с частью первичного ключа.

33. Хранимые процедуры представляют собой группы связанных между собой операторов SQL, применение которых делает работу программиста более легкой и гибкой, поскольку выполнить хранимую процедуру часто оказывается гораздо проще, чем последовательность отдельных операторов SQL. Хранимые процедуры представляют собой набор команд, состоящий из одного или нескольких операторов SQL или функций и сохраняемый в базе данных в откомпилированном виде. Выполнение в базе данных хранимых процедурвместо отдельных операторов SQL дает пользователю следующие преимущества:1.необходимые операторы уже содержатся в базе данных;2.все они прошли этап синтаксического анализа и находятся в исполняемом формате; перед выполнением хранимой процедуры SQL Server генерирует для нее план исполнения, выполняет ее оптимизацию и компиляцию;3.хранимые проц. поддерживают модульное программирование, так как позволяют разбивать большие задачи на самостоятельные, более мелкие и удобные в управлении части;

4.хранимые процедуры могут вызывать другие хранимые процедуры и функции;

5.хранимые процедуры могут быть вызваны из прикладных программ других типов;

6.как правило, хранимые процедуры выполняются быстрее, чем последовательность отдельных операторов;

7.хранимые процедуры проще использовать: они могут состоять из десятков и сотен команд, но для их запуска достаточно указать всего лишь имя нужнойхранимой процедуры. Это позволяет уменьшить размер запроса, посылаемого от клиента на сервер, а значит, и нагрузку на сеть.

Хранение процедур в том же месте, где они исполняются, обеспечивает уменьшение объема передаваемых по сети данных и повышает общую производительность системы. Применение хранимых процедур упрощает сопровождение программных комплексов и внесение изменений в них. Обычно все ограничения целостности в виде правил и алгоритмов обработки данных реализуются на сервере баз данных и доступны конечному приложению в виде набора хранимых процедур, которые и представляют интерфейс обработки данных. Для обеспечения целостности данных, а также в целях безопасности, приложение обычно не получает прямого доступа к данным – вся работа с ними ведется путем вызова тех или иных хранимых процедур.

Подобный подход делает весьма простой модификацию алгоритмов обработки данных, тотчас же становящихся доступными для всех пользователей сети, и обеспечивает возможность расширения системы без внесения изменений в само приложение: достаточно изменить хранимую процедуру на сервере баз данных. Разработчику не нужно перекомпилировать приложение, создавать его копии, а также инструктировать пользователей о необходимости работы с новой версией. Пользователи вообще могут не подозревать о том, что в систему внесены изменения.

Хранимые процедуры существуют независимо от таблиц или каких-либо других объектов баз данных. Они вызываются клиентской программой, другойхранимой процедурой или триггером. Разработчик может управлять правами доступа к хранимой процедуре, разрешая или запрещая ее выполнение. Изменять код хранимой процедуры разрешается только ее владельцу или члену фиксированной роли базы данных. При необходимости можно передать права владения ею от одного пользователя к другому.

35. Хранимые процедуры представляют собой набор команд SQL, которые могут компилироваться и храниться на сервере. Таким образом, вместо того, чтобы хранить часто используемый запрос, клиенты могут ссылаться на соответствующую хранимую процедуру. Это обеспечивает лучшую производительность, поскольку данный запрос должен анализироваться только однажды и уменьшается трафик между сервером и клиентом. Хранимые процедуры – набор SQL-выражений, который может быть сохранен на сервере. Как только это сделано, клиенту уже не нужно повторно передавать запрос, а требуется просто вызвать хранимую программу.Это может быть полезным тогда, когда:1.многочисленные приложения клиента написаны в разных языках или работают на других платформах, но нужно использовать ту же базу данных операций 2.безопасность на 1 месте Хранимые процедуры и функции (подпрограммы) могут обеспечить лучшую производительность потому, что меньше информации требуется для пересылки между клиентом и сервером. Выбор увеличивает нагрузку на сервер БД, но снижает затраты на стороне клиента. Используйте это, если много клиентских машин обслуживаются одной или несколькими БД. Хранимые подпрограммы также позволяют вам использовать библиотеки функций, хранимые в БД сервера. Эта возможность представлена для многих современных языков программирования, которые позволяют вызывать их непосредственноХранимые процедуры требуют наличия таблицы proc в базе mysql. Эта таблица обычно создается во время установки сервера БД. При создании, модификации, удалении хранимых подпрограмм сервер манипулирует с таблицей mysql.proc Синтаксис хранимых процедур и функций Хранимая подпрограмма представляет собой процедуру или функцию. Хранимые подпрограммы создаются с помощью выражений CREATE PROCEDURE или CREATE FUNCTION. Хранимая подпрограмма вызывается, используя выражение CALL , причем только возвращающие значение переменные используются в качестве выходных. Функция может быть вызвана подобно любой другой функции и может возвращать скалярную величину. Хранимые подпрограммы могут вызывать другие хранимые подпрограммы.MySQL поддерживает полностью расширения, которые разрешают создать обычные SELECT выражения (без использования курсоров или локальных переменных) внутри хранимых процедур. Результирующий набор, возвращенный от запроса, а просто отправляется напрямую клиенту. Множественный SELECT запрос генерирует множество результирующих наборов, поэтому клиент должен использовать библиотеку, поддерживающую множественные результирующие наборы.CREATE PROCEDURE – создать хранимую процедуру.CREATE FUNCTION – создать хранимую функцию.EXECUTE привилегия потребуется для выполнения подпрограммы. Синтаксис:

CREATE PROCEDURE имя_процедуры ([параметр_процедуры[,…]])
[характеристёика …] тело_подпрограммы

CREATE FUNCTION имя_функции ([параметр_функции[,…]])
RETURNS тип
[характеристика …] тело_подпрограммы

параметр_процедуры:
[ IN | OUT | INOUT ] имя_параметра тип
параметр_функции:
имя_параметра тип

тип:
Любой тип данных MySQL

36. Функции пользователя представляют собой самостоятельные объекты базы данных, такие, например, как хранимые процедуры или триггеры. Функция пользователя располагается в определенной базе данных и доступна только в ее контексте. Пользовательские функции сходны с хранимыми процедурами, но, в отличие от них, могут применяться в запросах так же, как и системные встроенные функции. Пользовательские функции, возвращающие таблицы, могут стать альтернативой просмотрам. Просмотры ограничены одним выражением SELECT, а пользовательские функции способны включать дополнительные выражения, что позволяет создавать более сложные и мощные конструкции. В SQL Server имеются следующие классы функций пользователя:1)Scalar – функции возвращают обычное скалярное значение, каждая может включать множество команд, объединяемых в один блок с помощью конструкции BEGIN…END; 2)Inline – функции содержат всего одну команду SELECT и возвращают пользователю набор данных в виде значения типа данных TABLE ;3)Multi-statement – функции также возвращают пользователю значение типа данных TABLE, содержащее набор данных, однако в теле функции находится множество команд SQL ( INSERT, UPDATE и т.д.). FUNCTION [владелец.]

Всем привет. Как вы, возможно, знаете, раньше я все больше писал и рассказывал про хранилища, Vertica, хранилища больших данных и прочие аналитические вещи. Сейчас в область моей ответственности упали и все остальные базы, не только аналитические, но и OLTP (PostgreSQL), и NOSQL (MongoDB, Redis, Tarantool).

Эта ситуация позволила мне взглянуть на организацию, имеющую несколько баз данных, как на организацию, имеющую одну распределенную гетерогенную (разнородную) базу. Единую распределенную гетерогенную базу, состоящую из кучи PostgreSQL, Redis-ов и Монг… И, возможно, из одной-двух баз Vertica.

Работа этой единой распределенной базы порождает кучу интересных задач. Прежде всего, с точки зрения бизнеса важно, чтобы с данными, движущимися по такой базе, все было нормально. Я специально не использую здесь термин целостность, consistency, т.к. термин это сложный, и в разных нюансах рассмотрения СУБД (ACID и CAP теорема) он имеет разный смысл.

Ситуация с распределенной базой обостряется, если компания пытается перейти на микросервисную архитектуру. Под катом я рассказываю, как обеспечить целостность данных в микросервисной архитектуре без распределенных транзакций и жесткой связности. (А в самом конце объясняю, почему выбрал для статьи такую иллюстрацию).

Согласно Крису Ричардсону (одному из известнейших евангелистов микросервисной архитектуры), в этой архитектуре есть два подхода к работе с базами данных: shared database и database-per-service.

Shared database — это неплохой первый шаг, отличное решение для небольшой компании без амбициозных планов роста. При этом сам по себе этот паттерн является анти-паттерном с точки зрения микросервисной архитектуры, т.к. два сервиса, делящих общую базу, нельзя независимо тестировать и масштабировать. Т.е. эти сервисы скорее — один сервис, тяготеющий к превращению в монолит.

Паттерн database-per-service предполагает, что у каждого сервиса своя база. Сервис может обращаться к данным другого сервиса только через API (в широком смысле), без прямого подключения к его базе.

Паттерн database-per-service позволяет командам соответствующих сервисов выбирать базы, как им нравится. Кто-то умеет в MongoDB, кто-то верит в PostgreSQL, кому-то достаточно Redis (риск потери данных при выключении для этого сервиса приемлем), а кто-то вообще хранит данные в CSV-файлах на диске (а почему бы, собственно, и нет?).

Давайте посмотрим на задачу наведения порядка через призму классического СУБД-шного набора требований ACID: развернем суть каждой буквы аббревиатуры, и проиллюстрируем сложности с этой буквой в микросервисной архитектуре.

(A) CID — Atomicity. Atomicity — все или ничего.

Согласно требованию Atomicity, нужно обязательно выполнить все шаги (с возможными повторами), при отказе важного шага — отменить выполнившиеся.

В приведенной иллюстрации демонстрируется тестовый процесс покупки услуги VIP: резервируются деньги в биллинге (1), для пользователя подключается бонусная услуга (2), тип пользователя меняется на Pro (3), зарезервированные деньги в биллинге списываются (4). Все четыре шага должны либо выполниться, либо не выполниться.

При этом нельзя зависнуть посередине процесса, поэтому предпочтительнее асинхронность, в крайнем случае — синхронность со встроенным таймаутом.

A(С)ID – Consistency. Consistency – каждый шаг не должен противоречить граничным условиям.

ACI(D) — Durability. Требование Durability означает, что последствия операций не пропадают.

А где же I, спросите вы?

А нигде. Изоляция в среде нескольких независимых асинхронных сервисов — это техническое требование. Современные исследования показали, что реальные бизнес-процессы можно реализовывать без изоляции. Изоляция упрощает мышление тем, что минимизирует параллелизм (разработка параллельных вычислений сложнее для программиста), но микросервисная архитектура по своей сути массивно-параллельная, изоляция в такой среде избыточна.

Существует много подходов, позволяющих добиться соблюдения перечисленных выше требований. Наиболее широко известен алгоритм распределенных транзакций, обеспечиваемых так называемым двухфазным коммитом (2PC). К сожалению, реализация двухфазных коммитов требует переписывания всех вовлеченных сервисов. И самое серьезное: этот алгоритм не очень производителен. Приведенные иллюстрации из недавних исследований показывают, что этот алгоритм показывает определенную производительность на распределенной базе из двух серверов, но при росте количества серверов производительность растет не линейно… А точнее, практически совсем не растет.

Одно из главных достоинств микросервисной архитектуры — возможность около линейно наращивать производительность, просто добавляя больше и больше серверов. Получается, что если для обеспечения распределенной целостности использовать двухфазный коммит, то этот процесс станет узким местом, ограничителем для роста производительности, несмотря на наращивание количества серверов.

Как же можно обеспечить распределенную целостность (требования ACiD) без двухфазных коммитов, с возможностью линейно масштабироваться по производительности?

Алгоритм саг имеет два варианта. Поэтому сначала я хотел бы универсально описать требуемые элементы алгоритма, чтобы описание подходило для обоих вариантов.

Элемент 3. Отменяемость вызовов сервисов (шагов) по ключу идемпотентности.

Второй нюанс, характерный скорее для хореографических саг, но возможный и для оркестрируемых, заключается в выборе подхода к регистрации бизнес-процессов, типов саг в сервисе саг. В примере для Atomicity описан процесс из четырех последовательных обязательных шагов.

Собственно вот. С серьезным изложением, думаю, стоит закончить, а то статья получилась слишком большая.

Вот ссылка на презентацию этого материала, доклад на эту тему я делал на Highload Siberia 2018.
UPD — и видео с конференции:

Напоследок хотел бы попробовать объяснить все, перечисленное выше, более образным языком.
Ведь что такое сага изначально? Это сюжет, это приключение из средних веков… Или из Игры Престолов. Происходит событие (битва, свадьба, кто-то умирает), весть об этом летит по миру через гонцов, через почтовых голубей, через купцов. Когда весть доходит до заинтересованных (через неделю, через месяц, через год), они реагируют: отправляют армии, объявляют войну, кого-то казнят, и летят новые вести.

Нет контролирующего органа, следящего за последовательностью действий. Нет транзакций, нет rollback, в смысле отмены действия, как будто его никогда не было. Все по-взрослому, каждое действие происходит навсегда. Его можно компенсировать, но это именно действие (убийство) и компенсация (плата за голову, вира), а не отмена смерти.

События идут долго, доходят из разных источников, действия происходят параллельно, а не строго последовательно. И довольно часто в сюжете внезапно возникают новые участники, решившие поучаствовать (прилетают драконы ;))… а кое-кто из старых участников внезапно умирает.

Такие дела. Вроде бардак и хаос, но все работает, внутренняя согласованность мира не нарушается, сюжет развивается и непротиворечив… Хотя иногда и непредсказуем.

Целостность данных - это поддержание и обеспечение точности и согласованности данных на протяжении всего их жизненного цикла и является критическим аспектом для проектирования, реализации и использования любой системы, которая хранит, обрабатывает или извлекает данные. Термин имеет широкую область применения и может иметь самые разные значения в зависимости от конкретного контекста - даже в рамках одного и того же общего представления о вычислениях . Иногда он используется как прокси-термин для обозначения качества данных , в то время как проверка данных является предварительным условием целостности данных. Целостность данных противоположна повреждению данных . Общая цель любого метода обеспечения целостности данных одинакова: гарантировать, что данные записываются точно так, как предполагалось (например, база данных правильно отклоняет взаимоисключающие возможности). Более того, при последующем извлечении убедитесь, что данные такие же, как при первоначальной записи. Короче говоря, целостность данных направлена на предотвращение непреднамеренных изменений информации. Целостность данных не следует путать с безопасностью данных , дисциплиной защиты данных от неавторизованных сторон.

Любые непреднамеренные изменения данных в результате операции хранения, извлечения или обработки, включая злонамеренные действия, неожиданный отказ оборудования и человеческую ошибку , являются нарушением целостности данных. Если изменения являются результатом несанкционированного доступа, это также может быть нарушением безопасности данных. В зависимости от задействованных данных это может проявиться как безобидный, как отдельный пиксель на изображении, имеющий другой цвет, чем был первоначально записан, до потери фотографий из отпуска или критически важной для бизнеса базы данных, даже до катастрофической потери человеческих жизней в жизни. -критическая система .

СОДЕРЖАНИЕ

Типы целостности

Физическая целостность

Физическая целостность решает проблемы, связанные с правильным хранением и извлечением самих данных. Проблемы с физической целостностью могут включать электромеханические неисправности, дефекты конструкции, усталость материала , коррозию , перебои в подаче электроэнергии , стихийные бедствия и другие особые экологические опасности, такие как ионизирующее излучение , экстремальные температуры, давления и перегрузки . Обеспечение физической целостности включает такие методы, как избыточное оборудование, источник бесперебойного питания , определенные типы RAID- массивов, радиационно-стойкие микросхемы, память с исправлением ошибок , использование кластерной файловой системы , использование файловых систем, которые используют контрольные суммы на уровне блоков, такие как ZFS , хранилище массивы, которые выполняют вычисления четности, такие как исключительное или или используют криптографическую хеш-функцию и даже имеют сторожевой таймер для критических подсистем.

Для обеспечения физической целостности часто широко используются алгоритмы обнаружения ошибок, известные как коды с исправлением ошибок . Ошибки целостности данных, вызванные деятельностью человека, часто обнаруживаются с помощью более простых проверок и алгоритмов, таких как алгоритм Дамма или алгоритм Луна . Они используются для поддержания целостности данных после ручной транскрипции из одной компьютерной системы в другую посредником-человеком (например, номера кредитных карт или банковских маршрутов). Компьютерные ошибки транскрипции могут быть обнаружены с помощью хэш-функций .

В производственных системах эти методы используются вместе для обеспечения различной степени целостности данных. Например, файловая система компьютера может быть настроена на отказоустойчивом массиве RAID, но может не предоставлять контрольные суммы на уровне блоков для обнаружения и предотвращения скрытого повреждения данных . В качестве другого примера, система управления базой данных может соответствовать свойствам ACID , но контроллер RAID или внутренний кэш записи жесткого диска могут не соответствовать.

Логическая целостность

Этот тип целостности связан с правильностью или рациональностью части данных в конкретном контексте. Сюда входят такие темы, как ссылочная целостность и целостность сущностей в реляционной базе данных или правильное игнорирование невозможных данных датчиков в роботизированных системах. Эти заботы включают обеспечение того, чтобы данные "имели смысл" с учетом среды. Проблемы включают ошибки программного обеспечения , недостатки дизайна и человеческие ошибки. Общие методы обеспечения логической целостности включают в себя такие вещи, как проверочные ограничения , ограничения внешних ключей , программные утверждения и другая во время выполнения проверки здравомыслия.

Как физическая, так и логическая целостность часто имеют много общих проблем, таких как человеческие ошибки и недостатки проектирования, и оба должны соответствующим образом обрабатывать параллельные запросы на запись и извлечение данных, последний из которых является полностью самостоятельной темой.

Если в секторе данных есть только логическая ошибка, его можно использовать повторно, перезаписав его новыми данными. В случае физической ошибки затронутый сектор данных навсегда становится непригодным для использования.

Базы данных

Целостность данных содержит рекомендации по хранению данных , определяя или гарантируя продолжительность времени, в течение которого данные могут храниться в конкретной базе данных. Для обеспечения целостности данных эти правила последовательно и регулярно применяются ко всем данным, поступающим в систему, и любое ослабление правоприменения может вызвать ошибки в данных. Осуществление проверок данных как можно ближе к источнику ввода (например, ввод данных человеком) приводит к тому, что в систему поступает меньше ошибочных данных. Строгое соблюдение правил целостности данных приводит к снижению частоты ошибок и экономии времени на устранение неполадок и отслеживание ошибочных данных и ошибок, которые они вызывают в алгоритмах.

Целостность данных также включает правила, определяющие отношения, которые часть данных может иметь с другими частями данных, например, запись клиента, которой разрешено связывать с приобретенными Продуктами , но не с несвязанными данными, такими как Корпоративные активы . Целостность данных часто включает проверки и исправление недопустимых данных на основе фиксированной схемы или предопределенного набора правил. Примером являются вводимые текстовые данные, где требуется значение даты и времени. Также применимы правила получения данных, определяющие способ получения значения данных на основе алгоритма, участников и условий. Он также определяет условия того, как значение данных может быть получено повторно.

Типы ограничений целостности

Целостность данных обычно обеспечивается в системе баз данных с помощью ряда ограничений или правил целостности. Три типа ограничений целостности являются неотъемлемой частью реляционной модели данных: целостность объекта, ссылочная целостность и целостность домена.

Целостность сущности касается концепции первичного ключа . Целостность объекта - это правило целостности, которое гласит, что каждая таблица должна иметь первичный ключ и что столбец или столбцы, выбранные в качестве первичного ключа, должны быть уникальными, а не пустыми.
Ссылочная целостность касается концепции внешнего ключа . Правило ссылочной целостности гласит, что любое значение внешнего ключа может находиться только в одном из двух состояний. Обычное положение дел таково, что значение внешнего ключа относится к значению первичного ключа некоторой таблицы в базе данных. Иногда, и это будет зависеть от правил владельца данных, значение внешнего ключа может быть нулевым . В этом случае мы явно говорим, что либо между объектами, представленными в базе данных, нет никакой связи, либо эта связь неизвестна.
Целостность домена указывает, что все столбцы в реляционной базе данных должны быть объявлены в определенном домене. Первичной единицей данных в реляционной модели данных является элемент данных. Такие элементы данных называются неразложимыми или атомарными. Домен - это набор значений одного типа. Таким образом, домены представляют собой пулы значений, из которых берутся фактические значения, появляющиеся в столбцах таблицы.
Определенная пользователем целостность относится к набору правил, определенных пользователем, которые не принадлежат к категориям сущности, домена и ссылочной целостности.

Если база данных поддерживает эти функции, она несет ответственность за обеспечение целостности данных, а также за модель согласованности для хранения и извлечения данных. Если база данных не поддерживает эти функции, приложения несут ответственность за обеспечение целостности данных, в то время как база данных поддерживает модель согласованности для хранения и поиска данных.

Наличие единой, хорошо контролируемой и четко определенной системы целостности данных увеличивает

стабильность (одна централизованная система выполняет все операции целостности данных)
производительность (все операции целостности данных выполняются на том же уровне, что и модель согласованности)
возможность повторного использования (все приложения получают выгоду от единой централизованной системы целостности данных)
ремонтопригодность (единая централизованная система для всего администрирования целостности данных).

Современные базы данных поддерживают эти функции (см. Сравнение систем управления реляционными базами данных ), и де-факто ответственность за обеспечение целостности данных стала возложена на базу данных. Компании и многие системы баз данных предлагают продукты и услуги для переноса устаревших систем на современные базы данных.

Примеры

Примером механизма целостности данных являются отношения между родителями и потомками связанных записей. Если родительская запись владеет одной или несколькими связанными дочерними записями, все процессы ссылочной целостности обрабатываются самой базой данных, что автоматически обеспечивает точность и целостность данных, так что ни одна дочерняя запись не может существовать без родительской записи (также называемой осиротевшей) и что ни один родитель не теряет свои дочерние записи. Это также гарантирует, что никакая родительская запись не может быть удалена, пока родительская запись владеет какими-либо дочерними записями. Все это обрабатывается на уровне базы данных и не требует проверки целостности кода в каждом приложении.

Файловые системы

Результаты различных исследований показывают, что ни широко распространенные файловые системы (включая UFS , Ext , XFS , JFS и NTFS ), ни аппаратные решения RAID не обеспечивают достаточной защиты от проблем целостности данных.

Некоторые файловые системы (включая Btrfs и ZFS ) предоставляют внутренние данные и контрольную сумму метаданных, которые используются для обнаружения скрытого повреждения данных и улучшения целостности данных. Если таким образом обнаруживается повреждение и также используются внутренние механизмы RAID, предоставляемые этими файловыми системами, такие файловые системы могут дополнительно прозрачным образом восстанавливать поврежденные данные. Этот подход позволяет улучшить защиту целостности данных, охватывающую все пути данных, что обычно называется сквозной защитой данных .

Целостность данных применительно к различным отраслям

Смотрите также

использованная литература

дальнейшее чтение

Проблема обеспечения целостности данных является одной из самых важных в реляционных базах данных. Тем не менее, несмотря на многолетние изучения в данной области, все еще не существует четкого определения этого понятия. Вообще под целостностью данных понимается представление данных в базе данных в правильном виде, который определяется ограничениями целостности, представляющими собой логические выражения, результат вычисления которых должен быть истинным [1].

Как было сказано выше, ограничение целостности является логическим выражением, параметры которого не определены, что делает ограничение целостности предикатом. Суть подобного предиката следующая — если некоторый кортеж относится к определенной переменной отношения, то для него должно выполняться заданное условие. Соответственно, проверить, выполняется ли указанное ограничение целостности можно только при подстановке вместо формального параметра предиката переменной отношения. Но когда именно и при каких условиях будет совершаться данная подстановка? Прежде, чем ответить на этот вопрос, необходимо разобраться с крайне важным правилом, касающемся ограничений целостности и называемым также золотым правилом.

Золото правило ограничений целостности гласит, что никакая операция обновления при ее выполнении не должна привести к тому, чтобы предикат этой базы данных получил ложное значение [1]. Это значит, что производить проверку ограничений целостности необходимо при выполнении любой операции обновления, которыми являются, например, вставка нового кортежа или изменение атрибута некоторого уже имеющегося в переменной отношения кортежа. Итак, с условием проверки ограничения целостности разобраться удалось, но когда же все-таки ее проводить?

Отдельно необходимо рассмотреть вопрос с проверкой ограничений целостности в транзакциях. Как известно, транзакция является логической единицей работы, для выполнения которой необходимо выполнить несколько операций. Ранее считалось, что проверку ограничения целостности необходимо проводить по завершению транзакции, откатив изменения при неудачном варианте. Сейчас же считается, что для транзакций стандартные правила не меняются и проверка ограничения целостности также должна производиться перед выполнением любой операции обновления. Плюсом первого способа является меньшее число проверок, а минусом — необходимость откатывать все изменения при неудачной проверки по завершению транзакции. Минусом же второго способа, соответственно, является необходимость проверки каждой операции, но его плюсы перекрывают этот минус с лихвой: более высокая надежность (по завершению транзакции целостность может быть не нарушена, но она может быть нарушена во время ее выполнения) и возможность более быстрого отката изменений. Именно поэтому второй способ и является предпочтительнее первого, так как только он позволяет полностью выполнить все указанные ограничения целостности.

Нельзя не сказать про то, что ограничения целостности имеют свою четкую схему классификации ограничений, которая подразделяет их на четыре основные категории [1], а именно на:

2) Ограничения переменной отношения — это те ограничения, которые указывают, какие значения разрешено принимать некоторой переменной отношения. Подобные ограничения распространяются только на одну переменную отношения. Считается, что ограничения переменной отношения являются частным случаем ограничений базы данных и что выделять их в отдельную категорию не нужно. Это мнение имеет право на существование, ведь, например, среди ограничений переменной отношения, как и среди ограничений базы данных, обособленно выделяются ограничения перехода.

В заключение хотелось бы еще раз отметить, что пробела целостности данных в базах данных является очень важной, ведь только при выполнении всех ограничений целостности (проверка выполнения которых производится перед проведением любой операции обновления) база данных будет содержать в наибольшей степени правильные значения.

Основные термины (генерируются автоматически): ограничение целостности, баз данных, ограничение, ограничение базы данных, выполнение любой операции обновления, завершение транзакции, значение атрибута, ограничение переменной отношения, ограничение типа, первичный ключ.

Считается, что база данных спроектирована хорошо тогда, когда каждая запись в любой таблице является уникальной. Это означает, что значение некоторого поля (или нескольких полей) не повторяется ни в одной записи в таблице. Такой идентификатор называется первичным ключом (или просто ключом).

Ключ - минимальный уникальный идентификатор, состоящий из одного или нескольких полей. При проектировании баз данных MS Access чаще всего для ключа используют поля с типом данных Счетчик. Для задания ключа нужно: 1) в режиме Конструктор выделить поле; 2) в меню Правка выбрать команду Ключевое поле (при этом появится изображение ключа).

Просмотр данных, содержащихся в таблице, осуществляется в режиме таблицы (выделить необходимую таблицу и нажать кнопку Открыть). В этом режиме можно не только просматривать, но и форматировать данные, вставлять и удалять записи, редактировать данные. В этом режиме изменять структуру таблиц (добавлять, удалять поля; изменять свойства полей и т.д.) Нельзя.

Задание связей между таблицами

· Каскадное обновление связанных полей. Если эта опция выбрана, то при изменении первичного ключа автоматически меняется связанный вторичный ключ. Если эта опция не выбрана, то при попытке редактировать первичный ключ появится предупреждение о том, что вносить изменения нельзя.

· Каскадное удаление связанных полей. Если выбрана эта опция, то при удалении записи все связанные с первичным ключом записи также удаляются. Если она не выбрана, то появляется предупреждение, что, если имеются записи, связанные с данной записью, удалять ее нельзя.

· Объединение. Применяется для выбора типа объединения, используемого по умолчанию при создании запросов на основе связанных таблиц. Включает указания на то, надо ли выводить на экран только записи, которые имеют общий ключ в обеих таблицах, или же надо вывести одну таблицу полностью и все связанные с ней записи из другой таблицы.

Для того чтобы разорвать существующую связь между таблицами, нужно в окне схемы данных щелкнуть по линии, связывающей поля таблиц и нажать клавишу Delete.

2. Понятие формулы в Excel. Ссылки

Ввод информации в ячейки

Прежде чем ввести информацию в ячейку, эту ячейку нужно выделить, поместив туда табличный курсор, имеющий вид объемного креста, и щелкнув мышью. Выделенная ячейка окружается жирной черной рамкой. При вводе информации, вводимые символы появляются на экране сразу в 2-х местах: в выбранной ячейке и в строке формул. В этой строке появляются также две новые кнопки:

Отмена;

Ввод. Сохранить вводимые данные в текущей ячейке можно следующими способами:

1. Щелкнуть по кнопке Ввод;

2. Нажать клавишу ;

3. Нажать на одну из стрелок на клавиатуре, и, тем самым, одновременно перейти в соседнюю ячейку.

4. Щелкнуть мышью на другой ячейке.

Если ввод данных в ячейку еще не закончен, и его нужно аннулировать, то нужно щелкнуть по кнопке Отмена или нажать . Нажатие на кнопку в строке формул вызывает появление Палитры формул, которая облегчает ввод и редактирование формулы, в которой используются функции Excel.

Данные типа формула. Это то, что делает электронную таблицу электронной таблицей. Без формул Excel был бы лишь усовершенствованным для работы с таблицами текстовым процессором. Основное правило – ввод формулы нужно начинать со знака "=" (иначе это будет текст). Excel позволяет вводить сложные формулы длиной до 1024 знаков. Формула может содержать: адреса ячеек таблицы, числа, математические функции и знаки операций: + (сложение), - (вычитание), * (умножение), / (деление), Ù (возведение в степень). Порядок их выполнения определяется приоритетом: 1 – функции 2 – "Ù" 3 – "*" и "/" 4 – "+" и "-"

Повысить приоритет можно, применяя круглые скобки.

1. Выполнить команду Сервис® Параметры.

2. На вкладке "Вид" установить флажок Формулы

(Вместо действий 1,2 можно нажать комбинацию клавиш ). В противном случае увидеть формулу можно только в строке формул, если ячейка с формулой является выделенной (активной).

Набор встроенных функций.

Это можно осуществить двумя способами: вручную и при помощи Мастера функций Вручную набор производится так: набирается имя функции и далее без пробелов аргумент(ы), заключенный(ые) в круглые скобки. Если аргументов несколько, то друг от друга они отделяются знаком ";". Аргумент может быть числом, адресом ячейки или блоком ячеек, например,

СРЗНАЧ (А7; В12; С7: С20) Мастер функций можно вызвать кнопкой на панели инструментов Стандартная или в строке формул. Ввод функции осуществляется в 2 этапа:

1. В диалоговом окне Мастер функций: шаг 1 из 2 нужно выбрать требуемую функцию из предлагаемого списка (после чего она будет внесена в формулу, а внизу диалогового окна будут видны ее аргументы) и нажать кнопку Далее.

2. В окне Мастер функций: шаг 2 из 2 нужно задать значения аргументов для выбранной функции. Их можно задавать вручную, или непосредственно выделяя соответствующие ячейки в таблице (окно Мастера функций, если оно Вам мешает, сдвиньте в сторонку!).

Если таких аргументов несколько, то для перехода к следующему (новая строка в окне) нажмите клавишу или щелкните мышью.

Если аргументом функции является другая функция, то для ее вставки нужно нажать кнопку , изображенную в начале строки.

Автосуммирование. Excel позволяет упростить использование функции СУММ (суммирование ряда значений). Для этой цели нужно использовать инструмент (Автосуммирование), расположенный на панели Стандартная.

1. Поставить курсор в ячейку, где должна находится сумма, и щелкнуть по кнопке .

2. Убедиться, что Excel правильно определил диапазон данных для суммирования (вокруг него движется пунктирная линия, и он вписан в качестве аргумента) и при необходимости изменить его.

Читайте также: