4 Требования к управлению данными ГОСТ 34.321-96

4.1 Информационные системы ГОСТ 34.321-96

Информационная система - это система, которая организует процессы сбора, хранения и обработки информации о проблемной области. Она может быть размещена на одной или нескольких компьютерных системах. Если информационная система размещена на нескольких компьютерных системах, то она будет рассматриваться как распределенная информационная система.

Данные поступают в информационную систему и исключаются из нее, и эти взаимодействия могут осуществляться или людьми, или процессами.

Управление данными в настоящем стандарте будет касаться организации и управления постоянными данными. Постоянные данные - это данные, которые хранятся в информационной системе в течение определенного периода времени. Система, которая выполняет функцию организации и управления постоянными данными, называется системой управления данными [из 4.1 Информационные системы ГОСТ 34.321-96]

4.2 База данных и схема ГОСТ 34.321-96

Постоянные данные в среде базы данных заключают в себе схему и базу данных. Схема - это описания содержания, структуры и ограничения целостности, используемые для создания базы данных. База данных - это набор постоянных данных, определенных с помощью схемы.

Система управления данными использует определения данных в схеме, чтобы предоставлять возможность доступа и управлять доступом к данным в базе данных [из 4.2 База данных и схема ГОСТ 34.321-96]

4.3 Средство моделирования данных ГОСТ 34.321-96

Схему разрабатывают в соответствии с совокупностью правил структурирования данных. Каждая совокупность правил структурирования данных может иметь связанную с ней совокупность правил манипулирования данными, определяющую процессы, которые могут быть выполнены над структурированными данными.

Правила структурирования данных и правила манипулирования данными - это средства моделирования данных.

Язык баз данных используется, чтобы определить схему согласно правилам структурирования данных и процессы в соответствии со связанными с ними правилами манипулирования данных.

Примерами классов средства моделирования данных являются реляционный, сетевой и иерархический классы. Правила структурирования данных для двух средств моделирования данных в различных классах могут быть похожими, как, например, для сетевого и реляционного, но связанные с ними средства манипулирования данными могут отличаться [из 4.3 Средство моделирования данных ГОСТ 34.321-96]

4.4 Независимость данных ГОСТ 34.321-96

Независимость данных - это независимость процессов от объектов данных, которая состоит в том, что объекты данных могут быть изменены без нарушения процессов.

Независимость данных, как правило, достигается тремя способами.

Первый способ состоит в связывании процесса со схемой таким образом, что процесс знает только ту часть схемы, а именно прикладную схему, которая необходима процессу управления данными.

Второй способ - это обеспечение независимости прикладных процессов от физического представления данных.

Третий способ - это включение как можно большего количества ограничений целостности в схему, а не в прикладные процессы [из 4.4 Независимость данных ГОСТ 34.321-96]

4.5 Процессоры и интерфейсы ГОСТ 34.321-96

Процесс управления данными может быть вызван пользователем, процессами управления данными или другими процессами. Процессы выполняются процессорами, каждый из которых имеет интерфейс. Интерфейс процессора должен быть точно определен. Такие интерфейсы могут быть независимыми от стандартного языка программирования, используемого для определения процесса с использованием интерфейса.

В любом интерфейсе существуют факторы, о которых пользователь должен знать, чтобы иметь возможность использовать основной процессор. Эти факторы должны быть сведены к минимуму, чтобы обеспечить как можно большую независимость в интерфейсе [из 4.5 Процессоры и интерфейсы ГОСТ 34.321-96]

4.6 Управление доступом ГОСТ 34.321-96

Управление доступом - это предотвращение несанкционированного использования ресурса, включая предотвращение использования ресурса несанкционированным образом.

Для управления данными задание управления доступом состоит в разрешении санкционированного доступа к данным и предотвращении несанкционированного доступа. Такое управление доступом определяет процессы, которые может выполнять пользователь.

В любой организационной ситуации существуют требования к управлению доступом, которые могут быть выражены в терминах стратегии безопасности. Стратегия безопасности устанавливает, какую форму доступа требует каждый пользователь информационной системы. Информационная система должна иметь соответствующие механизмы управления доступом для проведения в жизнь стратегии безопасности.

Управление доступом должно основываться на принципе идентичности человека и процесса.

Требования управления доступом в контексте управления данными должны быть следующими:

Для определения привилегий требуются определенные средства. Процесс выделения привилегий пользователям называется санкционированием. Глобальные полномочия даются тому, кто должен создать или модифицировать другие привилегии управления доступом в среде управления данными.

Привилегии могут определяться в терминах идентификатора пользователя, ограничениями на использование информационной системы, баз данных, схем, типов данных, времени и размещения, а также используя их комбинации.

Может потребоваться дополнительная информация, такая, например, как идентификатор пользователя, который санкционирует привилегию.

Данные, описывающие привилегии, называют данными по управлению доступом. Эти данные должны храниться и управляться точно так же, как и любые другие данные в области управления данными.

Решение позволить любой конкретный доступ к данным основывается на привилегиях пользователя.

Проведение в жизнь управления доступом требует, чтобы пользователи и процессы, выполняющие роль пользователей, были идентифицированы и чтобы законность запроса на использование этого процесса доступа к требуемым данным могла быть проконтролирована в момент выполнения [из 4.6 Управление доступом ГОСТ 34.321-96]

4.7 Поддержка управления данными ГОСТ 34.321-96

Требования, накладываемые информационными системами на управление данными, которые не зависят от конкретных требований информационной системы хранения и манипулирования данными, следующие:

Управление данными обеспечивает обобщенные средства удовлетворения этих требований так, чтобы не было необходимости разрабатывать конкретные решения для каждой информационной системы [из 4.7 Поддержка управления данными ГОСТ 34.321-96]

4.7.1 Управление конфигурацией, управление версиями и варианты ГОСТ 34.321-96

Деятельность по управлению изменениями, осуществляемыми в конфигурации информационной системы за какой-то период времени, называется управлением конфигурацией. Следует идентифицировать дискретные версии системной конфигурации в конкретные моменты времени, а также продолжать следить за конфигурацией, которая принадлежит каждой конкретной версии.

Когда информационная система находится в некоторых фазах жизненного цикла, то для параллельного существования в различных формах могут потребоваться постоянные данные и процессы, которые являются частью информационной системы.

Две формы процесса могут считаться различными вариантами. Это означает, что каждый вариант удовлетворяет различным требованиям (таким, как различие внутренних представлений памяти) и ни один вариант не предназначен для того, чтобы изменять другой [из 4.7.1 Управление конфигурацией, управление версиями и варианты ГОСТ 34.321-96]

4.7.2 Параллельная обработка ГОСТ 34.321-96

Информационная система является ресурсом, который может быть распределен между несколькими пользователями одновременно. Пользователь может инициировать запрос на услуги системы управления данными, которыми можно управлять более целесообразно, если доступ к данным может быть сделан одновременно. Среда управления данными должна гарантировать выполнение отдельного намерения каждого пользователя таким образом, чтобы он согласовывался с его восприятием данных.

Параллельные взаимодействия не должны влиять друг на друга, а параллельная обработка не должна влиять на целостность данных [из 4.7.2 Параллельная обработка ГОСТ 34.321-96]

4.7.3 Управление транзакцией базы данных ГОСТ 34.321-96

Транзакция базы данных определяется как ограниченная последовательность взаимодействий базы данных, которые вместе образовывают логическую единицу работы. В случаях обновления базы данных транзакция базы данных является последовательностью шагов обновления, которые изменяют содержание базы данных из одного непротиворечивого состояния в другое.

Требования к управлению транзакциями базы данных следующие:

  • следствия всех изменений должны оставаться в базе данных после завершения транзакции базы данных или ни одни из них не остаются;
  • после завершения работы транзакция базы данных оставляет базу данных в непротиворечивом состоянии;
  • изменения, осуществленные транзакцией базы данных, должны быть невидимы для любой другой параллельной транзакции базы данных и наоборот;
  • заблокированная один раз система должна гарантировать, что результаты транзакции базы данных переживают любые последующие отказы.

Параллельное выполнение нескольких транзакций базы данных должно быть эквивалентным в том смысле, что выполнение их параллельно является таким же самым, как если бы они выполнялись последовательно [из 4.7.3 Управление транзакцией базы данных ГОСТ 34.321-96]

4.7.4 Проектирование производительности ГОСТ 34.321-96

Необходимо создавать возможности для улучшения производительности любой информационной системы: прикладной системы, системы словарей или системы, в которой интегрируются обе системы.

Основой получения таких улучшений является накопление статических данных о частоте использования процессов и частоте доступа и изменений в объектах данных [из 4.7.4 Проектирование производительности ГОСТ 34.321-96]

4.7.5 Идентификация объектов ГОСТ 34.321-96

Каждый объект в среде базы данных должен быть уникальным. Это может быть достигнуто или путем присвоения каждому объекту уникального имени с использованием вложенной иерархии пространств имен, или при помощи другого механизма.

Для того чтобы дать уникальное имя в среде базы данных, может потребоваться, чтобы имена были определены с помощью имен во внешнем пространстве имен.

Именем может быть имя, назначенное пользователем или системой управления данными.

Требование именования существует для прикладных систем, систем словарей других типов информационной системы. Если имеется более чем одна среда базы данных в компьютерной системе, тогда требуется, чтобы одна среда была отличима от другой [из 4.7.5 Идентификация объектов ГОСТ 34.321-96]

4.7.6 Расширение средства моделирования данных ГОСТ 34.321-96

Средство моделирования данных может быть типовым для систем управления данными. Одновременно может возникнуть требование добавлять типы данных и связанные с ними процессы.

Примером этого требования является полная текстовая обработка в соединении с обработкой структурированных данных типичным средством моделирования данных [из 4.7.6 Расширение средства моделирования данных ГОСТ 34.321-96]

4.7.7 Поддержка для различных средств моделирования данных в интерфейсе пользователя ГОСТ 34.321-96

Следует иметь возможность отображать данные в формате, предпочитаемом системой управления данными, и формате, предпочитаемом пользователем. Это требование связано с тем, что пользователь может предпочесть манипулировать данными в соответствии со средством моделирования данных, отличным от средства, обеспеченного системой управления данными [из 4.7.7 Поддержка для различных средств моделирования данных в интерфейсе пользователя ГОСТ 34.321-96]

4.7.8 Контрольные журналы ГОСТ 34.321-96

Необходимо обеспечить возможность сохранять записи об успешных изменениях в данных в базе данных и в некоторых случаях - запись о транзакциях, которые запрашивают данные и генерируют отчеты. Эта запись может включать соответствующие значения данных, подробности транзакции и идентификацию пользователя. Эти контрольные журналы могут быть определены, как требуемые для всех данных в базе данных, избранных типов данных или экземпляров определяемых данных [из 4.7.8 Контрольные журналы ГОСТ 34.321-96]

4.7.9 Восстановление ГОСТ 34.321-96

База данных должна иметь возможность возвратиться к предшествующему непротиворечивому состоянию. Это требование может возникнуть из-за ошибочных транзакций, системного сбоя или потери хранимых данных. Чтобы удовлетворить эти требования, могут использоваться различные механизмы, такие как запись всех изменений, сделанных в базе данных, и сохранение резервных копий всей базы данных или ее части.

Модифицированные данные, которые распределяются в более чем одной базе данных, должны быть восстановлены таким образом, чтобы конечный результат имел непротиворечивое состояние и состояние базы данных было бы непротиворечивым [из 4.7.9 Восстановление ГОСТ 34.321-96]

4.7.10 Логическое реструктурирование данных. Реорганизация физической памяти ГОСТ 34.321-96

Логическое реструктурирование данных определяется как процесс изменения определения данных после того, как информационная система использовалась в течение некоторого времени. Изменение может быть дополнением к существующему определению данных или может заключать в себе модификацию части существующего определения данных.

Реорганизация физической памяти определяется как процесс изменения представления постоянных данных на носителе данных [из 4.7.10 Логическое реструктурирование данных. Реорганизация физической памяти ГОСТ 34.321-96]

4.8 Дополнительные эксплуатационные требования для поддержки управления данными в распределенной информационной системе ГОСТ 34.321-96

В распределенной информационной системе объекты, принадлежащие одной информационной системе, распределяются на два или более компьютера. Когда распределяемые объекты являются объектами базы данных, система является распределенной системой баз данных.

Запрашиваемая услуга может быть доступна из множества вычислительных устройств, вмещающих дублированные данные.

Эксплуатационные требования, зависящие от распределяемых данных, следующие:

  • управление распределением;
  • управление транзакцией базы данных;
  • связь;
  • экспорт/импорт;
  • независимость распределения.

Некоторые из этих требований также применимы к информационной системе, которая включает более чем одну среду базы данных в единственной компьютерной системе.

Необходимо поддерживать среду других возможностей:

  1. распределенную систему базы данных, в которой составные среды базы данных проектируются таким образом, что возможно взаимодействие между любой парой;
  2. систему баз данных, в которой две или более отдельно спроектированные системы баз данных объединяются, в определенном смысле, после периода раздельного использования и создаются для функционирования как одна распределенная система баз данных;
  3. ситуацию, в которой каждая среда базы данных согласуется множеством стандартов и, следовательно, может взаимодействовать (возможно, на специальной основе) с другими средами баз данных, каждая из которых была спроектирована отдельно, но согласно тем же самым стандартам.

[из 4.8 Дополнительные эксплуатационные требования для поддержки управления данными в распределенной информационной системе ГОСТ 34.321-96]

4.8.1 Управление распределением ГОСТ 34.321-96

Управление распределением включает управление фрагментацией, управление дублированием и автономию месторасположения.

Могут использоваться такие способы распределения данных:

  1. назначить все экземпляры определенного типа на одну среду базы данных (нефрагментированный способ);
  2. назначить множества экземпляров данных (возможно различных типов) на две или более среды баз данных (горизонтальная фрагментация);
  3. назначить экземпляры различных частей того же самого типа на две или более среды баз данных (вертикальная фрагментация);
  4. комбинация пунктов б) и в) (комбинированная горизонтальная и вертикальная фрагментация).

Горизонтальная фрагментация дает возможность записывать на вычислительном устройстве только экземпляры данных, которые относятся к этому вычислительному устройству.

Вертикальная фрагментация дает возможность записывать на конкретном вычислительном устройстве только экземпляры данных, которые относятся к нему.

Если фрагментация поддерживается в распределенной среде, то не требуется, чтобы пользователь информационной системы знал, как данные фрагментируются или распределяются между компьютерными системами.

По причинам производительности или защиты от сбоя компьютерной системы необходимо обеспечить копию всей базы данных или ее части. Такие дублированные данные могут храниться в компьютерной системе, отличной от той, в которой данные первоначально создаются и в дальнейшем управляются. Требование для фрагментации может быть объединено с требованием дублирования так, чтобы копии множества фрагментов назначались на две или более среды баз данных. Информация о том, какие объекты, в какой среде данных являются доступными, должна быть доступна (прямо или непрямо) в каждой среде.

Необходимо иметь возможность управлять содержанием точных копий, когда данные обновляются. Алгоритмы, которые обеспечивают контроль точных копий, должны также гарантировать обновления в транзакциях.

Требования для дублирования данных на различных компьютерных системах должны быть адресованы в связи с требованием для компьютерных систем быть автономными, насколько это возможно. Такие требования относятся к производительности, доступности данных в течение сбоя связи и к административным вопросам, таким как учет системных ресурсов и идентифицирование пользователей [из 4.8.1 Управление распределением ГОСТ 34.321-96]

4.8.2 Управление транзакцией базы данных ГОСТ 34.321-96

Необходимо синхронизировать действия локальных систем управления транзакцией, чтобы гарантировать, что изменения в распределенных данных заканчиваются непротиворечивым состоянием для каждой базы данных, а также для всех баз данных.

Обработка в одной компьютерной системе может осуществляться параллельно с обработкой в другой компьютерной системе без влияния на целостность данных в каждой из компьютерных систем [из 4.8.2 Управление транзакцией базы данных ГОСТ 34.321-96]

4.8.3 Связи ГОСТ 34.321-96

Необходимо обеспечить информационным системам возможность связываться друг с другом.

Для обмена объектов данных необходимо, чтобы средство моделирования данных, в соответствии с которым объекты данных структурируются, было использовано в каждой из компьютерных систем.

Необходимо иметь средства, которые предотвращают потерю целостности баз данных из-за таких видов сбоя связи:

  • сообщение может быть потеряно во время передачи;
  • сообщение не может поступить в надлежащем виде из-за ошибок трансляции и ретрансляции;
  • при некоторых обстоятельствах сбой связи трудно отличить от сбоя на удаленном вычислительном устройстве.

Следует определить необходимую степень дублирования данных [из 4.8.3 Связи ГОСТ 34.321-96]

4.8.4 Экспорт-импорт ГОСТ 34.321-96

Данные экспортируются из одной среды и импортируются в другую. Для этого необходимоиметь копию части или всей базы данных, с определением данных или без него. Однажды экспортируемые данные могут быть импортированы во многие другие среды, если это требуется, а также сохраняться [из 4.8.4 Экспорт-импорт ГОСТ 34.321-96]

4.8.5 Независимость распределения ГОСТ 34.321-96

Прикладной процесс должен иметь доступ к данным в распределенной базе данных таким образом, чтобы он не зависел от того, как могут быть распределены данные [из 4.8.5 Независимость распределения ГОСТ 34.321-96]