К терминам «Качество служебной информации». «Данные» (3.1.1, 3.1.4) ГОСТ Р 51170-98
Стандарт рассматривает служебную информацию (данные) как продукт функционирования информационной системы (ИС) в отличие от подхода, когда данные рассматриваются как самостоятельная формальная модель. Данные являются предметом производства (продуктом) ИС, предназначенные для сбора, поиска, преобразования, накопления, хранения и других действий над данными. Определение термина «Качество служебной информации» аналогично определению термина «Качество продукции» [из К терминам «Качество служебной информации». «Данные» (3.1.1, 3.1.4) ГОСТ Р 51170–98]
К термину «Технологический процесс переработки данных» (3.1.5) ГОСТ Р 51170-98
Технологические процессы переработки данных (ТППД) осуществляются в информационных системах. При этом ИС рассматривают как технологическую систему, т. е. совокупность средств технологического оснащения (комплекс технических и программных средств), предмета производства (данных) и исполнителей (человека–оператора), обеспечивающих осуществление заданных технологических процессов в заданных условиях [из К термину «Технологический процесс переработки данных» (3.1.5) ГОСТ Р 51170–98]
К терминам «Обработка данных», «Контроль данных», «Обобщение данных» (3.1.6, 3.1.7, 3.1.8) ГОСТ Р 51170-98
Технологические операции — элементарные акты технологического процесса переработки данных, выделяемые в моделях ТППД для решения задач обеспечения качества служебной информации. Перечисленные типы технологических операций переработки данных характерны не только для ТППД, но и для любых дискретных производственных процессов. Примерами операций обработки данных являются: передача по каналам связи, перенос на машинные носители, хранение и др. Примеры операций контроля: визуальный контроль по экрану дисплея введенных в ЭВМ данных, контроль на четность и др. Примером операции обобщения является вычисление среднего значения.
Качество служебной информации во многом зависит от структуры ТППД, которую определяют в основном правила организации контроля (например, наличие или отсутствие повторной обработки данных после исправления ошибок; кратность контроля; повторный контроль и обработка всего объема данных или той его части, где обнаружены ошибки, и др.). В задачах обеспечения качества служебной информации важно также различать комплексный контроль, при выполнении которого могут быть обнаружены ошибки, внесенные в данные на всех предшествующих контролю этапах ТППД, и локальный контроль, при котором возможно обнаружить ошибки, внесенные лишь на отдельных операциях или группах операций ТППД.
Ввиду того что обработка является одним из видов технологических операций, в качестве обобщающего используют термин «переработка данных» [из К терминам «Обработка данных», «Контроль данных», «Обобщение данных» (3.1.6, 3.1.7, 3.1.8) ГОСТ Р 51170–98]
К терминам 3.1.10, 3.1.9, 3.1.1.1, 3.1.12, 3.1.13, 3.1.14, 3.1.15, 3.2.1, 3.2.2, 3.2.3, 3.2.4, 3.2.5, 3.1.16, 3.3.1, 3.3.2, 3.3.3, 3.3.4, 3.3.5) ГОСТ Р 51170-98
Связь перечисленных свойств показана на рисунке А.1.
Рисунок А.1 — Составляющие качества данных
В свойстве достоверности выделяют безошибочность данных (3.2.1) и их истинность (3.3.1).
Случайные ошибки в данных обусловлены, как правило, ненамеренными искажениями содержания сведений человеком, сбоями технических средств и ошибками программ ЭВМ. При анализе истинности данных рассматривают намеренные искажения данных человеком–источником сведений.
Для обеспечения кумулятивности важно уменьшить объем перерабатываемых данных, обеспечив потребителя всеми необходимыми ему сведениями. Эту задачу можно решить без учета и с учетом опыта и квалификации конкретного потребителя данных, применяя соответственно формально–технические и социально–психологические приемы. К числу формально–технических приемов относятся, например, агрегирование — получение сводных показателей различного уровня обобщения: построение наборов данных по различным разрезам, т. е. выбор отдельных показателей из массивов исходных данных. Эти и другие формальные приемы направлены на построение моделей типа «многое в одном», когда действительность отображается с помощью малого числа символов. Соответствующее свойство данных — их сжатость (3.2.2). Учет опыта, квалификации и других свойств личности потребителя данных можно осуществлять «настройкой» ТППД на конкретного потребителя. Данные, специально отобранные для конкретного их потребителя, обладают свойством селекционности (3.3.2).
При рассмотрении временных свойств данных важны два фактора: согласованность динамики ТППД и динамики изменения ситуации (должно быть предусмотрено обновление — актуализация — данных по мере изменения ситуации): согласованность динамики процесса переработки данных с регламентом представления их пользователю ИС. Соответственно этим факторам различают:
- способность данных отображать динамику изменения ситуации. При этом рассматривают или время запаздывания появления в данных соответствующих признаков объектов, или расхождение реальных признаков объектов и тех же признаков, отображаемых в данных. Соответственно выделяют оперативность (3.2.3) и идентичность (3.2.4). Нарушение идентичности связано со старением данных по рассогласованию признаков, при котором происходит расхождение значений реальных признаков объектов и значений этих признаков, отображаемых в данных;
- способность данных соответствовать динамике изменения социально–психологических взглядов и мотивов. При этом рассматривают или время запаздывания данных, которые должны быть представлены пользователю ИС к заданному сроку, определяемому социально–психологическими мотивами, или уменьшение потребности в данных у пользователя ИС с течением времени. Соответственно различают срочность (3.3.3) и значимость (3.3.4). Нарушение значимости связано с изменением ценности данных для потребителей.
При рассмотрении недоступности выделяют технические вопросы защиты данных от несанкционированного доступа (свойство защищенности (3.2.5)) и социально–психологические вопросы классификации данных по степени их конфиденциальности и секретности (свойство конфиденциальности (3.3.5)) [из К терминам 3.1.10, 3.1.9, 3.1.1.1, 3.1.12, 3.1.13, 3.1.14, 3.1.15, 3.2.1, 3.2.2, 3.2.3, 3.2.4, 3.2.5, 3.1.16, 3.3.1, 3.3.2, 3.3.3, 3.3.4, 3.3.5) ГОСТ Р 51170–98]
К термину «Показатель качества служебной информации» (3.1.17) ГОСТ Р 51170-98
Качественная или количественная характеристика свойства продукта ИС называется признаком. Количественная характеристика свойства продукта называется параметром продукта. Он характеризует любые свойства продукции, в том числе входящие в состав ее качества. Параметр продукции ИС, характеризующий свойство, входящее в состав качества служебной информации, называется показателем качества служебной информации [из К термину «Показатель качества служебной информации» (3.1.17) ГОСТ Р 51170–98]
К термину «Показатель качества служебной информации» (3.1.17) ГОСТ Р 51170-98
В качестве показателя безошибочности данных иногда используют вероятность P отсутствия ошибок в данных определенного объема. Ввиду того что значения P близки к единице, удобнее использовать вероятность Q наличия хотя бы одной ошибки в данных определенного объема. (Очевидно, что P + Q = 1). В качестве такого объема данных может быть использован любой объем, для которого справедливо условие: наличие в нем хотя бы одной ошибки недопустимо, так как искажает содержание сведений. В определении показателя необходимо указать тот объем данных, которому соответствует значение показателя, например вероятность ошибки в знаке и т. д. [из К термину «Вероятность ошибки» (3.4.1.1) ГОСТ Р 51170–98]
К терминам «Функция своевременности». «Вероятность своевременной переработки данных», «Среднее время переработки данных», «Коэффициент совпадения», «Функция совпадения» (3.4.2.1. 3.4.2.2. 3.4.2.3. 3.4.2.4) ГОСТ Р 51170-98
При оценке технических составляющих временных свойств данных можно рассматривать или случайный процесс изменения разности ?x(t) между реальным и отображаемым в данных процессами эволюции характеристик объекта, или время запаздывания ?t появления соответствующих признаков объекта в служебной информации (рисунок А.2). Если основное внимание уделять динамике ТППД, следует рассматривать случайный процесс изменения времени запаздывания данных. При этом используют показатели оперативности данных и методы их оценки. Если необходимо оценить степень совпадения признаков реального явления и его отображения в данных, то следует рассматривать случайный процесс ?x(t).
Рисунок А.2 — Реализации процесса эволюции параметров (а) и качественных признаков (б) реального объекта (1) и его отображения в информации (2)
При оценке оперативности данных время Tc выполнения совокупности операций, входящих в состав ТППД, сравнивается с заданным временем t. В качестве показателя оперативности используют характеристики времени выполнения совокупности операций, составляющих ТППД:
Tc = ?(Т1...,Tj...,Tn) (А.1)
где
Тj (j = 1, ..., n) — время выполнения j–й операции (n — количество операций в ТППД);
? определяется структурой ТППД.
Наиболее часто применяют функцию распределения Fc(t) = P{Tc<=t} (А.2), которая получила название функции своевременности. В ряде случаев удобно использовать математическое ожидание M[Tc] времени выполнения совокупности операций, входящих в состав ТППД.
При оценке идентичности данных выделяют два типа ИС по периодичности использования в них данных: в случайные моменты времени и регламентированно. Как правило, в системах первого типа данные обновляются при изменении состояний отображаемого в них явления; в системах второго типа — непосредственно перед использованием данных. Для ИС, в которых данные используют в случайные моменты времени, в качестве показателя идентичности следует использовать коэффициент совпадения (3.4.3.1), для систем с регламентированным использованием данных — функцию совпадения (3.4.3.2) [из К терминам «Функция своевременности». «Вероятность своевременной переработки данных», «Среднее время переработки данных», «Коэффициент совпадения», «Функция совпадения» (3.4.2.1. 3.4.2.2. 3.4.2.3. 3.4.2.4) ГОСТ Р 51170–98]
К терминам «Вероятность получения доступа к данным», «Функция защищенности», «Опасность доступа», «Среднее время преодоления защиты», «Коэффициент затрат действий на доступ», «Коэффициент затрат времени на доступ» ГОСТ Р 51170-98
Функция защищенности G(m) (3.4.4.2) характеризует не только соответствующее свойство данных, но и степень приспособленности средства защиты к выполнению своей задачи. Важный частный случай G(m =1) — вероятность получения доступа к данным при выполнении первого несанкционированного действия. Зная функцию G(m), m=> 1, можно определить опасность доступа (3.4.4.3) условную вероятность получения доступа к данным при выполнении m–го несанкционированного действия при условии, что за предыдущие m-1 действий доступ к данным не был получен. Иногда в качестве показателя защищенности данных удобно использовать математическое ожидание числа несанкционированных действий (3.4.4.5) или времени, затрачиваемого на их выполнение (3.4.4.4) для преодоления защиты и получения доступа к данным [из К терминам «Вероятность получения доступа к данным», «Функция защищенности», «Опасность доступа», «Среднее время преодоления защиты», «Коэффициент затрат действий на доступ», «Коэффициент затрат времени на доступ» ГОСТ Р 51170–98]