- Контакты ООО «Техническая документация»

Заказать услуги ООО «Техническая документация» можно по эл. почте admin @ tdocs . su (без пробелов), по тел. 8-916-631-48-82 или в форме Контакты.

Государственные стандарты (ГОСТы) в информационных технологиях (ИТ). Часть II - Унификация в стандартах. Термин «данные»

Определений термина «данные» в государственных (ГОСТах) и иных стандартах по информационным технологиям насчитано (уже) целых пять, определений «информационной технологии» - четыре. Все они в той или иной степени различаются - и непонятно, какое целесообразнее использовать. Сформулируем унифицированное определение, применимое для всех направлений информационных технологий гармонизации ради и для достижения, как говорится, консенсуса - Круглые глаза Редакция от 16.07.2014.

Смотрите:
Данные (Data) по ГОСТ 15971-90
Данные (Data) по ГОСТ 34.321-96
Данные по ГОСТ Р 50922-2006
Данные по ГОСТ Р 52292-2004
Анализ определений термина «данные» и поиск ключевых слов
Унифицированное определение термина «данные»
Выводы

ГОСТ 1.1-2002 предлагает заняться унификацией, дабы достичь взаимозаменяемости в угоду системности, поскольку в этом прослеживается целесообразность, а все ради комплексности - для достижения однозначности, поскольку без классификации не достичь никакой систематизации - Ржунимагу! (смайл)

Прислушаемся к ГОСТу, проанализируем отобранные и приведенные ниже варианты определений термина «данные» и оставим (или сформулируем) наиболее полное из них.

- Унификация терминологии в стандартах. Определения термина «данные»

Данные (Data) по ГОСТ 15971-90

Информация, представленная в виде, пригодном для обработки автоматическими средствами при возможном участии человека [из п. 1 Таблицы 1 ГОСТ 15971-90]

Данные (Data) по ГОСТ 34.321-96

Информация, представленная в формализованном виде, пригодном для передачи, интерпретации или обработки с участием человека или автоматическими средствами [из п. 2.7 ГОСТ 34.321-96]

Данные по ГОСТ Р 50922-2006

Факты, понятия или команды, представленные в формализованном виде и позволяющие осуществлять их передачу или обработку как вручную, так и с помощью средств автоматизации [из п. 4 Приложения А ГОСТ Р 50922-2006]

Данные по ГОСТ Р 52292-2004

Интерпретируемое формализованным способом представление информации, пригодное для коммуникации, интерпретации или обработки [ИСО/МЭК 2382-1] [1] [из п. 4.2.1 ГОСТ Р 52292-2004]

Анализ определений термина «данные» и поиск ключевых слов

Для поиска ключевых слов в определениях термина «данные» был использован первый попавшийся в поиске онлайновый анализатор текстов seotxt.com/service/optimizer. Тексты сразу всех определений термина «данные» были «скормлены» анализатору, результаты его деятельности приведены в таблице ниже.

#

Слово

Повторы

Плотность

1

виде

4

7.41 %

2

обработки

4

7.41 %

3

средствами

3

5.56 %

4

информация

3

5.56 %

5

представленная

3

5.56 %

6

автоматическими

3

5.56 %

7

человека

3

5.56 %

8

пригодном

3

5.56 %

9

интерпретации

2

3.70 %

10

формализованном

2

3.70 %

11

участии

2

3.70 %

12

возможном

2

3.70 %

13

формализованным

1

1.85 %

14

интерпретируемое

1

1.85 %

15

автоматизации

1

1.85 %

16

средств

1

1.85 %

17

способом

1

1.85 %

18

представление

1

1.85 %

19

пригодное

1

1.85 %

20

информации

1

1.85 %

21

помощью

1

1.85 %

22

коммуникации

1

1.85 %

23

понятия

1

1.85 %

24

факты

1

1.85 %

25

участием

1

1.85 %

26

передачи

1

1.85 %

27

команды

1

1.85 %

28

представленные

1

1.85 %

29

обработку

1

1.85 %

30

передачу

1

1.85 %

31

позволяющие

1

1.85 %

32

вручную

1

1.85 %

Затем пришлось поработать руками - преобразовать исходную таблицу в новую с минимизированным числом словоформ. Словоформу «информации» приплюсовывали к «информация» и удаляли «информации». Аналогично для всех прочих, «очевидных».

После того как «очевидная» часть работы была выполнена, пришлось поработать головой над не вполне очевидной ее частью (работы, а не головы). «Понятия», «факты» и «команды» - это ведь тоже «информация»? Ведь «вручную» - это «участие человека»? Результаты правки приведены в таблице ниже.

#

Слово

Повторы

1

виде

4

2

обработки

5

3

средствами

6

4

информация

7

5

представленная

5

6

автоматическими

4

7

человека

3

8

пригодном

5

9

интерпретации

3

10

формализованном

3

12

возможном участии

6

13

передачи

3

С анализом покончено.

Унифицированное определение термина «данные»

Из слов, оставшихся в табличке выше, была составлена более-менее осмысленная фраза: «Информация (7), представленная (5) в формализованном (3) виде (4), пригодном (5) для обработки (5), интерпретации (3) и передачи (3) автоматическими (4) средствами (6) с возможным участием (6) человека (3)». Вот и все, унифицированное определение термина «данные» налицо.

Интересно, насколько сформулированное (не без помощи беспристрастного онлайнового анализатора) определение «коррелирует» со стандартными? В табличке ниже сведены все определения термина «данные».

1

Информация, представленная в формализованном виде, пригодном для обработки, интерпретации и передачи автоматическими средствами с возможным участием человека

2

Информация, представленная в виде, пригодном для обработки автоматическими средствами при возможном участии человека [из п. 1 Таблицы 1 ГОСТ 15971-90]

3

Информация, представленная в формализованном виде, пригодном для передачи, интерпретации или обработки с участием человека или автоматическими средствами [из п. 2.7 ГОСТ 34.321-96]

4

Факты, понятия или команды, представленные в формализованном виде и позволяющие осуществлять их передачу или обработку как вручную, так и с помощью средств автоматизации [из п. 4 Приложения А ГОСТ Р 50922-2006]

5

По ГОСТ Р  51170-98 - удалено, поскольку полностью дублировало поз. 1

6

Интерпретируемое формализованным способом представление информации, пригодное для коммуникации, интерпретации или обработки [ИСО/МЭК 2382-1] [1] [из п. 4.2.1 ГОСТ Р 52292-2004]

Самым близким по духу оказалось определение данных по ГОСТ 34.321-96. Определение по ГОСТ Р 50922-2006 совсем никуда не годится, по ГОСТ 15971-90 - неполное, поскольку не учитывает возможность передачи информации, определение по ГОСТ Р 52292-2004 и вовсе какое-то «бесчеловечное»...

Сразу возник ряд предложений и вопросов.

Понятие передачи информации на текущий момент в терминологических стандартах по информационным технологиям не обнаружено. Возможно, оно и имеется, но пока такого ГОСТа в нашей базе нет. Но есть какое-никакое определение обмена данными - «Перенос данных между функциональными блоками в соответствии с набором правил, управляющих передачей данных и координацией обмена [ИСО/МЭК 2382-1] [1] [из п. 7.2.1 ГОСТ Р 52292-2004]». Очевидно, что понятие обмена данными шире, чем понятие передачи данных, поскольку под обменом подразумевается передача данных в обе стороны. Итак,

Данные - это информация, представленная в формализованном виде, пригодном для обработки, интерпретации и обмена автоматическими средствами с возможным участием человека.

Теперь о человеках. Человек - это, конечно, звучит гордо, но как-то не к месту, когда речь идет о технической тематике. В информационных технологиях все же принято оперировать понятиями оператор, оператор системы «человек - машина», оператор информационной системы. Тогда унифицированное определение может зазвучать так:

Данные - это информация, представленная в формализованном виде, пригодном для обработки, интерпретации и обмена автоматическими средствами с возможным участием оператора.

Вопросы. Зачем в ГОСТах по информационным технологиям целых пять определений термина «данные»? Полигамия, конечно, штука интересная, но вряд ли уместна в технике... Но «Послушайте! Ведь, если звезды зажигают - значит - это кому-нибудь нужно? Значит - кто-то хочет, чтобы они были?»

Ответ. Во время оно, судя по всему, промышленным организациям и предприятиям сверху спускался план по стандартизации, вот они его и выполняли. В настоящее время стандарт может быть разработан чуть ли не физическим лицом и, при соблюдении им известных требований и правил, преспокойно введен в действие.

Зачем? Престижа ради: «Мы настолько крутая компания, что способны на разработку государственного или межгосударственного стандарта. Читайте, завидуйте!» Или для прогибания конкурентов.

В 2006, кажется, году автора волею судеб занесло в одно замечательное заведение, занимавшееся много чем, в том числе и системами электронного документооборота (СЭД). Предметная область была знакома, поскольку еще в 2001 году пришлось поработать в интересах другой, конкурирующей компании, держащей (по состоянию на 2006 год) примерно 45-50 % рынка электронного документооборота как в России, так и в странах СНГ.

Оценив обстановку в заведении (и на рынке СЭД) и присвоив ей почетное звание «полнейший бардак», автор вышел на руководство с предложением разработать и ввести в действие жесточайший по своим общим техническим требованиям стандарт на системы электронного документооборота, запросив всего полгода времени и какие-то жалкие 1,5 млн. рублей в качестве компенсации. Руководство терзалось в раздумьях около месяца, но в итоге так ни на что и не решилось. А зря - у него была прекрасная возможность утереть нос конкурентам...

Примечание от 11.07.2014 г. - Вот и все! Тот самый конкурент утер нос руководству несуществующей уже компании, ищите в поисковиках «Утвержден ГОСТ Р 53898-2013 «Системы электронного документооборота. Взаимодействие систем электронного документооборота. Технические требования к электронному сообщению»». А могло бы быть все с точностью «до наоборот» еще в 2007 году...

Выводы

По определениям (по датам введения стандартов):

  • самое толковое определение данных дано в ГОСТ 34.321-96;
  • изменение в ГОСТ 15971-90 никто, разумеется, внести не удосужился, а следовало бы;
  • разработчики ГОСТ Р 50922-2006 либо вообще не знали о существовании ГОСТ 34.321-96, либо поленились стряхнуть с него пыль;
  • с ГОСТ Р 52292-2004 ситуация аналогична.

Теперь в целом: понятно, что ранее не существовало инструментария, позволяющего автоматически искать ключевые слова во множестве документов одновременно, связывать схожие разделы документов с возможностью их актуализации, но сейчас-то есть могучие AuthorIT и Framemaker - карты сами идут в руки. Только взяться и сделать - сформулировать жесткие требования к унификации терминологии и сократить количество стандартов, отменив явно лишние.

Но как-то странно работают занимающиеся стандартизацией организации - не вглубь, а вширь - они все больше «гармонизируются» со стандартами «стран-экономических лидеров» вроде Сьерра-Леоне или Берега Слоновой Кости.

Вот как-то так.

Продолжение последовало - см. Государственные стандарты (ГОСТы) в информационных технологиях (ИТ). Часть III - Унификация терминологии в стандартах. Определения термина «информационная технология».

- Контакты ООО «Техническая документация»

Заказать услуги ООО «Техническая документация» можно по эл. почте admin @ tdocs . su (без пробелов), по тел. 8-916-631-48-82 или в форме Контакты.

Copyright © ООО «Техническая документация» 2017. Заимствуйте наши материалы с блеском!
При цитировании на своих ресурсах наших материалов используйте активные ссылки на них.