8 Требования к сбору данных ГОСТ Р 59897-2021

8.1 До проведения мероприятий по сбору данных для использования в образовательных продуктах с алгоритмами искусственного интеллекта необходимо определить:

  • цели и задачи, являющиеся основанием для сбора данных;
  • перечень и объем собираемых данных;
  • методы сбора данных.

Также целесообразно определить гипотезу, которая может быть подтверждена или опровергнута в ходе исследования собираемых данных [из 8.1 ГОСТ Р 59897–2021]

8.3 Качество данных оценивают по следующим критериям:

  1. точность — соответствие данных реальному состоянию исследуемых объектов;
  2. полнота — данные отражают все ожидаемые характеристики исследуемых объектов в ожидаемом объеме;
  3. согласованность — в данных отсутствуют внутренние противоречия, идентичные данные из различных источников совпадают;
  4. целостность — данные не были изменены при выполнении какой–либо операции (передача, хранение или отображение);
  5. обоснованность — собранные данные отвечают поставленным целям и задачам;
  6. расхождение во времени — соответствие собираемых данных времени их возникновения;
  7. уникальность — в данных отсутствуют дубликаты;
  8. валидность — данные соответствуют ожидаемому формату, значения находятся в ожидаемых диапазонах и имеют ожидаемую точность.

[из 8.3 ГОСТ Р 59897–2021]

8.7 Сбор данных для использования в образовательных продуктах с алгоритмами искусственного интеллекта может проходить в несколько этапов:

[из 8.7 ГОСТ Р 59897–2021]