ГОСТ Р 59900–2021 Системы искусственного интеллекта. Типовые требования к контрольным выборкам исходных данных для испытания систем искусственного интеллекта в образовании. Artificial intelligence systems. Typical requirements for check samples of initial data for testing artificial intelligence systems in education. УДК 004.896:006.354 ОКС 35.240.90. Редакция от 12.12.2023.
1 Область применения ГОСТ Р 59900-2021
Настоящий стандарт распространяется на технологии искусственного интеллекта в образовании и устанавливает типовые требования к контрольным выборкам исходных данных для испытания систем искусственного интеллекта в образовании, построенных на основе алгоритмов машинного обучения и анализа данных [из 1 Область применения ГОСТ Р 59900–2021]
2 Термины и определения ГОСТ Р 59900-2021
В настоящем стандарте применены следующие термины с соответствующими определениями:
Образовательный продукт с алгоритмами искусственного интеллекта по ГОСТ Р 59900-2021
Программно–техническая система, использующая алгоритмы искусственного интеллекта для решения различных задач в области образования [из 2.1 ГОСТ Р 59900–2021]
Гиперпараметры (в машинном обучении) по ГОСТ Р 59900-2021
Параметры системы искусственного интеллекта, значения которых задаются до начала обучения и не изменяются в процессе обучения.
Примечание — У системы искусственного интеллекта может не быть гиперпараметров.
[из 2.2 ГОСТ Р 59900–2021]
Обучающая выборка по ГОСТ Р 59900-2021
Набор данных, на котором происходит обучение системы искусственного интеллекта [из 2.3 ГОСТ Р 59900–2021]
Валидационная выборка по ГОСТ Р 59900-2021
Набор данных, на котором происходит оптимизация гиперпараметров системы искусственного интеллекта и выбор наилучшего алгоритма [из 2.4 ГОСТ Р 59900–2021]
Контрольная выборка по ГОСТ Р 59900-2021
Набор данных, на котором происходит оценка качества работы системы искусственного интеллекта [из 2.5 ГОСТ Р 59900–2021]
Метрика (в машинном обучении) по ГОСТ Р 59900-2021
Функция количественной оценки качества работы алгоритмов искусственного интеллекта на некоторой выборке.
Примечание — При обучении систем искусственного интеллекта вычисляют значения метрик на обучающей, валидационной и тестовой выборках.
[из 2.6 ГОСТ Р 59900–2021]
3 Общие требования к контрольным выборкам исходных данных ГОСТ Р 59900-2021
3.1 Репрезентативность ГОСТ Р 59900-2021
Контрольная выборка должна быть репрезентативной: характеристики выборки должны соответствовать характеристикам генеральной совокупности в целом.
Контрольная выборка должна содержать все объекты, присутствующие в генеральной совокупности. Число элементов контрольной выборки должно быть достаточно для представления характеристик генеральной совокупности с заданной погрешностью.
Должны быть предусмотрены метрики и меры оценки отсутствия систематических искажений при формировании выборки [из 3.1 Репрезентативность ГОСТ Р 59900–2021]
3.2 Ограничение в использовании контрольной выборки на этапе обучения системы ГОСТ Р 59900-2021
В процессе обучения систем искусственного интеллекта для текущей оценки качества обучения, выбора моделей и настройки гиперпараметров используются валидационные выборки.
Недопустимо использование контрольных выборок в качестве валидационных в процессе настройки и обучения модели.
Контрольные выборки должны использоваться для оценки качества работы обученных систем и сравнения различных систем между собой [из 3.2 Ограничение в использовании контрольной выборки на этапе обучения системы ГОСТ Р 59900–2021]
3.3 Актуальность контрольной выборки ГОСТ Р 59900-2021
Необходимо обеспечить соответствие данных, представленных в контрольной выборке, актуальному состоянию объектов, описываемых данными.
Для контрольной выборки должен быть определен период обновления, соответствующий периодам изменения объектов, описываемых собранным данными [из 3.3 Актуальность контрольной выборки ГОСТ Р 59900–2021]
3.4 Повторное использование контрольной выборки ГОСТ Р 59900-2021
Для каждой контрольной выборки должно быть определено максимальное число использований и вестись учет числа фактических использований контрольной выборки для оценки качества работы систем, с целью недопущения подстройки систем искусственного интеллекта под прохождение конкретной контрольной выборки [из 3.4 Повторное использование контрольной выборки ГОСТ Р 59900–2021]
4 Объекты данных в образовании ГОСТ Р 59900-2021
4.1 В зависимости от категории и назначения образовательного продукта с алгоритмами искусственного интеллекта наборы данных собираются в отношении следующих объектов и процессов:
- описание и программы образовательных дисциплин, учебно–методические материалы;
- характеристики участников образовательной деятельности;
- учебные действия и коммуникация участников образовательной деятельности (обучающийся, педагогический работник);
- операции взаимодействия с информационными системами участников образовательной деятельности, в том числе цифровая тень;
- продуктивные результаты образовательной деятельности (созданные артефакты, в том числе в цифровой форме);
- оценки действий и артефактов;
- показатели и характеристики среды обучения.
[из 4.1 ГОСТ Р 59900–2021]
4.2 Для каждого типа объекта должен быть определен период изменений, необходимый для обеспечения актуальности данных в контрольных выборках.
Например, для образовательных программ, должен быть назначен период изменения, равный принятому сроку обновления образовательных программ [из 4.2 ГОСТ Р 59900–2021]
4.3 Примеры видов наборов данных и требования к контрольным выборкам для каждой категории данных представлены в приложении А [из 4.3 ГОСТ Р 59900–2021]
5 Требования к описанию контрольных выборок данных в образовании ГОСТ Р 59900-2021
5.1 Контрольные выборки данных должны иметь определенный набор метаданных. Данный набор можно определить в трех категориях:
- описательные метаданные, описывают содержание и состояние данных;
- технические метаданные, описывают технические особенности хранения и обработки данных;
- операционные метаданные, описывают процессы обработки данных и доступа к ним.
[из 5.1 ГОСТ Р 59900–2021]
5.2 Технические и операционные метаданные контрольных выборок должны содержательно соответствовать метаданным обучающей и валидационной выборок, на которых производилось обучение системы искусственного интеллекта, а также метаданным данных, которые будут использоваться в процессе эксплуатации образовательного продукта с алгоритмами искусственного интеллекта. Примеры наборов соответствующих данных приведены в разделах 4–6 таблицы А.1 приложения А [из 5.2 ГОСТ Р 59900–2021]
5.3 Описательные метаданные контрольных выборок данных в образовании должны содержать следующие характеристики:
- контекст сбора данных (название образовательной программы, учебного курса, мероприятия и др.);
- характер данных (описание и план деятельности, фактически осуществленная деятельность, оценка деятельности);
- источник данных (обучающийся, педагог и др.);
- вид данных (данные о характеристиках обучающегося и (или) педагога, данные о деятельности);
- уровень данных о деятельности (деятельность, действие, операция);
- вид образования (общее образование, профессиональное образование, дополнительное образование и др.);
- уровень образования (дошкольное образование; начальное общее образование; основное общее образование; среднее общее образование; среднее профессиональное образование; высшее образование – бакалавриат; высшее образование – специалитет, магистратура; высшее образование – подготовка кадров высшей квалификации);
- возраст обучающихся;
- уровень подготовки обучающихся;
- особенности обучающихся.
[из 5.3 ГОСТ Р 59900–2021]
Приложение А (обязательное) - Примеры наборов данных в образовании и требования к контрольным выборкам ГОСТ Р 59900-2021
Примеры наборов данных в образовании и требования к контрольным выборкам приведены в таблице А.1.
Таблица А.1 — Примеры наборов данных в образовании и требования к контрольным выборкам
№ | Наборы данных | Требования к контрольной выборке |
1 | Описание курса и учебно–методические материалы | |
1.1 | Описание предмета/курса/тематического модуля в каталоге (содержит требования к участникам, количество контактных часов, зачетных единиц, тип и т.п.) | Выборка должна обеспечивать использование данных для предположения об образовательных результатах, если они не заданы явно |
1.2 | Структура активности | Выборка должна обеспечивать использование данных для привязки образовательных результатов к действиям пользователя |
1.3 | Образовательные результаты (разметка образовательных результатов) | Выборка должна содержать текстовые описания образовательных результатов. Выборка должна обеспечивать использование данных для соотнесения деятельности обучающегося с результатами обучения |
1.4 | Содержание образования | Выборка должна обеспечивать использование данных для предположения об образовательных результатах, если они не заданы явно |
1.5 | Правила оценивания | Выборка должна обеспечивать использование данных для контроля соответствия оценок образовательным результатам |
1.6 | Методика оценки/диагностики | Выборка должна обеспечивать использование данных для контроля выводов о достижении образовательных результатов или результатах диагностики |
2 | Данные о продуктивной деятельности обучающегося | |
2.1 | Запись о деятельности и результате деятельности (в привязке к образовательному результату) | Основная единица учета деятельности обучающегося. Выборка должна обеспечивать использование данных для демонстрации компетенций обучающегося |
2.2 | Созданные обучающимся артефакты (в процессе учебной/проектной деятельности) в привязке к деятельности и образовательному результату (презентации, конспекты, схемы, чертежи, исходные тексты программ, в том числе в цифровой форме) | Выборка должна обеспечивать использование данных для подтверждения и демонстрации результатов обучения, сформированных компетенций |
2.3 | Личный дневник обучающегося, дневник его проектной команды | Выборка должна обеспечивать использование данных для отслеживания прогресса и качества деятельности |
2.4 | Записи о прохождении командой значимых вех в проектной деятельности | Выборка должна обеспечивать использование данных для отслеживания прогресса и качества проектной деятельности, проявления командой проекта определенных компетенций, достижения результатов обучения |
3 | След оценки деятельности | |
3.1 | Набранные баллы (оценки за задание/урок/тематический раздел/курс) | Выборка должна обеспечивать использование данных для подтверждения и демонстрации результатов обучения, сформированных компетенций |
3.2 | Оценки обучающихся и отзывы | Выборка должна обеспечивать использование данных для подтверждения и демонстрации результатов обучения, сформированных компетенций |
3.3 | Обратная связь участников образовательного процесса (в том числе, рефлексия) | Выборка должна обеспечивать использование данных для формирования предположений об образовательных результатах, а также для оценки курсов/мероприятий/элементов курсов/личностного развития обученного |
3.4 | Экспертная оценка (свидетельства наблюдателей о проявлении навыков/компетенций) | Выборка должна обеспечивать использование данных для подтверждения и демонстрации результатов обучения, сформированных компетенций |
3.5 | Полученные сертификаты (в виде изображений/документов) | Выборка должна обеспечивать использование данных для подтверждения прохождения обучения и формирования определенных компетенций обучаемых |
3.6 | Оценка артефактов, проектов | Выборка должна обеспечивать использование данных для оценки результатов обучения и прогресса обучаемого |
3.7 | Достижение (получение статуса, бейджа и т.п.) | Выборка должна обеспечивать использование данных для оценки результатов обучения и прогресса обучаемого |
4 | След взаимодействия | |
4.1 | Отдельные действия пользователя в системе, имеющие смысл с точки зрения обучения (просмотр видео, ответ на конкретный вопрос, запрос подсказки и т.п.) | Выборка должна обеспечивать использование данных для анализа поведения обучающегося, выявления слабых мест, а также – для оценки учебного курса/мероприятия |
4.2 | «Кликстрим» (нажатия кнопок, клики, переходы между страницами, скроллинг) | Выборка должна обеспечивать использование данных для анализа поведения обучающегося, выявления слабых мест, а также – для оценки учебного курса/мероприятия |
4.3 | Факты и содержание переписки в ИТ–системах (в т.ч. – активность пользователя в открытых системах, социальных сетях и т.п.) | Выборка должна обеспечивать использование данных для анализа поведения обучающегося, подтверждения некоторых навыков и компетенций, соавторства при совместной работе |
4.4 | Факты общения участников образовательной деятельности в очном взаимодействии | Выборка должна обеспечивать использование данных для анализа поведения обучающегося, подтверждения некоторых навыков и компетенций, соавторства при совместной работе |
4.5 | Отдельные события в системах проектной деятельности (создание задачи, изменение статуса задачи и т.п.) | Выборка должна обеспечивать использование данных для анализа поведения обучающегося или проектной команды |
5 | След состояния | |
5.1 | Изменение настроек и профиля в ИТ–системах | Выборка должна обеспечивать использование данных для анализа изменения поведения обучающегося, для анализа целей |
6 | След участия/мероприятия | |
6.1 | Фиксация присутствия в определенном месте | Выборка должна обеспечивать использование данных для анализа поведения обучающегося, подтверждения компетенций: также – для оценки учебного курса/мероприятия |
6.2 | Фиксация факта использования содержания образования без подтверждающей продуктивной деятельности | Выборка должна обеспечивать использование данных для анализа поведения обучающегося, подтверждения компетенций: также – для оценки учебного курса/мероприятия |
6.3 | Состав и описание команд обучающихся при групповой/командной деятельности | Выборка должна обеспечивать использование данных для подтверждения участия в мероприятии |
6.6 | Проявленные роли обучающегося в командном взаимодействии | Выборка должна обеспечивать использование данных для подтверждения способности выполнения роли |
6.7 | Описание проекта | Выборка должна обеспечивать использование данных для выявления образовательных результатов, основанных на проектной деятельности |
7 | Целеполагание и продвижение по траектории | |
7.1 | Цели пользователя (декларируемые им самим) | Выборка должна обеспечивать использование данных для построения персональной траектории обучения, работы педагогических работников |
7.2 | Рефлексия о достижении целей/продвижении | Выборка должна обеспечивать использование данных для построения персональной траектории обучения, работы педагогов |
[из Приложение А (обязательное) – Примеры наборов данных в образовании и требования к контрольным выборкам ГОСТ Р 59900-2021]