4.2 Ключевые характеристики данных ГОСТ Р ИСО/МЭК 20546-2021

4.2.1 Объем данных ГОСТ Р ИСО/МЭК 20546-2021

Объем данных представляет собой определенное количество данных, доступных для анализа с целью извлечения полезной информации. Одним из основных факторов развития технологий обработки больших данных стал рост объемов данных, как следствие Интернет-активности [из 4.2.1 Объем данных ГОСТ Р ИСО/МЭК 20546-2021]

4.2.2 Скорость обработки данных ГОСТ Р ИСО/МЭК 20546-2021

Скорость обработки данных - это скорость потока создания, хранения, анализа и визуализации данных. Скорость обработки больших данных означает необходимость обработки большого количества данных за короткий промежуток времени. В качестве примеров работы с данными с высокой скоростью обработки обычно приводят средства обработки потоковых данных [из 4.2.2 Скорость обработки данных ГОСТ Р ИСО/МЭК 20546-2021]

4.2.3 Разнообразие данных ГОСТ Р ИСО/МЭК 20546-2021

Свойство разнообразия данных отражает необходимость анализа данных разных типов из различных предметных областей. Как правило, проблема разнообразия данных решалась посредством их преобразования или проведения предварительного анализа с целью выявления свойств, позволяющих объединить их с другими данными. Более широкий диапазон форматов данных, логических моделей, временных шкал и семантики, которые предпочтительно использовать при аналитике, усложняет интеграцию разнообразных данных. В качестве средства, способствующего интеграции, все чаще используются метаданные. Одним из результатов влияния разнообразия на большие данные является необходимость представления семантики данных в машиночитаемом виде [из 4.2.3 Разнообразие данных ГОСТ Р ИСО/МЭК 20546-2021]

4.2.4 Вариативность данных ГОСТ Р ИСО/МЭК 20546-2021

Вариативность данных означает изменения в скорости передачи данных, их формате/структуре, семантике и (или) качестве, которые влияют на поддерживаемое приложение, аналитику или проблему. Влияние вариативности может заключаться в необходимости проведения реорганизации архитектур, интерфейсов, методов обработки/алгоритмов, интеграции/слияния, хранения, применимости или использования данных. В дополнение следует отметить, что вариативность объемов данных подразумевает необходимость увеличения или уменьшения виртуализированных ресурсов для эффективного управления дополнительной нагрузкой на обработку [из 4.2.4 Вариативность данных ГОСТ Р ИСО/МЭК 20546-2021]