Промышленные данные и НТИ: от прикладных задач к стандартизации

Гарбук Сергей, И.о. директора, ВИНИТИ РАН. Конференция ЦИПР 2026, «Цифровая индустрия промышленной России». Организатор компания ООО «ОМГ». Ценность промышленных данных определяется только через прикладные задачи, а не сама по себе; их разумно соотносить с крупными проектами научно-технологического развития страны и рассматривать на всём жизненном цикле — от фундаментальных исследований до эксплуатации и утилизации. Для корректной интерпретации данных нужны связные классификаторы, рубрикаторы и онтология предметных областей. Промышленные и цифровые данные входят в состав научно-технической информации, а государственная система НТИ включает федеральные организации и предусматривает создание отраслевых центров; в этом контексте отдельно отмечена роль ЦИТО и Минпромторга. В стандартизации промышленных данных предлагается опираться на подходы, разработанные для ИИ и машинного обучения, поскольку данные сейчас рассматриваются именно в контексте таких задач. Большая часть уже разработанных стандартов — гармонизированные: 10 из 14, что важно для совместимости с международным сообществом и обмена данными. Международная совместимость — отдельный приоритет: приводится пример договорённости с Китайским институтом стандартизации о едином взгляде на форматы промышленных данных. Абстрактного “качества данных” не существует: качество нужно определять только в связи с конкретной задачей; учитываются вариативность наборов данных, объём, метаданные и точность описания источников. Накопленный опыт Технического комитета по качеству данных для ИИ предлагается развивать дальше, ориентируясь на текущие задачи промышленности

Иконка канала JSON.TV
97 подписчиков
12+
5 просмотров
месяц назад
12+
5 просмотров
месяц назад

Гарбук Сергей, И.о. директора, ВИНИТИ РАН. Конференция ЦИПР 2026, «Цифровая индустрия промышленной России». Организатор компания ООО «ОМГ». Ценность промышленных данных определяется только через прикладные задачи, а не сама по себе; их разумно соотносить с крупными проектами научно-технологического развития страны и рассматривать на всём жизненном цикле — от фундаментальных исследований до эксплуатации и утилизации. Для корректной интерпретации данных нужны связные классификаторы, рубрикаторы и онтология предметных областей. Промышленные и цифровые данные входят в состав научно-технической информации, а государственная система НТИ включает федеральные организации и предусматривает создание отраслевых центров; в этом контексте отдельно отмечена роль ЦИТО и Минпромторга. В стандартизации промышленных данных предлагается опираться на подходы, разработанные для ИИ и машинного обучения, поскольку данные сейчас рассматриваются именно в контексте таких задач. Большая часть уже разработанных стандартов — гармонизированные: 10 из 14, что важно для совместимости с международным сообществом и обмена данными. Международная совместимость — отдельный приоритет: приводится пример договорённости с Китайским институтом стандартизации о едином взгляде на форматы промышленных данных. Абстрактного “качества данных” не существует: качество нужно определять только в связи с конкретной задачей; учитываются вариативность наборов данных, объём, метаданные и точность описания источников. Накопленный опыт Технического комитета по качеству данных для ИИ предлагается развивать дальше, ориентируясь на текущие задачи промышленности

, чтобы оставлять комментарии