Промышленные данные и НТИ: от прикладных задач к стандартизации
Гарбук Сергей, И.о. директора, ВИНИТИ РАН. Конференция ЦИПР 2026, «Цифровая индустрия промышленной России». Организатор компания ООО «ОМГ». Ценность промышленных данных определяется только через прикладные задачи, а не сама по себе; их разумно соотносить с крупными проектами научно-технологического развития страны и рассматривать на всём жизненном цикле — от фундаментальных исследований до эксплуатации и утилизации. Для корректной интерпретации данных нужны связные классификаторы, рубрикаторы и онтология предметных областей. Промышленные и цифровые данные входят в состав научно-технической информации, а государственная система НТИ включает федеральные организации и предусматривает создание отраслевых центров; в этом контексте отдельно отмечена роль ЦИТО и Минпромторга. В стандартизации промышленных данных предлагается опираться на подходы, разработанные для ИИ и машинного обучения, поскольку данные сейчас рассматриваются именно в контексте таких задач. Большая часть уже разработанных стандартов — гармонизированные: 10 из 14, что важно для совместимости с международным сообществом и обмена данными. Международная совместимость — отдельный приоритет: приводится пример договорённости с Китайским институтом стандартизации о едином взгляде на форматы промышленных данных. Абстрактного “качества данных” не существует: качество нужно определять только в связи с конкретной задачей; учитываются вариативность наборов данных, объём, метаданные и точность описания источников. Накопленный опыт Технического комитета по качеству данных для ИИ предлагается развивать дальше, ориентируясь на текущие задачи промышленности
Гарбук Сергей, И.о. директора, ВИНИТИ РАН. Конференция ЦИПР 2026, «Цифровая индустрия промышленной России». Организатор компания ООО «ОМГ». Ценность промышленных данных определяется только через прикладные задачи, а не сама по себе; их разумно соотносить с крупными проектами научно-технологического развития страны и рассматривать на всём жизненном цикле — от фундаментальных исследований до эксплуатации и утилизации. Для корректной интерпретации данных нужны связные классификаторы, рубрикаторы и онтология предметных областей. Промышленные и цифровые данные входят в состав научно-технической информации, а государственная система НТИ включает федеральные организации и предусматривает создание отраслевых центров; в этом контексте отдельно отмечена роль ЦИТО и Минпромторга. В стандартизации промышленных данных предлагается опираться на подходы, разработанные для ИИ и машинного обучения, поскольку данные сейчас рассматриваются именно в контексте таких задач. Большая часть уже разработанных стандартов — гармонизированные: 10 из 14, что важно для совместимости с международным сообществом и обмена данными. Международная совместимость — отдельный приоритет: приводится пример договорённости с Китайским институтом стандартизации о едином взгляде на форматы промышленных данных. Абстрактного “качества данных” не существует: качество нужно определять только в связи с конкретной задачей; учитываются вариативность наборов данных, объём, метаданные и точность описания источников. Накопленный опыт Технического комитета по качеству данных для ИИ предлагается развивать дальше, ориентируясь на текущие задачи промышленности




