Добавить
Уведомления

AI Benchmark Democratization and Carpentry

Демократизация и 'Carpentry' бенчмарков ИИ Данный документ рассматривает возрастающую сложность и проблемы в бенчмаркинге ИИ, выступая за его демократизацию и развитие концепции «AI Benchmark Carpentry». Он начинается с определения бенчмаркинга, демократизации (как для программного, так и для аппаратного обеспечения ИИ) и концепций «carpentry», применимых к ИИ, извлекая уроки из традиционного высокопроизводительного компьютерного бенчмаркинга. В статье предлагается формальная спецификация для бенчмарков ИИ, подробно описывающая такие важные компоненты, как инфраструктура, наборы данных, научные задачи, метрики и ограничения. Рассматриваются существующие усилия по бенчмаркингу, включая бенчмаркинг HPC (TOP500, Green500), машинного обучения (MLCommons) и технические аспекты, такие как рабочие процессы, контейнеризация и мониторинг. Особое внимание уделяется бенчмаркингу GPU и энергопотребления, включая концепцию «AI Energy Benchmark Carpentry». Текст подчеркивает необходимость непрерывных, адаптивных фреймворков для преодоления проблем, таких как запоминание LLM статичных бенчмарков, что приводит к расхождению с реальной производительностью. В конечном итоге, документ направлен на выявление барьеров, препятствующих широкому внедрению бенчмаркинга ИИ, и предлагает учебную программу и методы обмена бенчмарками для содействия более широкой доступности и развитию экспертизы. #БенчмаркингИИ #Демократизация #BenchmarkCarpentry #МашинноеОбучение #HPC #MLCommons #Энергоэффективность #ПроизводительностьGPU #ИсследованияИИ #Стандартизация документ - https://arxiv.org/pdf/2512.11588v1 подписаться - https://t.me/arxivpaperu отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM

Иконка канала Paper debate
2 подписчика
12+
1 просмотр
11 часов назад
12+
1 просмотр
11 часов назад

Демократизация и 'Carpentry' бенчмарков ИИ Данный документ рассматривает возрастающую сложность и проблемы в бенчмаркинге ИИ, выступая за его демократизацию и развитие концепции «AI Benchmark Carpentry». Он начинается с определения бенчмаркинга, демократизации (как для программного, так и для аппаратного обеспечения ИИ) и концепций «carpentry», применимых к ИИ, извлекая уроки из традиционного высокопроизводительного компьютерного бенчмаркинга. В статье предлагается формальная спецификация для бенчмарков ИИ, подробно описывающая такие важные компоненты, как инфраструктура, наборы данных, научные задачи, метрики и ограничения. Рассматриваются существующие усилия по бенчмаркингу, включая бенчмаркинг HPC (TOP500, Green500), машинного обучения (MLCommons) и технические аспекты, такие как рабочие процессы, контейнеризация и мониторинг. Особое внимание уделяется бенчмаркингу GPU и энергопотребления, включая концепцию «AI Energy Benchmark Carpentry». Текст подчеркивает необходимость непрерывных, адаптивных фреймворков для преодоления проблем, таких как запоминание LLM статичных бенчмарков, что приводит к расхождению с реальной производительностью. В конечном итоге, документ направлен на выявление барьеров, препятствующих широкому внедрению бенчмаркинга ИИ, и предлагает учебную программу и методы обмена бенчмарками для содействия более широкой доступности и развитию экспертизы. #БенчмаркингИИ #Демократизация #BenchmarkCarpentry #МашинноеОбучение #HPC #MLCommons #Энергоэффективность #ПроизводительностьGPU #ИсследованияИИ #Стандартизация документ - https://arxiv.org/pdf/2512.11588v1 подписаться - https://t.me/arxivpaperu отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM

, чтобы оставлять комментарии