Обзор: FORGE - инновационный протокол самосовершенствования агентов

Исследование представляет FORGE — инновационный протокол самосовершенствования агентов на базе больших языковых моделей для решения задач в сложных, стохастических средах киберзащиты. В отличие от традиционных подходов, этот метод развивает память агентов через текстовые инструкции и примеры без прямого обновления весов нейросети. Система использует механизм популяционного вещания, при котором лучшие стратегии, извлеченные из анализа ошибок, передаются всей группе агентов. Эксперименты на платформе CybORG CAGE-2 показали, что такая селективная эволюция знаний повышает эффективность защиты до 7,7 раз по сравнению с базовыми моделями. Авторы доказывают, что структурированное накопление опыта в виде правил и демонстраций позволяет даже относительно слабым моделям достигать уровня специализированных алгоритмов обучения с подкреплением. Таким образом, работа обосновывает жизнеспособность градиентно-независимого обучения для автономных систем принятия решений.

12+
6 просмотров
месяц назад
12+
6 просмотров
месяц назад

Исследование представляет FORGE — инновационный протокол самосовершенствования агентов на базе больших языковых моделей для решения задач в сложных, стохастических средах киберзащиты. В отличие от традиционных подходов, этот метод развивает память агентов через текстовые инструкции и примеры без прямого обновления весов нейросети. Система использует механизм популяционного вещания, при котором лучшие стратегии, извлеченные из анализа ошибок, передаются всей группе агентов. Эксперименты на платформе CybORG CAGE-2 показали, что такая селективная эволюция знаний повышает эффективность защиты до 7,7 раз по сравнению с базовыми моделями. Авторы доказывают, что структурированное накопление опыта в виде правил и демонстраций позволяет даже относительно слабым моделям достигать уровня специализированных алгоритмов обучения с подкреплением. Таким образом, работа обосновывает жизнеспособность градиентно-независимого обучения для автономных систем принятия решений.

, чтобы оставлять комментарии