Немьютируемость как constraint: от слоя присутствия к RL/CMDP... new 2026 06 08
В этом видео показываю, что изменилось в работе над статьёй 5 «Немьютируемость как constraint: от слоя присутствия к RL/CMDP-спецификациям субъектных агентов». https://drive.google.com/file/d/1Lj4ZupFv00Ge4mrGYWtKcuKG0u4Uz-DT/view?usp=drive_link Главное изменение — статья перестала быть только философско-архитектурным текстом и получила инженерное продолжение. Мы уточнили формулировки, убрали чрезмерно сильные claims, отделили концептуальный тезис от экспериментального evidence и добавили воспроизводимое приложение с программной моделью. В статье теперь яснее разведены три уровня утверждений: 1. что логически следует из самой спецификации; 2. что показано в toy benchmark; 3. что остаётся архитектурной гипотезой и future work. Главный тезис сохранён: protected own-state нельзя надёжно сводить только к отрицательному scalar reward penalty. Если повреждение собственного состояния выражено в той же reward-валюте, агент может “купить” это повреждение высокой наградой, оптимизировать proxy или обойти смысл ограничения. Поэтому в статье предлагается hybrid nonmutability constraint: cost-channel, runtime shield, interrupt channel, audit log, controlled override и recovery obligation. Параллельно мы сделали два GitHub-проекта. Первый проект относится напрямую к статье 5: **Nonmutability Constraint Simulator** Это локальный Python toy benchmark для проверки идеи статьи. В нём сравниваются три режима агента: * Scalar Penalty Agent; * CMDP / Cost-aware Agent; * Hybrid Nonmutability Agent с runtime shield, audit log, interrupt channel и recovery obligation. Симулятор запускает stress-сценарии в grid world и показывает, где scalar penalty допускает self-damage, taboo shortcut или proxy exploitation, а где cost-aware и hybrid-режимы предотвращают эти failure modes. Результаты сохраняются в открытых форматах: `results.csv`, `audit.jsonl`, `summary.md`. https://github.com/AIDevelopersMonster/nonmutability-constraint-simulator Второй проект — общего назначения: **ESPD Doc Factory** Это проект для оформления технической и научно-технической документации с использованием LaTeX. Его задача — собирать документы в нормальном формате, в том числе под Windows/XeLaTeX, с корректной Unicode/PDF-кодировкой, шаблонами, сборкой PDF и дальнейшей возможностью приводить документы к ЕСПД/ГОСТ-ориентированному виду. То есть один проект стал экспериментальным приложением к статье 5, а второй — инфраструктурой для оформления документации и будущих технических заданий, отчётов, PDF и LaTeX-документов. В результате статья 5 получила новую редакцию: более осторожную научно, более проверяемую инженерно и связанную с реальным воспроизводимым кодом.
В этом видео показываю, что изменилось в работе над статьёй 5 «Немьютируемость как constraint: от слоя присутствия к RL/CMDP-спецификациям субъектных агентов». https://drive.google.com/file/d/1Lj4ZupFv00Ge4mrGYWtKcuKG0u4Uz-DT/view?usp=drive_link Главное изменение — статья перестала быть только философско-архитектурным текстом и получила инженерное продолжение. Мы уточнили формулировки, убрали чрезмерно сильные claims, отделили концептуальный тезис от экспериментального evidence и добавили воспроизводимое приложение с программной моделью. В статье теперь яснее разведены три уровня утверждений: 1. что логически следует из самой спецификации; 2. что показано в toy benchmark; 3. что остаётся архитектурной гипотезой и future work. Главный тезис сохранён: protected own-state нельзя надёжно сводить только к отрицательному scalar reward penalty. Если повреждение собственного состояния выражено в той же reward-валюте, агент может “купить” это повреждение высокой наградой, оптимизировать proxy или обойти смысл ограничения. Поэтому в статье предлагается hybrid nonmutability constraint: cost-channel, runtime shield, interrupt channel, audit log, controlled override и recovery obligation. Параллельно мы сделали два GitHub-проекта. Первый проект относится напрямую к статье 5: **Nonmutability Constraint Simulator** Это локальный Python toy benchmark для проверки идеи статьи. В нём сравниваются три режима агента: * Scalar Penalty Agent; * CMDP / Cost-aware Agent; * Hybrid Nonmutability Agent с runtime shield, audit log, interrupt channel и recovery obligation. Симулятор запускает stress-сценарии в grid world и показывает, где scalar penalty допускает self-damage, taboo shortcut или proxy exploitation, а где cost-aware и hybrid-режимы предотвращают эти failure modes. Результаты сохраняются в открытых форматах: `results.csv`, `audit.jsonl`, `summary.md`. https://github.com/AIDevelopersMonster/nonmutability-constraint-simulator Второй проект — общего назначения: **ESPD Doc Factory** Это проект для оформления технической и научно-технической документации с использованием LaTeX. Его задача — собирать документы в нормальном формате, в том числе под Windows/XeLaTeX, с корректной Unicode/PDF-кодировкой, шаблонами, сборкой PDF и дальнейшей возможностью приводить документы к ЕСПД/ГОСТ-ориентированному виду. То есть один проект стал экспериментальным приложением к статье 5, а второй — инфраструктурой для оформления документации и будущих технических заданий, отчётов, PDF и LaTeX-документов. В результате статья 5 получила новую редакцию: более осторожную научно, более проверяемую инженерно и связанную с реальным воспроизводимым кодом.



