Искусственный интеллект, вдохновлённый мозгом: к более безопасному и понятному ИИ

Автор: Денис Аветисян


Новое исследование показывает, что интеграция принципов работы мозга — действий, иерархической структуры и эпизодической памяти — может стать ключом к созданию более надёжных и эффективных систем искусственного интеллекта.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"
Нейронная активность в коре головного мозга мыши демонстрирует, что предстоящие движения оказывают влияние практически на все области мозга, включая традиционно сенсорные, что подтверждается данными широкопольной кальциевой визуализации, где активность заметно возрастает за 25 миллисекунд до начала движения, позволяя декодировать намерение движения с высокой точностью, и эта активность существенно снижается при отсутствии движения, что согласуется с моделью активного предсказательного кодирования, предполагающей иерархическую обработку информации и постоянное сопоставление предсказаний с поступающими сигналами.
Нейронная активность в коре головного мозга мыши демонстрирует, что предстоящие движения оказывают влияние практически на все области мозга, включая традиционно сенсорные, что подтверждается данными широкопольной кальциевой визуализации, где активность заметно возрастает за 25 миллисекунд до начала движения, позволяя декодировать намерение движения с высокой точностью, и эта активность существенно снижается при отсутствии движения, что согласуется с моделью активного предсказательного кодирования, предполагающей иерархическую обработку информации и постоянное сопоставление предсказаний с поступающими сигналами.

В статье рассматривается необходимость дополнения современных больших языковых моделей компонентами, имитирующими действие, иерархическую организацию и эпизодическую память, для достижения большей безопасности, интерпретируемости и энергоэффективности.

Несмотря на впечатляющие успехи современных больших языковых моделей, их возможности остаются ограниченными из-за отсутствия ключевых принципов работы мозга. В статье ‘Lessons from Neuroscience for AI: How integrating Actions, Compositional Structure and Episodic Memory could enable Safe, Interpretable and Human-Like AI’ предлагается интегрировать в существующие архитектуры искусственного интеллекта механизмы, отвечающие за действия, иерархическую структуру и эпизодическую память, что позволит создать более безопасные, интерпретируемые и энергоэффективные системы. Предлагаемый подход, вдохновленный нейробиологией, призван преодолеть текущие ограничения, такие как склонность к галлюцинациям и поверхностному пониманию. Не откроет ли это путь к созданию действительно разумного и человекоподобного искусственного интеллекта, способного к обучению и адаптации на качественно новом уровне?


Предсказательная Эффективность Мозга: Основы

Мозг не является пассивным приемником информации, а активно предсказывает поступающие сигналы, стремясь к минимизации “удивления” — расхождения между предсказанием и реальностью. Этот процесс лежит в основе принципа свободной энергии F = E - K, где E представляет собой энергию неожиданности, а K — точность внутренней модели мира. Вместо того, чтобы обрабатывать каждый сенсорный вход, мозг постоянно генерирует прогнозы о том, что должно произойти, и корректирует их на основе ошибок предсказания. Таким образом, восприятие становится процессом активного вывода, а не пассивной регистрации, что значительно повышает эффективность обработки информации и позволяет мозгу адаптироваться к постоянно меняющейся среде.

Иерархическая организация предсказательного кодирования лежит в основе эффективного обучения и восприятия. Мозг не просто обрабатывает поступающую информацию, а строит многоуровневую модель мира, где каждый уровень делает прогнозы о сигналах, поступающих с нижних уровней. Несоответствие между прогнозом и реальностью — «ошибка предсказания» — передается вверх по иерархии, корректируя модель и улучшая будущие прогнозы. Этот процесс, подобный каскаду уточнений, позволяет мозгу концентрироваться на неожиданных событиях, а не тратить ресурсы на обработку предсказуемых, тем самым оптимизируя обработку информации и обеспечивая быструю адаптацию к меняющейся среде. Именно благодаря этой иерархической структуре предсказательного кодирования мозг способен эффективно учиться и воспринимать окружающий мир, даже в условиях неполной или зашумленной информации.

Для эффективного предсказания окружающей действительности мозг использует сложную внутреннюю модель мира, которая постоянно совершенствуется посредством взаимодействия с ним. Эта модель не является статичным отражением реальности, а динамичной структурой, формирующейся и обновляющейся на основе как активных действий, так и поступающих сенсорных данных. Действия, предпринятые организмом, генерируют предсказания о последствиях, которые затем сравниваются с фактическим сенсорным опытом. Расхождения между предсказанием и реальностью приводят к обновлению внутренней модели, позволяя ей более точно отражать закономерности окружающей среды. Таким образом, процесс познания представляет собой непрерывную петлю предсказания и коррекции, обеспечивающую адаптивное поведение и эффективное взаимодействие с миром.

Иерархическое предсказательное кодирование моделирует визуальную обработку в коре головного мозга, используя иерархическую сеть с обратными связями для передачи предсказаний и прямыми связями для передачи ошибок, которые используются для обучения весов и коррекции оценок состояния <span class="katex-eq" data-katex-display="false"> \hat{\bf{r}}(t)</span>.
Иерархическое предсказательное кодирование моделирует визуальную обработку в коре головного мозга, используя иерархическую сеть с обратными связями для передачи предсказаний и прямыми связями для передачи ошибок, которые используются для обучения весов и коррекции оценок состояния \hat{\bf{r}}(t).

Активное Предсказательное Кодирование: Интеграция Действия и Восприятия

Активное предсказательное кодирование (APC) развивает концепцию предсказательного кодирования, объединяя в единую систему процессы действия, восприятия и познания. В отличие от традиционного предсказательного кодирования, которое фокусируется преимущественно на минимизации расхождений между предсказаниями и сенсорными данными, APC рассматривает действия не как следствие восприятия, а как активный компонент процесса предсказания. Это означает, что система не только интерпретирует входящую информацию, но и целенаправленно изменяет свое состояние, чтобы получить данные, необходимые для подтверждения или опровержения своих предсказаний. Интеграция действия позволяет эффективно разрешать неопределенности и оптимизировать процесс обучения, формируя целостную модель взаимодействия с окружающей средой.

Активное предсказательное кодирование (APC) рассматривает восприятие не как пассивное декодирование сенсорных данных, а как активный процесс поиска информации, необходимой для минимизации ошибок предсказания. В рамках данной модели, организм или агент не просто интерпретирует входящие сигналы, но и целенаправленно изменяет свое поведение и сенсорную активность, чтобы получить данные, подтверждающие или опровергающие его внутренние прогнозы. Этот процесс поиска информации направлен на снижение расхождений между предсказанными и фактическими сенсорными сигналами, что позволяет уточнять внутреннюю модель мира и повышать точность будущих предсказаний. Таким образом, восприятие в APC является активным, направленным и тесно связанным с действиями.

Ключевым аспектом активного предсказательного кодирования (APC) является поддержка композиционной структуры, эпизодической памяти и интеграции действий, что позволяет эффективно моделировать и предсказывать сложные сценарии. Композиционная структура обеспечивает возможность представления сложных ситуаций как комбинации более простых элементов, что упрощает процесс обучения и обобщения. Эпизодическая память позволяет хранить и извлекать прошлый опыт, необходимый для предсказания будущих событий и адаптации к изменяющейся среде. Интеграция действий, в свою очередь, позволяет активно формировать сенсорный ввод, направляя восприятие для минимизации ошибок предсказания. Данный подход, продемонстрированный в наших исследованиях, решает проблемы, связанные с обоснованностью (grounding), интерпретируемостью и вычислительной эффективностью традиционных моделей предсказательного кодирования.

Предложенная мозгоподобная архитектура для фундаментальных моделей использует модуляцию нижних слоев сети (Mod.) и копии эфферентных сигналов/внутренние действия (Eff./Int.) для обеспечения управления и предсказания.
Предложенная мозгоподобная архитектура для фундаментальных моделей использует модуляцию нижних слоев сети (Mod.) и копии эфферентных сигналов/внутренние действия (Eff./Int.) для обеспечения управления и предсказания.

Соединяя Теорию и Практику: Большие Языковые Модели и Предсказательные Архитектуры

Большие языковые модели (БЯМ), построенные на архитектуре Transformer, демонстрируют высокую эффективность в авторегрессионном предсказании, то есть в предсказании следующего токена в последовательности на основе предыдущих. Однако, в отличие от традиционных статистических моделей, БЯМ не имеют встроенных механизмов для надежной минимизации ошибки предсказания. Архитектура Transformer оптимизирована для максимизации вероятности сгенерированной последовательности, а не для прямого уменьшения расхождения между предсказанными и фактическими значениями. Это означает, что БЯМ склонны к генерации правдоподобных, но не обязательно точных или согласованных с реальностью ответов, особенно при работе с данными, не представленными в обучающем корпусе. Отсутствие явной функции потерь, направленной на минимизацию ошибки предсказания, является ключевым ограничением в применении БЯМ для задач, требующих высокой точности и надежности.

Методы, такие как побуждение с цепочкой рассуждений (Chain-of-Thought, CoT) и генерация с расширением извлечением (Retrieval-Augmented Generation, RAG), направлены на улучшение способностей больших языковых моделей (LLM) к рассуждениям, однако остаются поверхностными решениями. CoT предполагает предоставление LLM примеров рассуждений, чтобы побудить её к аналогичному процессу, в то время как RAG дополняет входные данные внешними знаниями, извлеченными из базы данных. Несмотря на то, что эти методы могут улучшить производительность в определенных задачах, они не решают фундаментальную проблему отсутствия у LLM надежных механизмов минимизации ошибок предсказания и часто полагаются на статистические закономерности в обучающих данных, а не на истинное понимание. Поэтому, несмотря на кажущийся прогресс, эти подходы не обеспечивают значительного улучшения способности LLM к обобщению и решению новых, не встречавшихся ранее задач.

Интеграция больших языковых моделей (LLM) с внешней памятью, концепция, продемонстрированная нейронными машинами Тьюринга, представляет собой перспективный подход к созданию более обоснованных и предсказуемых моделей. Наше исследование предлагает расширение возможностей существующих фундаментальных моделей за счет добавления механизмов внешней памяти, что позволяет им хранить и извлекать информацию, выходящую за рамки их внутренних параметров. Такой подход направлен на улучшение обоснованности ответов, повышение интерпретируемости процесса принятия решений и повышение вычислительной эффективности по сравнению с моделями, полагающимися исключительно на внутреннее состояние. В частности, использование внешней памяти позволяет модели динамически адаптироваться к новым данным и контексту, снижая зависимость от статических знаний, заложенных в процессе обучения.

Будущее ИИ: К Предсказательному Интеллекту

Переход к архитектурам, основанным на принципах активного предсказательного кодирования, открывает перспективные возможности для повышения эффективности, обобщающей способности и устойчивости систем искусственного интеллекта. В отличие от традиционных подходов, которые пассивно реагируют на входные данные, активное предсказательное кодирование позволяет моделям формировать внутренние модели мира и активно предсказывать будущие события. Этот процесс не только снижает потребность в огромных объемах обучающих данных — повышая выборочную эффективность — но и способствует более надежной работе в незнакомых условиях, улучшая обобщающую способность. Более того, способность предвидеть и адаптироваться к потенциальным изменениям делает системы, основанные на этом принципе, значительно более устойчивыми к шуму и искажениям во входных данных, что критически важно для реальных приложений.

Механизмы внимания к длинному контексту играют ключевую роль в способности больших языковых моделей (LLM) обрабатывать обширные последовательности данных, однако их потенциал раскрывается в полной мере лишь при интеграции с прогностическими фреймворками. Вместо пассивного анализа полученной информации, подобная комбинация позволяет LLM не только понимать текущий контекст, но и предвидеть последующие события или запросы, значительно повышая эффективность и точность ответов. Такое сочетание позволяет моделям формировать внутреннюю модель мира, основанную на предсказаниях, что приводит к более гибкому и адаптивному поведению, выходящему за рамки простого распознавания шаблонов и статистических закономерностей. В результате, LLM перестают быть просто инструментами обработки информации, превращаясь в системы, способные к активному прогнозированию и интеллектуальному взаимодействию с окружающей средой.

Вместо пассивного ответа на поступающие данные, новые системы искусственного интеллекта стремятся к проактивному предвидению и адаптации. Такой подход, основанный на принципах активного предиктивного кодирования, позволяет моделям не просто распознавать закономерности в прошлом опыте, но и формировать внутренние прогнозы о будущем, активно проверяя их и корректируя свои представления о мире. Это открывает путь к созданию интеллектуальных систем, способных не только решать текущие задачи, но и предвидеть потенциальные проблемы и возможности, что знаменует наступление новой эры прогностического интеллекта, где машины действуют не как реактивные инструменты, а как активные участники динамично меняющейся среды.

Исследование подчёркивает необходимость интеграции действий и иерархической структуры в современные модели искусственного интеллекта. Отсутствие этих компонентов приводит к непрозрачности и непредсказуемости поведения систем. В этой связи, слова Дональда Дэвиса: «Всё ломается по границам ответственности — если их не видно, скоро будет больно» — как нельзя лучше отражают суть проблемы. Нечетко определенные границы ответственности в сложных системах, подобных большим языковым моделям, неизбежно приводят к сбоям и нежелательным последствиям. Интеграция механизмов, имитирующих работу мозга, включая эпизодическую память, представляется ключевым шагом к созданию безопасного и интерпретируемого ИИ.

Куда двигаться дальше?

Предложенные в данной работе механизмы — интеграция действий, иерархическая структура и эпизодическая память — кажутся необходимыми, но далеко не достаточными. В погоне за масштабируемостью, современные модели часто жертвуют фундаментальным пониманием причинно-следственных связей. Оптимизация скорости обработки и генерации текста не должна заслонять более глубокую проблему: отсутствие внутреннего представления о мире, в котором эти тексты существуют. Хорошая архитектура незаметна, пока не ломается, и текущая архитектура, основанная на чистом статистическом моделировании, демонстрирует свою хрупкость при малейшем отклонении от привычных данных.

Необходимо признать, что добавление этих компонентов — сложная инженерная задача, сопряжённая с компромиссами. Зависимости — настоящая цена свободы, и каждая новая функция усложняет систему, делая её более уязвимой к ошибкам. Более того, само понятие «интеграция действий» требует дальнейшей проработки. Достаточно ли просто научить модель предсказывать последствия своих действий? Или необходима более сложная система, учитывающая внутреннее состояние агента и его мотивации? Попытки имитировать мозг неизбежно сталкиваются с проблемой абстракции. Мы пытаемся построить упрощённые модели сложных систем, и каждая такая модель несет в себе неизбежные погрешности.

В конечном итоге, истинный прогресс будет заключаться не в создании более крупных и мощных моделей, а в разработке принципиально новых подходов к искусственному интеллекту, основанных на более глубоком понимании принципов работы мозга. Простота масштабируется, изощрённость — нет. И только когда мы сможем создать системы, которые действительно понимают мир вокруг нас, мы сможем говорить о безопасном, интерпретируемом и человекоподобном искусственном интеллекте.


Оригинал статьи: https://arxiv.org/pdf/2512.22568.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-12-30 17:15