Как мозг видит мир: отличия от искусственного интеллекта

Автор: Денис Аветисян

Новое исследование показывает, что мозг макаки кодирует положение объектов в соответствии с нашим восприятием, в отличие от современных нейросетей.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"

Исследование выявило, что нижнетеменная кора мозга макаки кодирует пространственное положение объектов в перцептивно-согласованной системе координат, что не воспроизводится в текущих искусственных нейронных сетях.

Несмотря на успехи в области искусственного зрения, остается неясным, насколько эффективно современные нейронные сети моделируют механизмы пространственного кодирования, присущие биологическим системам. В работе, озаглавленной ‘The macaque IT cortex but not current artificial vision networks encode object position in perceptually aligned coordinates’, исследователи изучили, как макаки и искусственные нейронные сети кодируют положение объектов в пространстве, используя адаптацию к движению как инструмент для изучения перцептивных координат. Полученные результаты свидетельствуют о том, что кора нижнего височного отдела (IT) макак кодирует положение объектов в соответствии с перцептивным опытом, в то время как современные искусственные сети демонстрируют эту способность лишь после применения эмпирически выведенных преобразований. Каковы перспективы создания искусственных систем, способных к гибкому и адаптивному пространственному кодированию, подобному биологическому зрению?

Визуальное восприятие: разделяй и властвуй

Визуальное восприятие не является единым процессом; мозг разделяет поступающую информацию по двум основным путям для повышения эффективности обработки. Этот принцип разделения лежит в основе способности человека быстро и точно распознавать объекты и ориентироваться в пространстве. Вместо обработки всей визуальной информации централизованно, мозг распределяет задачи: один путь специализируется на определении что мы видим — форму, цвет, текстуру, — а другой — на определении где находится объект и как с ним взаимодействовать. Такое разделение позволяет мозгу обрабатывать огромный объем визуальных данных параллельно, значительно ускоряя реакцию на окружающий мир и обеспечивая более гибкое поведение в различных ситуациях. Именно благодаря этой архитектуре, человек способен мгновенно узнать знакомое лицо в толпе или ловко уклониться от препятствия на пути.

Гипотеза двух потоков утверждает, что зрительная информация обрабатывается мозгом по двум различным путям — вентральному и дорсальному. Вентральный поток, также известный как поток “что”, специализируется на распознавании объектов и их идентификации, позволяя мозгу определять, что он видит — будь то лицо, предмет или сцена. В то же время, дорсальный поток, или поток “где”, отвечает за обработку пространственной информации, позволяя мозгу определять где находятся объекты в пространстве и как с ними взаимодействовать. Эта функциональная специализация позволяет мозгу эффективно и параллельно обрабатывать визуальную информацию, обеспечивая быстрое распознавание объектов и успешную навигацию в окружающем мире. Взаимодействие между этими двумя потоками имеет решающее значение для формирования целостного зрительного восприятия и адаптации к окружающей среде.

Нейронные ансамбли и подавление повторов: экономия ресурсов мозга

Вместо кодирования информации отдельными нейронами, мозг использует так называемые популяционные коды — распределенные паттерны активности, формирующиеся в результате совместной работы множества нейронов. Этот подход позволяет обеспечить надежность и устойчивость представления информации, поскольку выход из строя отдельных нейронов не приводит к полной потере сигнала. Информацию кодирует не интенсивность сигнала одного нейрона, а комбинация активности в популяции, что позволяет мозгу обрабатывать сложные стимулы и эффективно представлять различные аспекты информации, такие как форма, цвет и положение объекта.

В коре головного мозга макак, в частности в области IT-кортекса, наблюдается явление повторного подавления (Repetition Suppression) — снижение активности нейронов при повторном предъявлении одного и того же стимула. Этот эффект свидетельствует об эффективной обработке информации мозгом, поскольку повторно предъявляемый стимул требует меньших вычислительных ресурсов для анализа. Уменьшение нейронного ответа указывает на то, что информация уже была обработана и сохранена, что позволяет мозгу сосредоточиться на новых или изменяющихся сигналах. Повторное подавление является одним из механизмов, обеспечивающих экономичность и скорость обработки сенсорной информации.

Данные, полученные из коры головного мозга макаки (IT-кортекса), демонстрируют высокую точность декодирования положения объектов на основе паттернов нейронной активности. Анализ показал, что существует корреляция от 0.60 до 0.68 между предсказанным на основе нейронных данных положением объекта и его фактическим положением. Это указывает на то, что популяции нейронов в IT-кортексе кодируют информацию о пространственном местоположении объектов, позволяя осуществлять достаточно точное восстановление этой информации на основе наблюдаемой нейронной активности.

Перцептивные иллюзии как окно в работу мозга: адаптация и искажения

Эффект послеобразия движения демонстрирует адаптацию в зрительных областях, таких как MT (медиотемпоральная область), что проявляется в изменении нейронных ответов после продолжительного воздействия стимула. Данный феномен обусловлен тем, что длительная стимуляция нейронов, отвечающих за восприятие движения в определенном направлении, приводит к снижению их чувствительности к этому направлению. В результате, при последующем восприятии стационарного стимула или стимула, движущегося в противоположном направлении, возникает иллюзия движения, обусловленная перестройкой нейронных представлений и адаптацией нейронов в MT. Данный процесс является ключевым механизмом, лежащим в основе построения зрительного восприятия и обработки информации о движении.

Адаптация, происходящая в зрительной коре, искажает нейронные представления о пространственном положении объектов. Исследования показали, что после продолжительного воздействия движущихся стимулов вправо, у людей наблюдается смещение воспринимаемого положения объектов на 0.20° влево. Этот эффект демонстрирует активную роль мозга в конструировании восприятия, а не просто пассивной регистрации внешних стимулов, и указывает на то, что нейронные механизмы, отвечающие за пространственное кодирование, подвержены изменениям под влиянием предшествующего опыта.

Исследования коры IT макак показали, что после адаптации к движению, декодированное положение объекта смещается на 0.84° в направлении, соответствующем направлению адаптации. Этот сдвиг в декодированном положении, наблюдаемый у приматов, качественно соответствует аналогичному перцептивному сдвигу, зафиксированному у людей, что указывает на общие нейронные механизмы, лежащие в основе адаптации к движению и формирования перцептивного опыта у обоих видов. Данные свидетельствуют о том, что адаптация в зрительной коре влияет на кодирование пространственной информации, вызывая систематическую ошибку в оценке положения стимула.

Моделирование мозга: от нейронов к нейронным сетям

Искусственные нейронные сети (ИНС), вдохновленные биологическими системами, представляют собой мощный инструмент для моделирования сложных функций мозга, в частности, декодирования положения объектов. Этот подход позволяет исследователям создавать вычислительные модели, имитирующие обработку информации в нервной системе, что способствует пониманию механизмов, лежащих в основе зрительного восприятия и пространственной ориентации. ИНС позволяют анализировать активность нейронов и предсказывать, какие объекты и где воспринимает мозг, что находит применение в таких областях, как компьютерное зрение и нейропротезирование. Эффективность ИНС в моделировании декодирования положения объектов обусловлена их способностью к обучению на больших объемах данных и выявлению сложных закономерностей, характерных для нейронной активности.

Искусственные нейронные сети (ИНС) представлены широким спектром архитектур, различающихся по сложности и функциональности. Простейшие из них — сети прямого распространения (Feedforward ANNs) — обрабатывают информацию в одном направлении. Более сложные рекуррентные нейронные сети (Recurrent ANNs) способны учитывать временную последовательность данных, используя обратные связи и внутреннюю память. Наконец, появились видео-ориентированные нейронные сети (Video-Based Neural Networks), предназначенные для обработки и анализа видеопотоков, что позволяет им моделировать более сложные процессы, зависящие от времени и пространственных изменений в визуальной информации.

Несмотря на прогресс в области искусственных нейронных сетей (ИНС), современные модели демонстрируют неспособность воспроизвести направленные смещения, наблюдаемые в нейронных данных. В частности, анализ предсказанных положений объектов, выполненный с помощью ИНС, показал близкую к нулевой корреляцию между ними. Это контрастирует с данными, полученными от коры головного мозга макак (область IT), где зафиксировано значимое смещение на 0.84° в предсказаниях положения объектов. Данный факт указывает на существенные расхождения между функционированием ИНС и биологических нейронных сетей в контексте обработки пространственной информации.

Пространственное мышление и ИИ: что нас ждет в будущем?

Исследования коры головного мозга макак, в частности области IT, демонстрируют, что мозг не просто статично отображает окружающее пространство, но и динамически адаптирует свои представления в ответ на изменения в окружающей среде. Этот процесс, названный адаптационным искажением репрезентаций, предполагает, что нейронные карты, отвечающие за кодирование положения объектов, претерпевают изменения, отражающие текущий перцептивный опыт. Вместо фиксированных координат, мозг строит гибкие представления, оптимизированные для текущей ситуации, что позволяет эффективно ориентироваться и взаимодействовать со сложными и меняющимися ландшафтами. Подобная пластичность позволяет животным быстро адаптироваться к новым условиям и сохранять надежную навигацию даже при значительных изменениях в окружающей среде, что указывает на фундаментальный механизм нейронной адаптации.

Принципы адаптационной деформации репрезентаций, обнаруженные в коре головного мозга макак, открывают перспективные пути для создания более устойчивых и приспособляемых систем искусственного интеллекта. В отличие от существующих нейронных сетей, которые часто полагаются на статичные представления пространства, моделирование динамической адаптации, подобной той, что наблюдается в мозге, позволит ИИ-системам более эффективно ориентироваться в сложных и изменчивых средах. Подобный подход предполагает, что ИИ сможет не просто запоминать расположение объектов, но и активно перестраивать свои внутренние представления в ответ на поступающую сенсорную информацию, обеспечивая тем самым повышенную надежность и гибкость в процессе навигации и взаимодействия с окружающим миром. Использование этих принципов может привести к созданию роботов и виртуальных агентов, способных к более естественному и адаптивному поведению в реальных условиях.

Исследование показало, что мозг кодирует положение объектов, ориентируясь на непосредственный перцептивный опыт, а не на абсолютные координаты. В отличие от этого, современные искусственные нейронные сети, как правило, используют фиксированные системы координат, что приводит к негибкости и низкой адаптивности в меняющихся условиях. Мозг, в свою очередь, демонстрирует способность к «искажению» представлений о пространстве, подстраиваясь под индивидуальное восприятие и контекст, что позволяет эффективно ориентироваться даже в сложных и непредсказуемых средах. Эта динамическая природа кодирования положения объектов, характерная для биологических систем, пока остается недостижимой для большинства алгоритмов искусственного интеллекта, и ее воспроизведение может стать ключевым шагом к созданию более устойчивых и адаптивных ИИ-систем.

Исследование показывает, что кора головного мозга макаки кодирует положение объектов в соответствии с восприятием, адаптируясь к движению. Этот динамический процесс, как выясняется, ускользает от современных искусственных нейронных сетей. Неудивительно, ведь, как заметил Юрген Хабермас: «Коммуникативное действие — это не просто передача информации, а процесс взаимопонимания». В данном случае, нейронные сети, не обладая способностью к адаптивному «взаимопониманию» с визуальной информацией, демонстрируют ограниченность в кодировании пространственной информации. Похоже, что элегантная теория часто разбивается о суровую реальность продакшена, где даже самые передовые модели не всегда способны воспроизвести гибкость биологического мозга. Каждая «революционная» технология, как мы видим, обречена со временем стать техдолгом.

Куда это всё ведёт?

Настоящая сложность, как показывает данное исследование, заключается не в создании нейронных сетей, имитирующих кору головного мозга, а в воспроизведении принципов её динамической адаптации. Устойчивое кодирование позиции объекта, зависящее от предшествующего движения — это не просто вопрос добавления ещё одного слоя в архитектуру. Это признание того, что «интеллект» — это, в первую очередь, умение игнорировать шум и адаптироваться к неизбежным искажениям. Искусственные сети пока демонстрируют лишь способность усложнять процесс, а не решать проблему.

Надежда на то, что достаточное количество параметров автоматически приведет к появлению «восприятия», представляется наивной. Более продуктивным представляется сосредоточение на механизмах, позволяющих сети «забывать» — то есть, динамически перестраивать внутреннее представление мира, основываясь на текущем контексте. Нам не нужно больше микросервисов — нам нужно меньше иллюзий о том, что «чистый код» выдержит столкновение с реальной эксплуатацией.

В конечном счёте, каждое «революционное» достижение в области искусственного интеллекта станет лишь очередным пунктом в списке технического долга. Попытки создать универсальный алгоритм «восприятия» обречены на провал. Вместо этого следует признать, что «интеллект» — это всегда локальное, контекстуальное решение, которое неизбежно устаревает и требует переработки. И это — не недостаток, а фундаментальное свойство любой сложной системы.

Оригинал статьи: https://arxiv.org/pdf/2603.11248.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-13 22:44