Память как основа интеллекта: переосмысление механизмов в продвинутых агентах

В статье представлен всесторонний обзор систем памяти, используемых в современных интеллектуальных агентах, и их ключевая роль в обеспечении долгосрочной обучаемости и адаптивности.

От улицы к порогу: зрение и инструкции для навигации в реальном мире

Существующие исследования в области воплощенной навигации обычно концентрируются исключительно на внутренних или внешних средах, однако для выполнения задач доставки агентам часто требуется беспрепятственно переходить между этими двумя типами окружения, что обусловило разработку новой задачи BridgeNav, позволяющей агентам перемещаться из внешней среды во внутреннюю и точно входить в здания без использования каких-либо априорных знаний.

Исследователи представили новый подход к навигации, позволяющий агентам самостоятельно прокладывать путь от открытого пространства до конечной точки внутри помещения, опираясь исключительно на визуальную информацию и текстовые указания.

Автомобили будущего: как говорить с пешеходами?

Новый анализ десятилетних исследований показывает, что внешняя коммуникация автономных транспортных средств стремится к единообразию в вопросах безопасности, но расходится в практической реализации.

Роботы учатся манипулировать как люди: новый подход к управлению человекоподобными роботами

Система сбора данных HuMI решает проблему неполного описания движений манипулятора, вызванного использованием только информации о захвате, и несоответствия масштаба человеческих движений размерам робота, обеспечивая сбор данных как для обучения высокоуровневой политики на основе визуальных наблюдений и траекторий в пространстве SE(3), так и для получения эталонных движений всего тела для низкоуровневого контроллера посредством кинематического решения обратной задачи.

Исследователи разработали систему, позволяющую человекоподобным роботам осваивать сложные задачи манипулирования, используя данные, собранные без непосредственного участия робота.

Самообучающиеся агенты для мобильных интерфейсов: новый подход

Предлагаемая структура UI-Mem обеспечивает агента иерархическим опытом, включающим рабочие процессы, навыки выполнения подзадач и шаблоны неудач, при этом стратифицированная выборка групп позволяет генерировать траектории с различной степенью направленности для эффективной оценки преимуществ при оптимизации политики, а извлечение абстрактных планов из успешных траекторий и диагностика неудач в саморазвивающемся цикле способствуют постоянному совершенствованию и переносу опыта между задачами.

Исследователи предлагают инновационную систему памяти опыта, позволяющую агентам, управляемым обучением с подкреплением, быстрее осваивать и переносить навыки работы с мобильными приложениями.