Повествование под контролем: как пространственное взаимодействие улучшает работу с большими языковыми моделями

Существующие подходы к генерации текста из пространственных данных часто сосредотачиваются на тонкой настройке запросов, однако предложенная методика семантической промптизации преобразует новые семантические взаимодействия в итеративные уточнения, создавая прямую связь между действиями пользователя и изменениями в генерируемом тексте, что позволяет осуществлять инкрементную доработку результатов.

Новый подход позволяет преобразовывать визуальные действия в точные инструкции для языковых моделей, значительно повышая эффективность анализа и понимания данных.

Интеракции в 3D: Новый подход к пониманию взаимодействия человека и объектов

Исследователи представили LEXIS — инновационный метод реконструкции 3D взаимодействий человека и объектов, основанный на изучении скрытых закономерностей в пространстве взаимодействий.

Обучение ловкости: ИИ осваивает взаимодействие с предметами через симуляцию

Метод DeVI, работающий в трехмерной физической среде с участием человека и объектов, генерирует физически правдоподобные взаимодействия, используя видео-диффузионную модель в качестве планировщика движений, учитывающего текстовые запросы, описывающие желаемое взаимодействие [latex] \implies [/latex] взаимодействие определяется текстом и реализуется в физически достоверной анимации.

Новая методика позволяет научить роботов сложным манипуляциям с объектами, используя видеодиффузионные модели и физическое моделирование, обходясь без дорогостоящей 3D-съемки движений.

Робот-исследователь: как научить машину ориентироваться в пространстве?

Автономный агент исследует окружение, предсказывая семантику сцены и взаимосвязи объектов на основе RGB-данных, непрерывно обновляя глобальную семантическую карту (SG-Memo) и используя её для выбора и выполнения навигационных подзадач.

В новой работе представлена система, позволяющая роботам самостоятельно изучать окружающую среду и создавать структурированную карту памяти для более эффективной навигации.