Ожившие взаимодействия: генерация реалистичных видео с участием человека и объектов

В ходе пользовательского исследования модель VHOI продемонстрировала превосходство над моделями Tora\* (дообученной) и Go-With-the-Flow как по качеству взаимодействия с объектами, так и по точности следования траектории.

Новая разработка позволяет создавать правдоподобные видеоролики, в которых человек взаимодействует с различными объектами, используя лишь небольшое количество исходных данных о движении.

Визуальный интеллект в реанимации: новый взгляд на мониторинг пациентов

Система, объединяющая возможности человека и искусственного интеллекта, предназначена для повышения эффективности мониторинга в отделениях интенсивной терапии: она автоматически собирает физиологические данные с прикроватных мониторов посредством неинвазивного распознавания экрана и расширяет возможности взаимодействия врачей, обеспечивая семантический поиск с использованием интерфейса большой языковой модели.

Система, объединяющая компьютерное зрение и возможности больших языковых моделей, призвана облегчить нагрузку на врачей и повысить качество принятия решений в отделениях интенсивной терапии.

Осязание и зрение: новый подход к обучению роботов-манипуляторов

Исследование демонстрирует возможности манипуляций с объектами в пяти различных сценариях - от простого захвата и перемещения бутылки до сложных задач, требующих визуальной и тактильной дискриминации, таких как сортировка болтов, подвешивание ножниц и вставка крышки, при этом данные с камеры и тактильных сенсоров $TacThru$ и $GelSight$ позволяют получить информацию о различных аспектах взаимодействия робота с окружающей средой.

Исследователи разработали систему, объединяющую тактильные и визуальные данные, что позволяет роботам выполнять сложные задачи манипулирования с повышенной точностью и надежностью.

Взгляд за пределы последовательностей: новый эталон для анализа взаимодействия рук и объектов

Архитектура

Исследование представляет новый критерий оценки для классификации элементарных состояний взаимодействия человека с предметами, демонстрируя неожиданную эффективность статических рекуррентных нейронных сетей.

Рекомендации нового поколения: как обойти проблему нехватки данных

Оценка производительности модели VI-MMRec и её вариантов на шести мультимодальных рекомендательных системах по всем шести наборам данных демонстрирует превосходство в метрике Recall@10, что подтверждает её эффективность в задачах рекомендаций.

В новой работе исследователи предлагают метод создания виртуальных связей между пользователями и товарами, значительно повышающий точность рекомендаций даже при ограниченном объеме информации.

Робот-визионер: ИИ предсказывает сложные манипуляции

В отличие от существующих моделей, демонстрирующих логические несостыковки и физическую неправдоподобность при генерации продолжительных видеороликов манипуляций роботом, разработанная иерархическая архитектура MIND-V успешно выполняет сложные инструкции на длительном горизонте, обеспечивая высокую визуальную достоверность и физическую точность, что подтверждает эффективность разделения высокоуровневого планирования и синтеза изображения на уровне пикселей для поддержания когерентности и пространственно-временной точности.

Новая разработка позволяет искусственному интеллекту генерировать реалистичные видеоролики, демонстрирующие долгосрочное планирование и выполнение сложных задач манипулирования объектами.