Виртуальные роботы: новый взгляд на взаимодействие человека и машины

Расширенная реальность открывает возможности для создания более безопасных, интеллектуальных и эмпатичных роботов, не ограниченных физическими рамками.

Расширенная реальность открывает возможности для создания более безопасных, интеллектуальных и эмпатичных роботов, не ограниченных физическими рамками.
![Реконструкция семантической 3D-геометрии динамических сцен с множеством взаимодействий человека и объектов, основанная на наборе данных HOI-M3[zhang2024hoi], позволяет получить детальную, согласованную с разных точек зрения и качественно превосходящую существующие аналоги реконструкцию общей сцены.](https://arxiv.org/html/2512.00547v1/x1.png)
Новый подход позволяет воссоздавать детальные трехмерные модели динамичных сцен из обычного видео, учитывая сложные взаимодействия между людьми и окружающими предметами.
![В рамках предложенной схемы Chain-of-Ground (CoG) осуществляется последовательное, итеративное определение местоположения элементов интерфейса посредством многошагового анализа с использованием мультимодальных больших языковых моделей, где начальная координата, предсказанная первой моделью, уточняется в ходе двух последующих этапов, учитывающих обновлённый визуальный контекст и обеспечивающих точное, интерпретируемое и не требующее переобучения определение координат $ [x_3, y_3] $.](https://arxiv.org/html/2512.01979v1/x3.png)
Исследователи разработали метод, позволяющий нейросетям более точно интерпретировать элементы управления на экранах, используя последовательный анализ и обратную связь.

В статье предлагается новый подход к пониманию машинного сознания, рассматривающий его как эмерджентное свойство самоорганизующихся вычислительных систем.

Исследователи разработали систему обучения с подкреплением, позволяющую большим языковым моделям лучше понимать и учитывать человеческие эмоции.

В статье представлен всесторонний обзор перспективного направления в современной хирургии — создания цифровых двойников, способных повысить точность и эффективность операций.

Исследователи предлагают унифицированную архитектуру, вдохновленную биологическими принципами работы памяти, для эффективного решения задач непрерывного обучения и обобщения знаний.

Новая методика позволяет создавать изображения, адаптированные под конкретные нейронные цели, открывая возможности для исследования и управления мозговой активностью.

Исследователи разработали систему, позволяющую гуманоидным роботам выполнять сложные задачи, такие как открывание дверей, исключительно на основе визуального восприятия.

В статье представлена интерактивная платформа для исследования и визуализации пространств любой размерности, открывающая новые возможности для анализа сложных данных.