Панорамное зрение: Новый подход к оценке глубины
![Предлагаемая сеть обрабатывает целевые изображения [latex]\mathbf{I}_{t}[/latex], проецируя низкоуровневые признаки [latex]\mathbf{F}_{S,\mathbf{I}_{t}}[/latex] на цилиндрическую поверхность, где внимание определяется цилиндрическими расстояниями, и использует фронтальные изображения источника [latex]\mathbf{I}_{t^{\prime},1}[/latex] и цели [latex]\mathbf{I}_{t,1}[/latex] для предсказания относительной метрической позы между кадрами.](https://arxiv.org/html/2511.16428v2/x3.png)
Исследователи разработали метод самообучения для камер кругового обзора, позволяющий получать более согласованные и точные карты глубины окружающего пространства.
![Предлагаемая сеть обрабатывает целевые изображения [latex]\mathbf{I}_{t}[/latex], проецируя низкоуровневые признаки [latex]\mathbf{F}_{S,\mathbf{I}_{t}}[/latex] на цилиндрическую поверхность, где внимание определяется цилиндрическими расстояниями, и использует фронтальные изображения источника [latex]\mathbf{I}_{t^{\prime},1}[/latex] и цели [latex]\mathbf{I}_{t,1}[/latex] для предсказания относительной метрической позы между кадрами.](https://arxiv.org/html/2511.16428v2/x3.png)
Исследователи разработали метод самообучения для камер кругового обзора, позволяющий получать более согласованные и точные карты глубины окружающего пространства.

Новый подход позволяет использовать мощные модели компьютерного зрения для обнаружения необычных объектов и ситуаций, не требуя предварительной подготовки на размеченных данных.

Новое исследование предлагает метод анализа внутренней структуры мультимодальных моделей, позволяющий выявить ключевые связи между нейронами и предсказывать их поведение.
Новый подход позволяет создавать реалистичных цифровых персонажей, способных автономно действовать и взаимодействовать с окружающим пространством.

Новая система X-BCD использует данные с датчиков умного дома для раннего выявления изменений в повседневных привычках, что особенно важно для людей с начальными стадиями когнитивных нарушений.
Исследователи предложили систему, объединяющую визуальные данные скриншотов с текстовыми описаниями, генерируемыми нейросетью, для повышения точности идентификации элементов управления в пользовательских интерфейсах.

Исследователи разработали систему TAMEn, позволяющую роботам эффективно обучаться сложным задачам манипулирования объектами, используя как зрение, так и тактильные ощущения.
Новый подход позволяет моделям компьютерного зрения адаптироваться к взаимодействию с человеком без переобучения, открывая возможности для интерактивной сегментации и улучшения качества изображений.

Новые системы, объединяющие данные с датчиков и возможности искусственного интеллекта, требуют внимательного подхода к вопросам этики и защиты персональной информации.

Новая система позволяет создавать реалистичные тактильные и визуальные текстуры, управляемые простыми текстовыми запросами.