Визуальный язык: от простого к сложному

Предложена методика динамической кросс-слойной инъекции для глубокого слияния визуальных и языковых признаков, повышающая эффективность мультимодального анализа.

Предложена методика динамической кросс-слойной инъекции для глубокого слияния визуальных и языковых признаков, повышающая эффективность мультимодального анализа.

Исследователи предложили инновационный подход к поиску людей по описанию, сочетающий в себе силу текстовых запросов и визуального анализа.
![В предложенной архитектуре визуально-языковая модель, подобная LLaVA, обрабатывает трехмерные объемы данных и генерирует текст, при этом активация токена [SEG] инициирует передачу скрытого состояния в модуль сегментации SAM2, где оно объединяется с визуальными подсказками - точками или ограничивающими рамками - для формирования окончательной маски сегментации.](https://arxiv.org/html/2601.09879v1/x2.png)
Исследователи представили MedVL-SAM2 — систему, объединяющую возможности понимания языка и точного 3D-сегментирования медицинских изображений для улучшения диагностики и взаимодействия с данными.

Новый подход, основанный на неглубоких сетях Kolmogorov-Arnold, позволяет эффективно моделировать фазовые переходы и динамику границ раздела сред без использования данных измерений.
Исследователи представили масштабный конкурс по классификации поведения клеток в видео, полученных с помощью тайм-лапс микроскопии, для оценки эффективности современных алгоритмов.

В статье представлена инновационная методика повышения эффективности визуального обучения, основанная на адаптивном объединении и упорядочении подсказок.
Исследование демонстрирует, как интеграция теплоотводов повышает эффективность сверхпроводящих нанопроволок из нитрида тантала, открывая путь к созданию высокоскоростных детектеров одиночных фотонов.

Новое исследование экспериментально подтверждает возможность стабильной левитации микрочастиц вблизи поверхностей с диэлектрической проницаемостью, близкой к нулю.

Новая система STITCH моделирует контекстуальные намерения, позволяя агентам эффективно использовать память для решения сложных задач, требующих последовательного планирования.
Новое исследование демонстрирует, как границы раздела и механическое напряжение стабилизируют мультиферроический порядок и открывают ранее неизвестные проявления альтернативного магнетизма в ультратонких плёнках BiFeO3.