Зрительные лакуны: как нейросети «видят» пространство
Новое исследование показывает, что способность моделей, объединяющих зрение и язык, к пространственному мышлению сильно зависит от используемых компонентов обработки изображений.
Новое исследование показывает, что способность моделей, объединяющих зрение и язык, к пространственному мышлению сильно зависит от используемых компонентов обработки изображений.

В статье представлен всесторонний обзор схем интерфейса между сверхпроводящими и полупроводниковыми цифровыми устройствами, раскрывающий перспективы создания гибридных вычислительных систем.

Новое исследование сравнивает различные варианты расположения тактильных датчиков на роботизированных руках и демонстрирует, что оптимальная конфигурация может существенно повысить эффективность обучения манипуляциям.

Исследователи представили систему, позволяющую виртуальным агентам активно использовать визуальные инструменты для более эффективного выполнения задач в графических средах.

Статья посвящена анализу перспектив и этических вызовов, связанных с развитием постоянной дополненной реальности и её влиянием на взаимодействие человека и компьютера.

Исследователи представили BrainSegNet — инновационную систему, позволяющую получить высококачественную сегментацию мозга по данным магнитно-резонансной томографии.

Новый подход объединяет клинический опыт врачей и возможности больших языковых моделей для создания более точных и понятных инструментов поддержки принятия решений.

Новое исследование показывает, что эффективное использование промежуточных слоев Vision Transformers значительно улучшает производительность в задачах переноса обучения.

Новый подход позволяет точно определять действия рабочих с инструментами в промышленных условиях, используя возможности синтетических данных и искусственного интеллекта.

Обзор посвящен концепции семантического жизненного цикла, как объединяющей рамке для создания интеллектуальных агентов, способных к адаптации и обучению в реальном мире.