Наука — Страница 115

Разделяй и властвуй: Новый подход к многоканальному зрению

06.12.2025 от Denis

Исследователи представили архитектуру DisentangleFormer, позволяющую более эффективно обрабатывать многоканальные изображения, такие как гиперспектральные данные, за счет разделения пространственной и канальной информации.

Пространственный интеллект: новый подход к машинному восприятию и рассуждениям

06.12.2025 от Denis

Исследователи представили COOPER — модель, объединяющую визуальное восприятие и логические выводы для более эффективной работы с пространственными задачами.

Ощущение контакта: новая точность в 3D-реконструкции человеческой позы

06.12.2025 от Denis

Любые контакты с кожей или волосами оказывают существенное влияние на биоимпеданс запястья, что подтверждается данными, полученными в ходе сбора нового набора данных и представленными в виде соответствующих SMPL-X моделей.

Исследователи разработали систему, использующую биоимпедансный сенсор для повышения реалистичности и точности виртуальных аватаров и анализа движений человека.

Динамические сцены оживают: новая модель для 4D-реконструкции

06.12.2025 от Denis

В рамках предложенной архитектуры 4DLangVGGT, геометрия кодируется, а затем семантически сопоставляется с 4D-полями посредством декодера, что достигается благодаря стратегии многоцелевого обучения, обеспечивающей как геометрическую точность, так и семантическую согласованность получаемых результатов.

Исследователи представили 4DLangVGGT — инновационный подход к объединению геометрической реконструкции и семантического понимания в динамических 4D-сценах.

Агенты под контролем: Гибридная среда для безопасного взаимодействия человека и ИИ

06.12.2025 от Denis

Агент искусственного интеллекта, функционирующий в изолированных средах, демонстрирует способность к адаптации и устойчивости за счет использования песочниц как механизма защиты и контроля.

Новая платформа AgentBay обеспечивает плавную интеграцию человеческого вмешательства в работу автономных агентов, повышая их надежность и безопасность.

Восстановление формы сквозь преграды: новый подход к 3D-реконструкции

06.12.2025 от Denis

Разработанный подход к реконструкции трехмерных объектов в условиях частичной видимости объединяет эмпирические априорные знания о форме объектов с физически обоснованной информацией о контактах, что позволяет достичь высококачественного и точного восстановления геометрии.

Исследователи предлагают инновационный метод 3D-реконструкции объектов, эффективно справляющийся с окклюзиями и использующий как вероятностные модели, так и физические принципы взаимодействия.

Роботы, которые понимают, что можно сделать с предметами

06.12.2025 от Denis

Новая система CRAFT-E позволяет роботам ориентироваться в мире, определяя объекты не по их названию, а по возможности их использования.

Редактирование 3D-моделей: новый уровень гибкости и детализации

06.12.2025 от Denis

$Предлагаемый конвейер SPLICE декомпозирует трехмерные формы на части, извлекая геометрические латентные коды $𝐳_i$ и гауссовские прокси $𝐠_i$ с помощью общей сверточной кодировщик, после чего эти прокси модифицируются посредством пользовательского взаимодействия или диффузионной модели $f_{adj}$ для обеспечения глобальной согласованности, а затем, с использованием кодировщика SIREN и многослойного персептрона $f_{MLP}$, объединяются в итоговые вложения частей $𝐡_i$, которые, наконец, преобразуются в конечную форму посредством кросс-внимания и декодирования занимаемости.$

Исследователи представили SPLICE — инновационную систему, позволяющую точно и эффективно редактировать 3D-формы на уровне отдельных частей.

Робот-манипулятор: новый взгляд на взаимодействие с объектами

05.12.2025 от Denis

$Набор данных Hoi! представляет собой разнообразную коллекцию реалистичных внутренних сред - кухонь, ванных комнат, офисов и жилых пространств - каждая из которых снабжена RGB-D последовательностями, эталонными данными, панорамными изображениями и различными артикулируемыми объектами, взаимодействующими с несколькими захватами и пользователями.$

Представлен мультимодальный набор данных и роботизированная платформа, позволяющие значительно улучшить навыки манипулирования сложными объектами.

Распознавание действий человека: новый подход к адаптивной мультимодальной обработке

05.12.2025 от Denis

Различные цветовые каналы RGB используются для представления человеческих действий, что демонстрирует возможность кодирования поведенческой информации посредством визуальных характеристик.

Исследование предлагает инновационную систему, объединяющую данные из различных источников, включая всенаправленные камеры, для более точного и персонализированного распознавания человеческой деятельности.