Наука — Страница 79

Виртуальный помощник в родах: новая система обучения для будущих врачей

08.02.2026 от Denis

Разработанная система визуализации на основе смешанной реальности обеспечивает иммерсивное обучение родовспоможению, используя стратегию последовательной локализации области родовспоможения от грубой к точной, что позволяет точно оценивать позы матери и новорожденного для обеспечения эффективного обучения совместным манипуляциям.

Исследователи разработали смешанную реальность, объединяющую виртуальные подсказки с тактильным взаимодействием с манекеном, для повышения эффективности обучения родовспоможению.

Угасает ли инновационный прорыв?

08.02.2026 от Denis

Новый обзор научных исследований показывает, что темпы действительно революционных инноваций, похоже, замедляются.

Перчатка, видящая сквозь облик: адаптация 3D-трекинга рук к новым сенсорным устройствам

08.02.2026 от Denis

Исследователи предлагают новый подход к отслеживанию движений рук, позволяющий системе корректно работать с перчатками различных дизайнов и материалов.

Геометрический интеллект: как нейросети решают головоломки Танграма

07.02.2026 от Denis

Исследование демонстрирует способность к пространственному мышлению посредством задач, требующих сборки фигур из одной или двух частей танграма.

Новое исследование показывает, что современные модели, объединяющие зрение и язык, способны значительно улучшить свои навыки в решении задач, требующих понимания геометрии и пространственного мышления.

CAViT: Новый взгляд на обработку изображений с помощью трансформеров

07.02.2026 от Denis

Блок трансформатора CAVit, представленный в работе, использует двойной механизм внимания для моделирования как пространственных, так и канальных взаимодействий, последовательно применяя самовнимание к пространственным токенам и, после перестановки размерностей, к каналам, что позволяет улавливать сложные зависимости в данных.

В статье представлена архитектура CAViT, усовершенствование Vision Transformer, позволяющее динамически смешивать признаки для повышения эффективности и точности.

Умный взгляд и чуткий слух: новая модель для комплексного анализа видео

07.02.2026 от Denis

Предварительно обученные мультимодальные модели, такие как Qwen3-Omni, зачастую демонстрируют недостаточно эффективное аудио-визуальное рассуждение из-за присущей им модальной предвзятости, которую можно скорректировать путем усиления способности к аудио-визуальному рассуждению за счет использования намерения запроса и внимания к модальности.

Исследователи представили инновационную систему, способную лучше понимать видеоконтент благодаря одновременной обработке видео- и аудиоинформации и учету намерений пользователя.

Дизайн и Искусственный Интеллект: Понимание Замысла

07.02.2026 от Denis

Новая система позволяет генеративным нейросетям лучше понимать намерения дизайнера, делая процесс создания визуальных решений более интуитивным и управляемым.

Путь мысли: как мозг формирует понятия

07.02.2026 от Denis

$Траектории семантического поиска, формируемые кумулятивными списками слов, анализируются с использованием динамических метрик, таких как скорость, ускорение и энтропия [latex] x^{\prime} [/latex], [latex] x^{\prime\prime} [/latex], для последующей оценки дисперсии этих траекторий вокруг общего центроида, что позволяет выявить закономерности в организации семантического пространства.$

Новое исследование показывает, как человеческий мозг «навигирует» в пространстве значений при создании понятий и выражений.

Робот-визионер: Восстановление сцен и захват объектов без единого примера

07.02.2026 от Denis

Новая нейрографическая модель позволяет роботам реконструировать трехмерные сцены и планировать захват объектов, используя всего одно изображение RGBD, без предварительного обучения на 3D-данных.

Воссоздавая реальность: Новый вызов для синтеза изображений

07.02.2026 от Denis

Исследование посвящено задаче синтеза новых видов объектов, запечатленных на изображениях, полученных с рук, где столбцы демонстрируют исходные снимки, изображения, полученные с базового вида, маскированные эталонные изображения и соответствующие маскированные изображения, сгенерированные в процессе рендеринга.

Исследователи представляют NVS-HO — масштабный набор данных для оценки алгоритмов синтеза новых видов объектов, которые держат в руках, и выявляют слабые места современных методов.