Наука — Страница 33

Умный взгляд и чуткий слух: новая модель для комплексного анализа видео

07.02.2026 от Denis

Предварительно обученные мультимодальные модели, такие как Qwen3-Omni, зачастую демонстрируют недостаточно эффективное аудио-визуальное рассуждение из-за присущей им модальной предвзятости, которую можно скорректировать путем усиления способности к аудио-визуальному рассуждению за счет использования намерения запроса и внимания к модальности.

Исследователи представили инновационную систему, способную лучше понимать видеоконтент благодаря одновременной обработке видео- и аудиоинформации и учету намерений пользователя.

Дизайн и Искусственный Интеллект: Понимание Замысла

07.02.2026 от Denis

Новая система позволяет генеративным нейросетям лучше понимать намерения дизайнера, делая процесс создания визуальных решений более интуитивным и управляемым.

Путь мысли: как мозг формирует понятия

07.02.2026 от Denis

$Траектории семантического поиска, формируемые кумулятивными списками слов, анализируются с использованием динамических метрик, таких как скорость, ускорение и энтропия [latex] x^{\prime} [/latex], [latex] x^{\prime\prime} [/latex], для последующей оценки дисперсии этих траекторий вокруг общего центроида, что позволяет выявить закономерности в организации семантического пространства.$

Новое исследование показывает, как человеческий мозг «навигирует» в пространстве значений при создании понятий и выражений.

Робот-визионер: Восстановление сцен и захват объектов без единого примера

07.02.2026 от Denis

Новая нейрографическая модель позволяет роботам реконструировать трехмерные сцены и планировать захват объектов, используя всего одно изображение RGBD, без предварительного обучения на 3D-данных.

Воссоздавая реальность: Новый вызов для синтеза изображений

07.02.2026 от Denis

Исследование посвящено задаче синтеза новых видов объектов, запечатленных на изображениях, полученных с рук, где столбцы демонстрируют исходные снимки, изображения, полученные с базового вида, маскированные эталонные изображения и соответствующие маскированные изображения, сгенерированные в процессе рендеринга.

Исследователи представляют NVS-HO — масштабный набор данных для оценки алгоритмов синтеза новых видов объектов, которые держат в руках, и выявляют слабые места современных методов.

Искусственный интеллект и здоровье: как мы думаем, когда спрашиваем?

07.02.2026 от Denis

Исследование выявило, что взаимодействие с ИИ-агентами для получения информации о здоровье налагает на пользователя ряд метакогнитивных требований, проявляющихся в формулировке запросов, оценке ответов, итерации запросов, понимании логики работы системы и адаптации к её особенностям, что указывает на необходимость осознанного подхода к использованию подобных технологий.

Новое исследование показывает, какие когнитивные усилия требуются пользователям при получении медицинской информации от чат-ботов с искусственным интеллектом.

Пространственное мышление без привязки к себе: новый подход к обучению моделей «зрения и языка»

07.02.2026 от Denis

$Для преодоления разрыва между системами отсчёта, разработанная структура явно отделяет пространственное рассуждение от эгоцентричных визуальных априорных знаний, функционируя в три этапа: преобразование двухмерных визуальных наблюдений в унифицированное трёхмерное метрическое пространство [latex]\mathcal{W}[/latex], построение согласованной с запросом аллоцентрической системы отсчёта [latex]\mathcal{F}\_{allo}[/latex] посредством явного преобразования координат и, наконец, вывод окончательного ответа посредством логического вывода, основанного на геометрии.$

Исследователи предлагают метод, позволяющий моделям лучше понимать пространственные отношения в окружающем мире, отделив объективное описание сцены от субъективной точки зрения.

Физика для машин: могут ли языковые модели понимать мир вокруг?

07.02.2026 от Denis

Несмотря на успешное освоение целевых задач, модели, обученные с усечёнными архитектурами (уменьшенными рангами 1 и 8 вместо 16), без дообучения визуального энкодера или с использованием рассуждений, демонстрируют неспособность к обобщению на смежные задачи, что соответствует результатам, полученным на стандартной модели в ходе экспериментов.

Новое исследование рассматривает, способно ли обучение языковых моделей взаимодействию с окружением улучшить их понимание базовых физических принципов.

Метаматериалы новой топологии: Улучшение качества МРТ-изображений

07.02.2026 от Denis

Исследователи предлагают инновационный подход к проектированию МРТ-катушек, используя топологические метаматериалы для усиления сигнала и повышения четкости изображений.

Аудиопонимание нового уровня: Bagpiper расшифровывает звуки и смыслы

07.02.2026 от Denis

Представленная модель Bagpiper открывает новые возможности в обработке звука, объединяя физические сигналы с когнитивными понятиями для более глубокого понимания и генерации аудио.