Что видит и понимает искусственный интеллект: контекст восприятия объектов

Новое исследование показывает, как современные модели, объединяющие зрение и язык, определяют возможности использования объектов в зависимости от окружающего контекста.

Сборка чипов масштаба пластины: оптимизация сетевой архитектуры

Различные методы создания масштабных систем на кремниевых пластинах исследуются посредством оптимизации размещения шаблонов, что позволяет повысить эффективность и снизить стоимость производства микросхем.

В статье рассматриваются стратегии размещения ретикул для гибридной сборки пластин, направленные на минимизацию задержек и повышение пропускной способности в крупномасштабных вычислительных системах.

Персонализация нейросетей для распознавания действий: преодоление индивидуальных различий

Предлагаемая схема предварительно обучает все веса модулей, а затем использует состязательное обучение для минимизации межсубъектной изменчивости, причём классификация действий осуществляется на основе распределения данных [latex]AA[/latex], в то время как состязательная задача опирается на распределение [latex]A^{\prime}[/latex], что демонстрирует итеративный процесс адаптации к новым пользователям.

Новый подход к машинному обучению позволяет создавать более точные системы распознавания человеческой активности, учитывающие уникальные особенности каждого пользователя.

Пространственная геометрия памяти: как гиппокамп ориентируется в мире

Новое исследование показывает, что гиппокамп человека использует уникальную геометрическую структуру для кодирования пространственной информации о себе и других движущихся объектах, включая направление взгляда.

Зрение сквозь камеры: Новый подход к 3D-детекции объектов

Система CoIn3D обеспечивает эффективный перенос моделей из исходной конфигурации A на ранее не встречавшиеся целевые конфигурации B, C и т.д., учитывая вариации внутренних, внешних параметров и компоновки сенсоров, и применима к трем основным парадигмам MC3D, таким как BEVDepth[22], BEVFormer[23] и PETR[25].

Исследователи предлагают инновационный метод повышения точности и надежности 3D-детекции объектов на мульти-камерных системах, преодолевая ограничения, связанные с изменением конфигурации камер.