Виртуальный разум: Как нейросети осваивают трехмерный мир в реальном времени

Новая разработка позволяет крупным языковым моделям понимать и взаимодействовать с трехмерными сценами, получая информацию из потокового видео.

Новая разработка позволяет крупным языковым моделям понимать и взаимодействовать с трехмерными сценами, получая информацию из потокового видео.

Новый подход позволяет автоматически преобразовывать базовые геометрические модели в информационные и энергетические модели зданий, открывая возможности для интеллектуального проектирования.

Новое исследование показывает, насколько сильно неточные визуальные подсказки могут ухудшить качество сегментации медицинских изображений в 3D.

В статье представлена PI2I — инновационная система, оптимизирующая процесс поиска товаров для каждого пользователя на основе коллаборативной фильтрации и современных моделей взаимодействия.
Исследователи представили метод получения изображений тканей, сопоставимых с традиционным гематоксилин-эозиновым окрашиванием, используя инфракрасную микроскопию и алгоритмы машинного обучения.

Новое исследование показывает, что вдохновленные когнитивными процессами токены позволяют мультимодальным моделям преодолеть эгоцентрическую предвзятость и лучше понимать пространственные отношения.
Исследователи добились пятикратного увеличения эффективности спин-орбитального момента и беcпольной перемагничивания, открывая путь к энергоэффективным устройствам искусственного интеллекта.

Новое исследование показывает, как ценности и предпочтения влияют на поведение веб-агентов, управляемых большими языковыми моделями, и подчеркивает важность учета контекста.

В статье рассматриваются методологические трудности, возникающие при лабораторной оценке генеративных моделей искусственного интеллекта, и предлагаются рекомендации по повышению надежности таких исследований.

Новая модель объединяет данные отслеживания взгляда с видеоанализом, чтобы предсказать, насколько эстетически приятен интерьер для человека.