Видео предвидение: как искусственный интеллект ориентируется в реальном мире

Новая система SparseVideoNav позволяет роботам уверенно перемещаться в незнакомой среде, предсказывая развитие событий на основе коротких видеофрагментов.

Новая система SparseVideoNav позволяет роботам уверенно перемещаться в незнакомой среде, предсказывая развитие событий на основе коротких видеофрагментов.

В статье представлен инновационный метод прогнозирования эволюции мнений в социальных сетях, использующий принципы диффузии, конвекции и реакции.

AMD пока не выпустила свою технологию FSR 4 для старых графических карт Radeon, несмотря на то, что кратко продемонстрировала её работу на оборудовании, отличном от новейшей серии RDNA 4. В настоящее время официальная информация от AMD ограничивает FSR 4 серией Radeon RX 9000, в то время как старые карты автоматически используют более старую версию FSR 3.1.5.
![Система MINT расширяет свои знания посредством взаимодействия с человеком: сначала нейронная сеть формирует запросы, затем большая языковая модель их уточняет, а полученные ответы, уменьшая разрыв в знаниях, позволяют агенту оптимизировать действия, максимизируя [latex]Q_{\varphi}^{\*}(s,a)[/latex] для всех описателей [latex]\varphi\in\Phi\_{u\_{K}}[/latex].](https://arxiv.org/html/2602.05048v1/sys.png)
Исследователи представили систему, способную выявлять пробелы в своих знаниях и активно запрашивать информацию у человека для решения сложных задач.

Новый подход позволяет интерпретировать сложные потоки данных в сетях IoT, выявляя аномалии и визуализируя поведение устройств.

Новая разработка позволяет создавать интерактивные модели мира, способные предсказывать события на значительно более длительных временных горизонтах, чем ранее возможные.
![Предложенная схема непрерывного обучения с сохранением внимания (ARCL-ViT) извлекает карты внимания [latex]\mathbf{U}_{t-1}[/latex] после завершения этапа обучения [latex]\mathcal{T}_{t-1}[/latex] и формирует маску [latex]\bar{\mathbf{M}}_{t-1}[/latex] для выделения ключевых областей, после чего, на этапе обучения [latex]\mathcal{T}_{t}[/latex], использует эту маску для выборочной обнуляции градиентов [latex]\nabla(\mathbf{W}_{q.t})^{\prime},\nabla(\mathbf{W}_{k.t})^{\prime},\nabla(\mathbf{W}_{v.t})^{\prime}[/latex] в соответствующих областях внимания, тем самым обновляя обучаемые веса [latex]\mathbf{W}_{q.t},\mathbf{W}_{k.t},\mathbf{W}_{v.t}[/latex].](https://arxiv.org/html/2602.05454v1/Fig2.png)
Новая методика позволяет нейросетям с архитектурой Vision Transformer эффективно осваивать новые знания, не теряя при этом навыки, полученные ранее.
![Процесс регрессии личности, основанный на методологии [4], позволяет выявить закономерности в изменениях личностных характеристик на основе самоотчетов.](https://arxiv.org/html/2602.05650v1/Fig1.png)
Новое исследование показывает, что для более точного определения личности по аудиовизуальным данным необходимо учитывать не только общие черты характера, но и более тонкие нюансы и грани личности.

Новое исследование показывает, что варифокальные дисплеи снижают нагрузку на зрение при использовании дополненной реальности и повышают точность выбора объектов, но эффект варьируется в зависимости от индивидуальных особенностей пользователя.

Исследователи разработали смешанную реальность, объединяющую виртуальные подсказки с тактильным взаимодействием с манекеном, для повышения эффективности обучения родовспоможению.