Наука — Страница 20

Разумный взгляд: StreamingClaw для анализа видео в реальном времени

26.03.2026 от Denis

Архитектура StreamingClaw представляет собой замкнутый цикл восприятия, принятия решений и действий, в котором многоканальные входные данные и запросы пользователя обрабатываются основными и подчиненными агентами, а результаты выполнения инструментов и навыков, направляемые их инструкциями, возвращаются для дальнейшей итерации процесса.

Новая платформа StreamingClaw объединяет мультимодальную память и проактивное взаимодействие для создания интеллектуальных систем, способных понимать потоковое видео и действовать в реальном времени.

Иммерсивный прототипинг: новый подход к разработке XR

26.03.2026 от Denis

Система Vibe Coding XR ускоряет прототипирование в сферах искусственного интеллекта и расширенной реальности, позволяя пользователям тестировать результаты “вайб-кодирования” в симулированной среде на настольных компьютерах и мгновенно развертывать ту же демонстрацию на Android-гарнитуре XR с поддержкой отслеживания движений тела и рук.

Исследователи представили методологию Vibe Coding XR, позволяющую быстро создавать прототипы расширенной реальности с помощью естественного языка и модульных блоков.

Ожившие картинки: как нейросети учатся понимать взаимодействие человека и объектов

26.03.2026 от Denis

Визуальные и текстовые предпосылки, извлечённые из эталонных изображений и запроса с помощью VLM, дистиллируются двумя адаптерами на основе Q-Former в компактные токены, обеспечивая согласованное семантическое условие для диффузионной модели и направляя синтез реалистичных, семантически связных взаимодействий между человеком и объектом на каждом этапе шумоподавления.

Новая разработка позволяет создавать реалистичные видеоролики, где человек взаимодействует с предметами, опираясь на визуальные подсказки и возможности генеративных моделей.

Интеллектуальная связь будущего: сети агентов, говорящих на одном языке

26.03.2026 от Denis

Предлагаемая архитектура для сетей коммуникации агентов, основанных на семантике, включает в себя три уровня, четыре сущности и четыре стадии, обеспечивая комплексный подход к обмену информацией между интеллектуальными системами.

В статье представлен всесторонний обзор перспективных сетей связи, основанных на семантическом взаимодействии интеллектуальных агентов, и обозначены ключевые технологии и вызовы на пути к их реализации.

От пикселей к разумным агентам: эволюция сред обучения с подкреплением

26.03.2026 от Denis

Эволюция сред обучения с подкреплением демонстрирует последовательный переход от классического непрерывного управления и многоагентной координации к эмбодированному искусственному интеллекту, основанному на данных, и, наконец, к семантическому рассуждению посредством автономных агентов на основе больших языковых моделей.

В статье представлен всесторонний анализ развития сред для обучения с подкреплением, отражающий переход от простых пиксельных миров к сложным, семантически насыщенным окружениям.

Микромир в виртуальной реальности: новый взгляд на исследование образцов

26.03.2026 от Denis

Представленное решение демонстрирует трехмерный инструмент для исследования образцов, превосходящий по функциональности существующие двухмерные аналоги, такие как MicroManager SlideExplorer и Zeiss ZenBlue, и позволяющий проводить анализ в сценариях, имитирующих структуру аксонов и трубок.

Исследование показывает, что виртуальная реальность значительно превосходит традиционные 2D и 3D интерфейсы при навигации и изучении сложных микроскопических образцов.

Вычисления на новых принципах: от физических сред до языка программирования

26.03.2026 от Denis

В статье представлен методологический подход к созданию вычислительных моделей и специализированных языков программирования, использующих уникальные возможности новых физических вычислительных устройств.

Живая геометрия: Реалистичная анимация 3D-моделей без ручной настройки

26.03.2026 от Denis

$На основе самообучения с учетом физических ограничений, изначально хаотичные поля нейронного скиннинга постепенно упорядочиваются, демонстрируя физическую согласованность, геометрическую ортогональность и пространственную гладкость, при этом веса скиннинга масштабируются до диапазона [-1, 1] относительно максимального абсолютного значения [latex]\bm{W}\_{i}[/latex] и центрируются вокруг нуля.$

Новая технология PhysSkin позволяет создавать правдоподобную физически корректную анимацию 3D-объектов, обучаясь на самих моделях и избавляя от необходимости в трудоемкой разметке данных.

Мозг в действии: Новый мультимодальный датасет для когнитивных исследований

26.03.2026 от Denis

Структура набора данных организована таким образом, чтобы обеспечить возможность детального анализа и манипулирования информацией, раскрывая внутреннюю архитектуру и взаимосвязи между элементами.

Представлен открытый набор данных, объединяющий данные ЭЭГ, фНМРТ и поведенческие показатели для изучения взаимосвязи между когнитивными процессами и двигательной активностью.

Адаптация к Переменам: Как Машинное Обучение Учитывает Меняющиеся Приоритеты

25.03.2026 от Denis

Двухэтапная когнитивно-вдохновленная система принятия решений преобразует историю состояний в скрытые предпочтения посредством оценки ценности, которые, в свою очередь, направляют выбор действия, формируя динамический конвейер решений, аналогичный когнитивной связи между оценкой и действием у человека.

Новая методика позволяет агентам машинного обучения динамически корректировать свои предпочтения в зависимости от условий окружающей среды, повышая эффективность в сложных задачах.