Подводная связь: новые горизонты пространственного мультиплексирования

Акустические RIS позволяют расширить пропускную способность и степени свободы подводных каналов связи, открывая новые возможности для передачи данных в сложных водных средах.

Исследование предлагает инновационный подход к увеличению пропускной способности и дальности подводной акустической связи за счет интеллектуального управления отражающими поверхностями.

Визуальное мышление: новый подход к пониманию изображений

Система SkiLa динамически переключается между текстовым анализом для генерации текстовых рассуждений и визуальным эскизированием для создания скрытых визуальных токенов, при этом механизм реконструкции скрытой визуальной семантики, использующий модуль эскизов (кодировщик и проектор) исключительно на этапе обучения, обеспечивает семантическую обоснованность этих визуальных токенов.

Исследователи предлагают инновационный метод, позволяющий мультимодальным моделям генерировать и использовать скрытые визуальные ‘эскизы’ для улучшения логических рассуждений и понимания изображений.

Дизайн по требованию: новый подход к генерации оптимальных структур

В рамках предложенной схемы «Янус» микроструктуры и их свойства кодируются в общее латентное пространство в процессе обучения, что позволяет, получив целевое свойство на этапе генерации, обратным образом сопоставить его с кодом в этом пространстве и, используя обученный декодер, детерминированно сгенерировать соответствующую микроструктуру.

В статье представлена Janus — инновационная система, объединяющая генеративные и предсказательные модели для быстрого и эффективного создания материалов с заданными свойствами.

Искусственный интеллект учится видеть как человек: новый подход к оценке качества изображений

Анализ показывает, что модели Q-Instruct и DepictQA склонны к шаблонным ответам, игнорируя даже очевидные перцептивные ошибки, в то время как Q-Insight демонстрирует процедурный, основанный на шаблонах подход к рассуждениям, отличный от человеческого восприятия, тогда как разработанная модель, в отличие от них, учитывает как детализированные перцептивные признаки, так и общую концептуальную атмосферу, что позволяет генерировать рассуждения и описания, более соответствующие человеческому пониманию и выражению.

Исследователи разработали систему, способную не только оценивать качество изображений, но и объяснять свои решения, приближаясь к человеческому восприятию и логике.

Крылья для чтения: Мобильное приложение для развития грамотности у детей с нейроотличиями

В статье представлена разработка и оценка ‘Wing’ — платформы, использующей адаптивное обучение и геймификацию для создания персонализированного опыта обучения чтению и письму.

От взгляда к действию: как человеческий опыт обучает роботов

Архитектура VLA, построенная на базе PhysBrain, кодирует мультимодальный контекст из последовательности эгоцентрических наблюдений и языковых инструкций для генерации действий, при этом PhysGR00T обуславливает эксперта по диффузии на основе потокового соответствия скрытыми состояниями последнего слоя PhysBrain, а PhysPIm тесно связывает PhysBrain и эксперта по действиям, внедряя несколько слоев VLM посредством кросс-внимания на уровне слоев.

Новое исследование показывает, что обучение моделей компьютерного зрения и языка на видеозаписях человеческой деятельности позволяет значительно улучшить навыки роботов в манипулировании объектами.