Нейросети учатся решать уравнения на произвольных формах

Поверхность определяется посредством выборки точек и геометрических признаков, после чего вокруг неё создаётся узкая полоса декартовых сеток, хранящих начальное поле, расширенное от поверхностных значений и покрытое перекрывающимися патчами, ориентированными в локальных системах координат; эти патчи обрабатываются легковесными операторами, обусловленными геометрией, для генерации локальных обновлений, которые затем суммируются для формирования глобального обновления полосы и продвигаются посредством стандартного шага по времени PDE, позволяя итеративно получать решения PDE непосредственно в нейронной сети посредством обновлений сетки к сетке, без необходимости извлечения сетки или чередования операций расширения и ограничения.

Новый подход позволяет точно и эффективно находить решения дифференциальных уравнений в частных производных непосредственно на основе нейронных представлений формы, без использования традиционных сеток.

Панорамное видео нового поколения: сжатие с прицелом на пользователя

В рамках разработанной системы NeRV360, входное 360-градусное изображение [latex] (3,H,W) [/latex] преобразуется в целевой viewport [latex] (3,H^{\mathrm{vp}},W^{\mathrm{vp}}) [/latex] посредством кодировщика и декодировщика, использующих шаги преобразования [latex] (3,2,2,2) [/latex], что позволяет эффективно извлекать и представлять ключевые визуальные элементы.

Новая система NeRV360 позволяет существенно снизить требования к памяти и времени декодирования 360-градусных видео, фокусируясь на той части изображения, которую видит пользователь.

Объединяя Разное: Новый Подход к Слиянию Изображений

Предложенная сеть состоит из трёх ключевых модулей: модуля повышения признаков, не зависящего от модальности (MAFE), мультиплексного консенсусного кросс-модального модуля Mamba (MCCM) и двухуровневой функции контрастного обучения с самоконтролем (BSCL), что позволяет добиться комплексной обработки и анализа данных.

Исследователи представили инновационную архитектуру, позволяющую эффективно объединять многомодальные изображения с сохранением мелких деталей и повышением производительности в задачах компьютерного зрения.