Постоянное обучение нейных полей: новый подход к обработке спутниковых снимков

Архитектура Δ-NeRF использует остаточный контроллер (ΔMc), внедряющий остаточные связи на уровне признаков в замороженную базовую модель (Mb), при этом коррекция цветовых характеристик (RGB), видимости солнца и цвета неба осуществляется по выделенным остаточным путям, а комбинирование базового и скорректированного выхода осуществляется посредством механизма управления, учитывающего неопределенность.

Исследователи предлагают метод эффективного обновления нейных полей без полной переподготовки, позволяющий сохранять накопленные знания и адаптироваться к новым данным.

Превращая блики в форму: новый подход к 3D-реконструкции отражающих объектов

Исследователи разработали метод, позволяющий восстанавливать геометрию блестящих поверхностей, переводя изображения в «глиняное» представление и устраняя неоднозначность, вызванную зеркальными отражениями.

Визуальный поиск ответа: новый подход к извлечению знаний из документов

Эволюция методов поиска информации в документах демонстрирует переход от сглаживания визуальной структуры при использовании OCR-RAG к добавлению визуальной осведомленности посредством плотных векторных представлений страниц в ColPali, однако VisionRAG представляет собой качественно новый подход, использующий пирамидальное индексирование с семантическим объединением на различных уровнях документа, что позволяет достичь сопоставимой точности с использованием всего 12-17 векторов на страницу и без зависимости от OCR.

Исследователи представили VisionRAG — систему, использующую пирамидальную индексацию изображений страниц для существенного повышения точности поиска и ответа на вопросы по документам, особенно в сфере финансов.