Постоянное обучение нейных полей: новый подход к обработке спутниковых снимков

Архитектура Δ-NeRF использует остаточный контроллер (ΔMc), внедряющий остаточные связи на уровне признаков в замороженную базовую модель (Mb), при этом коррекция цветовых характеристик (RGB), видимости солнца и цвета неба осуществляется по выделенным остаточным путям, а комбинирование базового и скорректированного выхода осуществляется посредством механизма управления, учитывающего неопределенность.

Исследователи предлагают метод эффективного обновления нейных полей без полной переподготовки, позволяющий сохранять накопленные знания и адаптироваться к новым данным.

Превращая блики в форму: новый подход к 3D-реконструкции отражающих объектов

Исследователи разработали метод, позволяющий восстанавливать геометрию блестящих поверхностей, переводя изображения в «глиняное» представление и устраняя неоднозначность, вызванную зеркальными отражениями.

Визуальный поиск ответа: новый подход к извлечению знаний из документов

Эволюция методов поиска информации в документах демонстрирует переход от сглаживания визуальной структуры при использовании OCR-RAG к добавлению визуальной осведомленности посредством плотных векторных представлений страниц в ColPali, однако VisionRAG представляет собой качественно новый подход, использующий пирамидальное индексирование с семантическим объединением на различных уровнях документа, что позволяет достичь сопоставимой точности с использованием всего 12-17 векторов на страницу и без зависимости от OCR.

Исследователи представили VisionRAG — систему, использующую пирамидальную индексацию изображений страниц для существенного повышения точности поиска и ответа на вопросы по документам, особенно в сфере финансов.

Одного фрагмента достаточно: Восстановление поверхности и классификация материалов по минимальным визуальным данным

Сеть SMARC, построенная по принципу кодировщик-бутылочное горлышко-декодировщик с использованием частных свёрток и явной проброски масок, восстанавливает скрытые участки RGB-изображения и одновременно предсказывает класс материала, объединяя признаки кодировщика в декодере через пропущенные соединения и используя многомасштабный подход к классификации поверхности на основе признаков $s_3^y$, $s_4^y$ и признаков

Новый подход позволяет точно реконструировать геометрию объектов и определять их материал, опираясь лишь на небольшую часть видимой информации.