Восстановление 3D-моделей: новый подход к детализации и скорости

Автор: Денис Аветисян


Исследователи представили метод Mesh Splatting, позволяющий создавать высококачественные 3D-модели из нескольких изображений с повышенной детализацией и эффективностью.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"
Предлагаемый метод преобразует начальную тетраэдральную сетку, хранящую значения с знаком расстояния в вершинах, в псевдоволюметрическое представление посредством извлечения базовой сетки алгоритмом Marching Tetrahedra и последующего смягчения её путем смещения вершин вдоль нормалей, после чего рендеринг многослойной сетки осуществляется посредством разработанного дифференцируемого метода Mesh Splatting на основе плиточной растризации, контролируемого входными изображениями через функцию потерь рендеринга.
Предлагаемый метод преобразует начальную тетраэдральную сетку, хранящую значения с знаком расстояния в вершинах, в псевдоволюметрическое представление посредством извлечения базовой сетки алгоритмом Marching Tetrahedra и последующего смягчения её путем смещения вершин вдоль нормалей, после чего рендеринг многослойной сетки осуществляется посредством разработанного дифференцируемого метода Mesh Splatting на основе плиточной растризации, контролируемого входными изображениями через функцию потерь рендеринга.

Mesh Splatting смягчает сетчатые модели, преобразуя их в дифференцируемые слои для волюметрической визуализации и точного восстановления поверхности.

Восстановление поверхностей по многовидовым изображениям традиционно сталкивается с компромиссом между точностью и качеством получаемых сеток. В данной работе, ‘Mesh Splatting for End-to-end Multiview Surface Reconstruction’, предложен новый подход, преобразующий исходную сетку в дифференцируемые слои для волюметрической визуализации, что позволяет достичь высококачественного восстановления сложных геометрических форм. Ключевой особенностью метода является смягчение сетки и использование стратегии контроля топологии, обеспечивающих как детализацию, так и оптимизацию процесса реконструкции. Возможно ли дальнейшее улучшение эффективности и обобщающей способности предложенного метода для работы с еще более сложными и зашумленными данными?


Вызов Детализации: Ограничения Традиционной Реконструкции

Создание высокоточных трехмерных моделей по изображениям остается сложной задачей, особенно при работе со сложными сценами. Трудность заключается в том, что визуальная информация, полученная с двухмерных изображений, требует сложной интерпретации для воссоздания глубины и геометрии объектов. Несовершенство алгоритмов, ограниченное разрешение изображений и наличие шумов приводят к потере деталей и искажениям в реконструированной модели. В частности, сложные сцены, характеризующиеся большим количеством объектов, перекрытиями и отражениями, требуют значительных вычислительных ресурсов и продвинутых методов обработки данных для получения реалистичной и точной трехмерной реконструкции. Несмотря на прогресс в области компьютерного зрения, воссоздание мельчайших деталей и сложных топологических особенностей остается серьезной проблемой, требующей дальнейших исследований и разработок.

Традиционные методы трехмерной реконструкции, такие как обработка облаков точек и построение сеток, зачастую испытывают трудности при воссоздании тонких деталей и сложных топологических особенностей объектов. Проблема заключается в том, что эти методы стремятся аппроксимировать реальную геометрию дискретными представлениями, что приводит к потере информации о мелких элементах и искажению сложных форм. Например, при реконструкции скульптуры с большим количеством выемок и углублений, стандартные алгоритмы могут сглаживать эти детали или даже полностью их игнорировать. Более того, сложные топологии, включающие тонкие связи и перекрытия, представляют особую сложность для построения корректной и полной трехмерной модели, требуя значительных вычислительных ресурсов и зачастую приводя к появлению артефактов и неточностей.

Традиционные методы трехмерной реконструкции зачастую опираются на явное представление поверхности, то есть на создание и манипулирование полигональными сетками или другими дискретными структурами. Такой подход, хотя и интуитивно понятен, оказывается вычислительно затратным, особенно при работе со сложными сценами и большим количеством деталей. Высокая плотность полигонов требует значительных ресурсов памяти и процессорного времени, что ограничивает возможности обработки данных в реальном времени. Более того, дискретное представление поверхности неизбежно приводит к появлению артефактов, таких как неровности, провалы или искажения геометрии, особенно в областях с высокой кривизной или сложной топологией. Эти артефакты требуют дополнительных усилий по постобработке и сглаживанию, усложняя процесс реконструкции и снижая точность полученной модели.

Предложенный метод оптимизирует сетки напрямую с использованием ремешинга для контроля топологии, обеспечивая более точные поверхности с минимальным количеством вершин, в отличие от методов, полагающихся на промежуточные представления или требующих отдельного этапа мешинга, который накапливает ошибки и приводит к избыточно плотным сеткам или неточностям, даже при использовании точных входных данных, как показано на примере реконструкции Пуассона.
Предложенный метод оптимизирует сетки напрямую с использованием ремешинга для контроля топологии, обеспечивая более точные поверхности с минимальным количеством вершин, в отличие от методов, полагающихся на промежуточные представления или требующих отдельного этапа мешинга, который накапливает ошибки и приводит к избыточно плотным сеткам или неточностям, даже при использовании точных входных данных, как показано на примере реконструкции Пуассона.

Волюметрические Основы: Имплицитное Представление и Рендеринг

В отличие от традиционных методов, представляющих геометрию как набор дискретных поверхностей (например, треугольников в mesh-моделях), волюметрические представления определяют форму как непрерывное поле. Это означает, что пространство заполняется функцией, которая определяет плотность или цвет в каждой точке. Вместо явного моделирования границ объекта, волюметрическое представление имплицитно определяет его форму через это поле. Такой подход позволяет избежать проблем, связанных с дискретизацией и топологической сложностью, а также обеспечивает более плавное и детальное представление геометрии, особенно в случаях, когда точное определение поверхности затруднено или не требуется. Например, функция плотности может задавать вероятность присутствия материала в каждой точке пространства, формируя таким образом объемную модель объекта.

Методы, такие как Neural Radiance Fields (NeRF) и 3D Gaussian Splatting, демонстрируют значительный потенциал для высококачественной реконструкции трехмерных сцен. NeRF использует нейронные сети для представления объема сцены как непрерывной функции, позволяющей рендерить изображения с любого ракурса. 3D Gaussian Splatting, в свою очередь, использует гауссовские сплайны для эффективного представления и рендеринга сложных геометрий. Оба подхода позволяют достичь фотореалистичного качества рендеринга, превосходя традиционные методы дискретного представления геометрии, особенно при работе с данными, полученными из сложных источников, таких как изображения, полученные с разных точек обзора. Эффективность этих методов заключается в их способности улавливать сложные детали и генерировать новые виды сцены с высоким уровнем детализации и реализма.

Несмотря на перспективность методов волюметрического рендеринга, таких как NeRF и 3D Gaussian Splatting, их вычислительная сложность представляет собой значимую проблему. Обработка данных и рендеринг сцен требуют больших объемов памяти и времени, особенно при увеличении разрешения или сложности геометрии. Кроме того, эти методы могут испытывать трудности при реконструкции объектов со сложной топологией, например, объектов с большим количеством петель, тонких структур или внутренних полостей, что требует применения дополнительных техник для уточнения и улучшения качества реконструкции.

Результаты, представленные на синтетическом наборе данных NeRF (Martin-Brualla et al., 2021), демонстрируют способность метода точно реконструировать сложные объекты, такие как корабли и растения фикус, особенно выделяя тонкие структуры.
Результаты, представленные на синтетическом наборе данных NeRF (Martin-Brualla et al., 2021), демонстрируют способность метода точно реконструировать сложные объекты, такие как корабли и растения фикус, особенно выделяя тонкие структуры.

Mesh Splatting: Дифференцируемый Гибридный Подход

Метод Mesh Splatting преобразует исходные меши в дифференцируемые волюметрические слои посредством процесса «разбрызгивания» (splatting) вершин и атрибутов меша в воксельное пространство. Это преобразование позволяет вычислять градиенты относительно исходной геометрии меша, что открывает возможность оптимизации и реконструкции детализированной геометрии с использованием методов градиентного спуска. В отличие от традиционных воксельных представлений, сохраняется информация о структуре меша, а дифференцируемость волюметрического представления обеспечивает возможность обратного распространения ошибки для уточнения геометрии и текстур, что особенно важно для задач реконструкции 3D-сцен и синтеза новых видов.

Комбинирование гибкости волюметрических представлений и явной структуры мешей позволяет достичь баланса между качеством реконструкции и вычислительной эффективностью. Волюметрические представления обеспечивают плавность и детализацию, необходимые для точного воссоздания сложных форм, но часто требуют значительных вычислительных ресурсов. Использование мешей, напротив, обеспечивает компактное представление геометрии и эффективные алгоритмы рендеринга. Метод Mesh Splatting использует преимущества обоих подходов, проецируя меши в дифференцируемые волюметрические слои, что позволяет оптимизировать геометрию с помощью градиентных методов, сохраняя при этом относительно небольшие вычислительные затраты по сравнению с традиционными волюметрическими подходами.

Для дальнейшей оптимизации реконструируемой геометрии используется непрерывная ремешизация (continuous remeshing), позволяющая динамически адаптировать топологию сетки в процессе обучения и избегать артефактов, возникающих при использовании фиксированной топологии. В дополнение, применяется контроль затенения (shading supervision), который сопоставляет затенение реконструированной геометрии с затенением исходных данных, обеспечивая соответствие нормалей и улучшая визуальное качество результата. Комбинация этих техник позволяет достичь более высокой точности и детализации реконструируемых поверхностей.

Применение методов сглаживания и сплайнинга к исходным грубым мешам GaussianSurfelDai et al. (2024) в сочетании с непрерывным ремешингом значительно улучшает качество реконструкций на наборах данных Mip-NeRF360 (Barron et al., 2022) и TandT (Knapitsch et al., 2017).
Применение методов сглаживания и сплайнинга к исходным грубым мешам GaussianSurfelDai et al. (2024) в сочетании с непрерывным ремешингом значительно улучшает качество реконструкций на наборах данных Mip-NeRF360 (Barron et al., 2022) и TandT (Knapitsch et al., 2017).

Валидация и Результаты: Эффективность на Различных Наборах Данных

Исследования показали высокую эффективность метода Mesh Splatting при работе со стандартными наборами данных, такими как DTU и BlendedMVS, где были достигнуты передовые результаты. Данная методика продемонстрировала способность к реконструкции сцен с высокой точностью и детализацией, превосходя существующие подходы в задачах 3D-реконструкции. В ходе экспериментов Mesh Splatting последовательно демонстрировал превосходство в метриках качества, подтверждая свою надежность и эффективность в различных условиях и при работе с разнообразными данными. Полученные результаты открывают новые возможности для создания реалистичных и точных 3D-моделей, представляя значительный шаг вперед в области компьютерного зрения и графики.

Метод демонстрирует превосходство в реконструкции тонких деталей и сложных топологий, значительно превосходя существующие подходы как по качеству, так и по эффективности. В ходе экспериментов было установлено, что предлагаемая технология позволяет получить более детальные и точные модели, при этом требуя существенно меньшее количество вершин по сравнению с такими передовыми системами, как Neuralangelo и Gaussian Surfel. Это достигается благодаря оптимизированной архитектуре и эффективному представлению геометрии, что открывает возможности для работы с большими и сложными сценами даже на оборудовании с ограниченными ресурсами. Такое сочетание качества и производительности делает данный подход особенно привлекательным для широкого спектра приложений, от создания реалистичных виртуальных окружений до точной 3D-моделизации объектов.

Использование дифференцируемого рендеринга открывает новые возможности для оптимизации и интерактивного редактирования реконструированных трехмерных моделей. В отличие от традиционных методов, требующих значительных вычислительных затрат для каждой итерации, данная технология позволяет проводить оптимизацию в режиме реального времени, напрямую связывая параметры модели с визуальным результатом. Это означает, что изменения, вносимые пользователем, немедленно отображаются на экране, обеспечивая мгновенную обратную связь и позволяя тонко настроить геометрию и текстуры. Такой подход не только ускоряет процесс реконструкции, но и делает его более интуитивным и удобным, позволяя создавать и модифицировать сложные трехмерные сцены с беспрецедентной скоростью и точностью, что особенно важно для приложений, требующих интерактивности и оперативного внесения изменений.

Комбинирование топологического контроля и непрерывной ремешинг позволяет более надежно захватывать как глобальную топологию, так и мелкие детали, чем использование каждого из компонентов по отдельности.
Комбинирование топологического контроля и непрерывной ремешинг позволяет более надежно захватывать как глобальную топологию, так и мелкие детали, чем использование каждого из компонентов по отдельности.

Перспективы Развития: К Реализации 3D-Реконструкции в Реальном Времени

Интеграция технологии mesh splatting с методом Structure from Motion открывает перспективы для создания трехмерных реконструкций в реальном времени непосредственно из видеопотока. Метод Structure from Motion позволяет восстанавливать трехмерную структуру сцены по последовательности двухмерных изображений, в то время как mesh splatting эффективно отображает полученную геометрию, используя небольшие фрагменты полигонов. Сочетание этих подходов позволяет добиться высокой скорости и реалистичности визуализации, поскольку mesh splatting обходит вычислительные затраты, связанные с традиционным рендерингом полигональных сетей. Это особенно важно для приложений, требующих интерактивного взаимодействия с трехмерной сценой, таких как виртуальная и дополненная реальность, а также для задач, где необходима быстрая обработка больших объемов видеоданных, например, в автономных системах навигации или робототехнике.

Для повышения реалистичности реконструируемых трехмерных сцен активно исследуются передовые модели затенения и свойства материалов. Ученые стремятся выйти за рамки простых диффузных и зеркальных отражений, внедряя сложные алгоритмы, учитывающие подповерхностное рассеяние, анизотропию и другие физические явления. Это позволяет воссоздавать материалы с высокой точностью, имитируя поведение света в различных веществах — от матового бархата до глянцевого металла. Дальнейшее развитие в этой области предполагает использование BRDF (Bidirectional Reflectance Distribution Function) и BSDF (Bidirectional Scattering Distribution Function) для точного описания отражения и рассеяния света, что позволит создавать виртуальные объекты, практически неотличимые от реальных.

Дальнейшее развитие методов трехмерной реконструкции неразрывно связано с решением задачи обработки масштабных и сложных сцен. Увеличение вычислительных затрат при работе с большим количеством данных требует разработки новых алгоритмов оптимизации и параллелизации вычислений. Исследования направлены на создание эффективных структур данных и методов сжатия, позволяющих хранить и обрабатывать огромные трехмерные модели без потери качества. Особое внимание уделяется адаптивным алгоритмам, которые динамически изменяют уровень детализации в зависимости от расстояния до камеры и других факторов, что позволяет существенно снизить вычислительную нагрузку и обеспечить плавную работу даже при реконструкции очень больших и сложных объектов и пространств. Преодоление этих технических сложностей откроет возможности для широкого применения технологии в таких областях, как виртуальная реальность, робототехника и создание цифровых двойников.

В отличие от обычных сеток, мягкие сетки обеспечивают более реалистичное моделирование деформируемых объектов благодаря адаптации к изменениям формы.
В отличие от обычных сеток, мягкие сетки обеспечивают более реалистичное моделирование деформируемых объектов благодаря адаптации к изменениям формы.

Представленная работа демонстрирует элегантность подхода к реконструкции поверхностей, смягчая сетку в дифференцируемые слои и используя объемный рендеринг. Этот метод, названный Mesh Splatting, избегает жёсткости традиционных подходов, позволяя достичь высокой детализации и эффективности. Как однажды заметил Дональд Дэвис: «Простота — высшая форма утонченности». Это высказывание прекрасно отражает суть представленного исследования — путём упрощения процесса реконструкции, путём перехода к дифференцируемым слоям, авторы добились значительного улучшения качества и скорости работы алгоритма. Подход позволяет контролировать топологию сетки, что является ключевым моментом в обеспечении корректности реконструкции.

Куда же дальше?

Представленный метод, несомненно, представляет собой элегантный шаг вперед в области реконструкции поверхностей. Однако, как и любое приближение, он не лишен ограничений. В частности, зависимость от «мягкого» представления меша, хотя и обеспечивает дифференцируемость, вводит дополнительную сложность и потенциальные артефакты. Вопрос о том, насколько эффективно можно контролировать и минимизировать эти артефакты, остается открытым. Более того, асимптотическая сложность алгоритма при обработке чрезвычайно детализированных сцен требует дальнейшего анализа и оптимизации.

Очевидным направлением для будущих исследований представляется разработка методов, позволяющих динамически адаптировать степень «смягчения» меша в зависимости от локальной геометрии и текстуры. Это позволило бы сохранить высокую точность в областях с высокой детализацией и одновременно избежать ненужных вычислительных затрат в областях с низкой детализацией. Также, представляется перспективным исследование возможностей интеграции данного подхода с другими методами нейронного рендеринга, например, с техниками, основанными на неявных функциях.

В конечном итоге, истинный тест для любого алгоритма реконструкции — это его способность к обобщению. Способен ли он восстанавливать поверхности, радикально отличающиеся от тех, на которых он обучался? Или он обречен повторять ошибки, заложенные в обучающем наборе данных? Ответ на этот вопрос определит, является ли Mesh Splatting просто еще одним шагом на пути к идеальной реконструкции, или же он представляет собой принципиально новый подход к решению этой сложной задачи.


Оригинал статьи: https://arxiv.org/pdf/2601.21400.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-02-01 13:03