Иллюзия реальности: где видео-дисплеи уступают человеческому глазу

Автор: Денис Аветисян


Новое исследование выявило различия в восприятии между видео-дисплеями, используемыми в VR-гарнитурах, и естественным зрением человека.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"
Медианные значения, полученные из набора данных по визуальному восприятию, демонстрируют сравнительный анализ, выявляющий центральные тенденции и позволяющий оценить устойчивость и репрезентативность полученных результатов.
Медианные значения, полученные из набора данных по визуальному восприятию, демонстрируют сравнительный анализ, выявляющий центральные тенденции и позволяющий оценить устойчивость и репрезентативность полученных результатов.

Оценка визуальной производительности видео-прозрачных VR-гарнитур показала отставание по ключевым показателям, таким как острота зрения, контрастная чувствительность и цветовосприятие.

Несмотря на стремительное развитие технологий дополненной реальности, полное соответствие визуального восприятия от видео-прозрачных дисплеев (VST) естественному зрению человека остаётся сложной задачей. В работе, озаглавленной ‘The perceptual gap between video see-through displays and natural human vision’, проведена количественная оценка различий в визуальном восприятии между человеческим глазом и популярными VST-гарнитурами (Apple Vision Pro, Meta Quest 3, Quest Pro) с использованием психофизических методов. Полученные результаты демонстрируют, что даже самые передовые системы не способны воспроизвести динамический диапазон и адаптивность человеческого зрения, особенно в условиях низкой освещённости. Каковы конкретные ограничения существующих технологий и какие шаги необходимы для создания действительно неотличимого опыта дополненной реальности?


Визуальные иллюзии и границы погружения: О чем молчит картинка?

Виртуальная реальность, несмотря на свой потенциал для создания захватывающих впечатлений, часто сталкивается с ограничениями, связанными с качеством визуализации и ощущением отстраненности от физического мира. Недостаточная четкость изображения, низкое разрешение и ограниченное поле зрения могут нарушить эффект присутствия, вызывая дискомфорт и даже укачивание. Это связано с тем, что человеческий мозг, привыкший к высокой детализации и реалистичности окружающего пространства, остро реагирует на несоответствия между визуальным восприятием и ожидаемой реальностью. В результате, даже самые технологически продвинутые VR-системы могут испытывать трудности с полным погружением пользователя, оставляя ощущение искусственности и прерывистости взаимодействия.

Современные системы виртуальной реальности, несмотря на растущую популярность, часто ограничены в своих возможностях из-за несовершенства технологий отслеживания и отображения. Ограниченное разрешение дисплеев и недостаточная точность трекинга движений головы и рук приводят к эффекту «скрин-дор» и задержкам, что нарушает иллюзию присутствия и вызывает дискомфорт у пользователя. Неспособность системы адекватно реагировать на движения тела и обеспечивать четкое, реалистичное изображение может спровоцировать укачивание, головные боли и общее ощущение неестественности происходящего, существенно снижая качество погружения в виртуальную среду. Разработка более совершенных систем отслеживания и дисплеев с высоким разрешением и частотой обновления является ключевой задачей для дальнейшего развития и широкого распространения технологий виртуальной реальности.

Смешанная реальность (MR) призвана преодолеть разрыв между виртуальным и реальным мирами, однако существующие реализации часто сталкиваются с трудностями при точном объединении этих двух сред. Основная проблема заключается в синхронизации виртуальных объектов с динамически меняющимся реальным окружением, что требует высокоточного отслеживания положения и ориентации пользователя, а также понимания геометрии окружающего пространства. Несоответствие между виртуальными и реальными элементами может приводить к визуальным артефактам, нарушению чувства присутствия и даже дискомфорту. Разработка алгоритмов, способных реалистично накладывать виртуальные объекты на реальный мир с учетом освещения, теней и окклюзии, остается сложной задачей, требующей значительных вычислительных ресурсов и инновационных подходов к визуализации.

Оптические системы смешанной реальности (MR) с прямым просмотром, известные как OST, предлагают пользователю возможность одновременно видеть реальный мир и наложенные на него виртуальные объекты. Однако, несмотря на кажущуюся естественность, эти системы часто сталкиваются с серьезными проблемами в отношении качества изображения и реалистичности. Виртуальные объекты, проецируемые на поле зрения, могут казаться полупрозрачными или размытыми, а их яркость и цветопередача нередко уступают реальным объектам, что нарушает иллюзию присутствия. Кроме того, точность наложения виртуальных объектов на реальный мир остается сложной задачей: даже небольшие погрешности в регистрации могут привести к заметному диссонансу и дискомфорту для пользователя. Для преодоления этих ограничений ведутся разработки в области более совершенных дисплеев, алгоритмов регистрации и методов рендеринга, направленные на повышение реалистичности и удобства использования OST-систем смешанной реальности.

Анализ результатов визуального бенчмарка на устройствах Quest 3, Quest Pro и Vision Pro показал устойчивую зависимость производительности (ось X) от условий освещенности (синий - низкая освещенность, зеленый - нормальная освещенность), что подтверждается выраженными трендами на графиках.
Анализ результатов визуального бенчмарка на устройствах Quest 3, Quest Pro и Vision Pro показал устойчивую зависимость производительности (ось X) от условий освещенности (синий — низкая освещенность, зеленый — нормальная освещенность), что подтверждается выраженными трендами на графиках.

Видео-прозрачность: Новый взгляд на визуальную верность

Технологии видео-прозрачности (VST) решают проблемы, свойственные традиционным системам виртуальной и смешанной реальности, путем использования наружных камер для реконструкции окружающей среды пользователя. В отличие от систем, полагающихся на трекинг и построение виртуального окружения, VST системы передают изображение реального мира, полученное с камер, непосредственно на дисплеи шлема. Это позволяет пользователю видеть реальное окружение в реальном времени, что снижает утомляемость и повышает уровень присутствия. Камеры фиксируют геометрию и текстуры окружения, создавая визуальную основу для наложения виртуальных объектов, что обеспечивает более естественное взаимодействие между виртуальным и реальным мирами.

Технология видеопрозрачности (Video See-Through, VST) обеспечивает более реалистичное и комфортное визуальное восприятие за счет использования внешних камер для отображения реального окружения пользователя. В отличие от традиционных VR/MR систем, где изображение генерируется целиком, VST передает видеопоток с камер непосредственно в дисплеи шлема. Это снижает нагрузку на глаза, уменьшает эффект «экранных дверей» и обеспечивает более естественное ощущение присутствия в смешанной реальности, поскольку пользователь постоянно видит свое реальное окружение, дополненное виртуальными объектами. Шлемы, такие как Meta Quest 3, Meta Quest Pro и Apple Vision Pro, используют данный подход для улучшения визуального опыта и повышения комфорта при длительном использовании.

Технология видео-прозрачности (Video See-Through) обеспечивает точную окклюзию и смешивание виртуальных объектов с реальным миром, что существенно повышает ощущение присутствия пользователя. Принцип заключается в использовании внешних камер для реконструкции окружающей среды и наложения на неё виртуальных элементов. Точная окклюзия гарантирует, что виртуальные объекты корректно перекрываются реальными, а смешивание (blending) позволяет добиться плавного перехода между виртуальным и реальным контентом, создавая иллюзию их совместного существования в едином пространстве. Это значительно уменьшает дискомфорт и повышает реалистичность восприятия, поскольку виртуальные объекты интегрируются в визуальную картину мира пользователя, а не просто накладываются поверх неё.

Несколько современных шлемов виртуальной и смешанной реальности, включая Meta Quest 3, Meta Quest Pro и Apple Vision Pro, используют технологию видео-прозрачности (Video See-Through, VST) для улучшения визуального опыта. В отличие от традиционных систем, использующих оптический проход, VST использует внешние камеры для захвата и отображения реального окружения пользователя. Это позволяет добиться более реалистичного и комфортного восприятия, обеспечивая точное наложение виртуальных объектов на изображение реального мира и корректное отображение окклюзии, что значительно повышает уровень погружения.

Количественная оценка восприятия: Стандартизированные методы тестирования

Для точной оценки визуальной производительности VR-шлемов (VST HMD) необходимо применение стандартизированных методик тестирования. Отсутствие унифицированного подхода к оценке может привести к субъективным и нерелевантным результатам. Стандартизация включает в себя использование признанных и валидированных тестов для измерения ключевых параметров зрения, таких как острота зрения, контрастная чувствительность и цветовосприятие. Применение этих методик позволяет получить объективные данные, сравнимые между различными устройствами и с естественным зрением человека, что необходимо для разработки и оптимизации VR-технологий.

Оценка остроты зрения, как базовый показатель четкости восприятия, традиционно осуществляется с помощью таблиц Сивцева-Головкина и таблиц с буквами Э, представляющих собой стандартизированные инструменты. Эти таблицы содержат ряды символов уменьшающегося размера, позволяющие определить минимальное расстояние, на котором испытуемый может правильно различить символы. Результаты выражаются в виде десятичной дроби, обозначающей остроту зрения, где 1.0 соответствует нормальному зрению. Использование данных таблиц позволяет получить количественную оценку остроты зрения и служит отправной точкой для оценки влияния визуальных систем и дисплеев на качество восприятия изображения.

Оценка контрастной чувствительности, критически важная для различения деталей при изменяющемся освещении, проводится с использованием таблицы Пелли-Робсона. Данный метод позволяет количественно оценить способность зрительной системы различать объекты различной яркости на фоне серого цвета. Результаты выражаются в единицах LogCS (log Contrast Sensitivity), где более высокие значения указывают на лучшую способность различать объекты с низкой контрастностью. Таблица Пелли-Робсона состоит из рядов букв разного размера и контрастности, и пациент определяет буквы в каждом ряду, пока не достигнет предела своей способности. Полученные данные позволяют построить кривую контрастной чувствительности, отражающую эффективность зрения в различных условиях освещенности.

Оценка цветовосприятия осуществляется с использованием тестов, таких как 100-цветной тест (100-Hue Test), позволяющий определить способность различать тонкие цветовые оттенки. Данный тест предполагает идентификацию цветов из непрерывного спектра, что позволяет количественно оценить точность цветопередачи внутри шлема виртуальной реальности. Результаты теста служат индикатором способности устройства воспроизводить цвета в соответствии с естественным человеческим восприятием, что критически важно для реалистичности и комфорта визуального опыта. Важно отметить, что тест позволяет выявить даже незначительные искажения в цветовом диапазоне, влияющие на общее качество изображения.

Наше исследование количественно продемонстрировало, что современные VST-шлемы (Vision Pro, Quest 3, Quest Pro) систематически уступают естественному человеческому зрению по ключевым показателям. Измерения остроты зрения, контрастной чувствительности и цветовосприятия, выполненные с использованием стандартизированных методик, таких как таблицы Снеллена, Pelli-Robson и 100-Hue Test, показали, что текущие устройства демонстрируют более низкие значения по сравнению с нормативным зрением. В частности, наблюдается снижение способности различать мелкие детали при низкой освещенности и менее точная цветопередача. Полученные данные свидетельствуют о необходимости дальнейшей оптимизации дисплейных технологий и алгоритмов обработки изображения в VST-шлемах для достижения уровня визуального восприятия, сопоставимого с естественным зрением.

Анализ эллипсов ковариации для остроты зрения и чувствительности к контрасту показывает, что пересекающиеся эллипсы указывают на согласованную производительность при различных уровнях освещенности, в то время как разнесенные и вытянутые эллипсы свидетельствуют о стабильной, но рассеянной производительности, при этом зеленая область соответствует нормальным или выше нормальных показателям <span class="katex-eq" data-katex-display="false">logMAR</span> и <span class="katex-eq" data-katex-display="false">logCS</span>.
Анализ эллипсов ковариации для остроты зрения и чувствительности к контрасту показывает, что пересекающиеся эллипсы указывают на согласованную производительность при различных уровнях освещенности, в то время как разнесенные и вытянутые эллипсы свидетельствуют о стабильной, но рассеянной производительности, при этом зеленая область соответствует нормальным или выше нормальных показателям logMAR и logCS.

Оптимизация опыта VST: Стереозрение и производительность в условиях низкой освещенности

Система стереоскопического зрения в Apple Vision Pro реализована за счет использования бинокулярной RGB-камеры. Данная технология позволяет устройству захватывать изображение, имитируя работу человеческих глаз и создавая эффект глубины, что значительно повышает реалистичность визуального опыта. За счет одновременного получения данных с двух камер, устройство способно точно определять расстояние до объектов, формируя трехмерную картину окружающего мира. Это не только улучшает восприятие пространства, но и способствует более естественному взаимодействию с виртуальной и дополненной реальностью, позволяя пользователю интуитивно оценивать размеры и расположение виртуальных объектов, как если бы они находились в реальном мире.

Обеспечение четкости изображения в условиях недостаточной освещенности является ключевой задачей для современных систем виртуальной и смешанной реальности. Apple Vision Pro использует передовые методы оптимизации для работы в слабоосвещенных средах, что позволяет пользователям сохранять визуальный комфорт и реалистичность восприятия. Эти методы включают в себя алгоритмы шумоподавления, динамическую регулировку яркости и контрастности, а также адаптацию цветовой гаммы для компенсации недостатка света. В результате, даже в темных помещениях или при слабом внешнем освещении, устройство способно предоставлять четкое и детализированное изображение, что существенно повышает удобство и эффективность использования в различных сценариях, таких как игры, работа или просмотр контента.

Тщательное измерение ключевых параметров визуального восприятия с использованием стандартизированных тестов имеет первостепенное значение для объективной оценки эффективности систем виртуальной и смешанной реальности (VST). Эти тесты, включающие оценку визуальной остроты, контрастной чувствительности и цветовосприятия, позволяют установить количественные показатели, сравнимые между различными устройствами и с естественным зрением человека. Использование унифицированных протоколов и метрик, таких как logMAR для визуальной остроты и logCS для контрастной чувствительности, обеспечивает надежность и воспроизводимость результатов, позволяя разработчикам точно определить сильные и слабые стороны конкретных VST-устройств. Объективная оценка, основанная на этих измерениях, критически важна для оптимизации аппаратного и программного обеспечения, направленного на достижение реалистичного и комфортного визуального опыта для пользователей, а также для выявления потенциальных ограничений, способных вызвать зрительное утомление или даже нарушения зрения.

Исследования показали, что острота зрения, достигаемая естественным зрением, обычно характеризуется показателем logMAR не более 0. При этом, все протестированные шлемы виртуальной и смешанной реальности (VST HMD) демонстрируют превышение этого значения как в условиях нормальной освещенности, так и при слабом освещении. Данный факт указывает на то, что, хотя VST HMD и не превосходят естественное зрение по абсолютной остроте, они способны поддерживать приемлемый уровень детализации изображения даже в сложных условиях освещения, что является важным аспектом для комфортного и реалистичного пользовательского опыта. Подобные результаты подчеркивают значительный прогресс в области технологий отображения и визуальной обработки, позволяющий создавать устройства, способные компенсировать некоторые ограничения естественного зрения.

Исследования показали, что лишь Apple Vision Pro в некоторых случаях демонстрирует контрастную чувствительность, достигающую logCS ≥1.5, что соответствует или даже превосходит возможности естественного зрения. В то время как устройства Quest 3 и Quest Pro зачастую опускаются ниже этого порога, а показатели logCS ≤1.0 могут указывать на потенциальные нарушения зрения, сопоставимые с визуальной инвалидностью. Данный параметр, определяющий способность различать объекты на фоне схожих по яркости, имеет критическое значение для реалистичности и комфорта восприятия в виртуальной среде, и результаты свидетельствуют о значительном преимуществе Vision Pro в обеспечении качественного визуального опыта, особенно в сложных условиях освещения.

Исследования показали, что гарнитура Quest Pro демонстрирует более высокие значения TES (Tetra Contrast Sensitivity) в ходе 100-Hue теста, что указывает на ухудшенное восприятие цвета по сравнению с естественным зрением. Этот показатель отражает способность различать оттенки и насыщенность цветов, и более высокие значения TES свидетельствуют о сниженной точности цветового восприятия. В то время как естественное зрение обеспечивает высокую детализацию и точность цветопередачи, Quest Pro показывает заметные ограничения в этой области, что может влиять на общее качество визуального опыта и восприятие реалистичности изображений. Различия в цветовом восприятии могут быть критически важны для ряда приложений, включая профессиональное использование гарнитуры в области дизайна, редактирования видео и других визуально-ориентированных задачах.

Анализ скрипичных диаграмм для условий нормального и низкого освещения на визуальном бенчмарке показывает статистически значимые различия (обозначены как <span class="katex-eq" data-katex-display="false">\<i></span>, <span class="katex-eq" data-katex-display="false">\</i>\<i></span>, <span class="katex-eq" data-katex-display="false">\</i>\<i>\</i></span> при уровнях значимости .05, .01 и .001 соответственно) в показателях logMAR и logCS, указывающие на превосходство нормального освещения в оценке зрительной остроты и контрастной чувствительности.
Анализ скрипичных диаграмм для условий нормального и низкого освещения на визуальном бенчмарке показывает статистически значимые различия (обозначены как \<i>, \</i>\<i>, \</i>\<i>\</i> при уровнях значимости .05, .01 и .001 соответственно) в показателях logMAR и logCS, указывающие на превосходство нормального освещения в оценке зрительной остроты и контрастной чувствительности.

Исследование визуальных характеристик видео-прозрачных шлемов (video see-through HMD) выявляет закономерную тенденцию: технологии, стремясь имитировать реальность, неизбежно сталкиваются с её фундаментальными ограничениями. Данная работа, оценивая такие параметры, как острота зрения, контрастная чувствительность и цветовосприятие, демонстрирует, что современные устройства пока уступают естественному зрению человека. Как точно подметил Тим Бернерс-Ли: «Интернет — это для всех» (Интернет — для всех). И в данном контексте, стремление к совершенству виртуальной реальности требует учитывать и воспроизводить все нюансы человеческого восприятия, чтобы обеспечить действительно всеобщий доступ к новым возможностям, а не создавать лишь их бледное подобие.

Куда двигаться дальше?

Представленные данные, как и положено любой вскрытой системе, порождают больше вопросов, чем ответов. Очевидно, что виртуальное зрение, транслируемое через видео-прозрачные гарнитуры, пока что остается лишь бледной имитацией естественного. Разница в резкости, контрастности и цветовосприятии — это не просто технические недочеты, а фундаментальное непонимание того, как мозг обрабатывает информацию, поступающую от глаз. Необходимо сместить фокус с гонки за пикселями на изучение нейронных механизмов восприятия.

Перспективы кажутся очевидными, но и коварными. Улучшение характеристик дисплеев — это путь к иллюзии, но не к истинному зрению. Гораздо интереснее исследовать возможности адаптации виртуального изображения к индивидуальным особенностям зрительной системы каждого пользователя. Возможно, ключ к успеху лежит не в совершенствовании технологий отображения, а в создании алгоритмов, обманывающих мозг, заставляя его «достраивать» недостающую информацию.

Иными словами, задача состоит не в том, чтобы скопировать реальность, а в том, чтобы создать новую, убедительную альтернативу. Это не просто инженерная проблема, а философский вызов: насколько далеко можно зайти в манипулировании восприятием, прежде чем иллюзия станет реальностью? И главное — кто будет решать, где проходит эта грань?


Оригинал статьи: https://arxiv.org/pdf/2601.02805.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-01-07 17:19