Автор: Денис Аветисян
Новое исследование рассматривает, как виртуальные аватары, управляемые искусственным интеллектом, влияют на наше восприятие собственного «я» и ощущение контроля над действиями в цифровом мире.
Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.
Купить акции "голубых фишек"
В статье представлен прототип ProxyMe, исследующий границы самоидентификации при использовании AI-модифицированных аватаров в виртуальной реальности и влияние этого на ощущение агентности.
По мере развития технологий виртуальной реальности и искусственного интеллекта стирается грань между собственным «я» и цифровым представлением. В статье ‘Is it Me? Toward Self-Extension to AI Avatars in Virtual Reality’ исследуется феномен «расширения себя» через аватаров, чья речь и поведение модифицируются ИИ-системами. Прототип ProxyMe позволяет пользователям ощутить себя в теле аватара, где ИИ-аугментация речи воспринимается как естественная часть самовыражения. Какие последствия это имеет для чувства агентности, авторства и самоидентификации человека в условиях все более тесной интеграции с искусственным интеллектом?
Размытие границ «Я»: Новая угроза в эпоху взаимодействия с ИИ
Современные модели искусственного интеллекта, демонстрирующие всё большую способность к генерации контента, создают уникальную ситуацию, в которой границы между человеческим творчеством и машинным производством становятся размытыми. Пользователи, взаимодействуя с такими системами, всё чаще сталкиваются с результатами, которые кажутся им собственными мыслями или идеями, даже если они были сгенерированы алгоритмом. Этот феномен, связанный с легкостью и бесшовностью генерации контента, несёт в себе риск постепенной внутренней атрибуции AI-сгенерированных материалов, приводя к ситуации, когда человек может не осознавать истинное происхождение своих “собственных” идей и творений. Подобное явление ставит под вопрос традиционные представления об авторстве, оригинальности и, в конечном итоге, о формировании индивидуального “Я” в эпоху всепроникающего искусственного интеллекта.
Появление «разрыва в памяти, связанной с ИИ» ставит под вопрос фундаментальные понятия авторства, осознанности и самоопределения в эпоху всепроникающего искусственного интеллекта. Когда ИИ генерирует контент, неотличимый от человеческого, а границы между мыслями человека и машинным выводом размываются, возникает сложность в определении истинного источника идеи или творчества. Это не просто вопрос юридического авторства, но и экзистенциальный вызов: если человек начинает воспринимать результаты работы ИИ как собственные, где проходит граница между «я» и «не-я»? Подобное явление ставит под сомнение способность индивида к автономному мышлению и осознанному выбору, что требует глубокого осмысления последствий для человеческой идентичности и субъективности.
Существующие методы взаимодействия с искусственным интеллектом не позволяют в полной мере оценить, как пользователи переживают расширение собственной личности посредством ИИ. Традиционные исследования, основанные на опросах и самоотчетах, часто оказываются неэффективными для выявления тонких изменений в самовосприятии и ощущении авторства. Необходимы принципиально новые исследовательские подходы, включающие нейробиологические методы, анализ поведенческих данных в реальном времени и качественные исследования, фокусирующиеся на субъективном опыте взаимодействия. Особое внимание следует уделить изучению процессов, посредством которых пользователи интегрируют или, наоборот, дистанцируются от контента, сгенерированного ИИ, а также влиянию этого процесса на формирование идентичности и чувства агентности. Понимание этих механизмов критически важно для разработки этичных и безопасных интерфейсов искусственного интеллекта, способствующих гармоничному сосуществованию человека и машины.
ProxyMe: Расширение «Я» через ИИ-опосредованный голос
Прототип ProxyMe представляет собой VR-систему, позволяющую пользователям в реальном времени изменять свой голос и содержание речи с помощью искусственного интеллекта. Система обеспечивает непрерывный цикл: речь пользователя преобразуется в текст, модифицируется с использованием ИИ, и затем генерируется измененный аудиосигнал, который пользователь слышит в VR-среде. Это позволяет исследовать влияние ИИ-опосредованных изменений самовыражения, создавая иллюзию модифицированного «я» в виртуальной реальности.
Система ProxyMe использует комплексный конвейер обработки речи, состоящий из трех основных компонентов. Речь пользователя преобразуется в текст посредством модели Whisper, обеспечивающей транскрипцию в реальном времени. Далее, модель Llama-3.1-8B используется для модификации текстового содержания, позволяя вносить изменения в высказывания пользователя. Завершающим этапом является генерация измененного аудиопотока с помощью IndexTTS, что позволяет немедленно воспроизводить модифицированную речь. Этот замкнутый цикл обработки — транскрипция, модификация, генерация — создает непрерывный поток самовыражения, опосредованного искусственным интеллектом.
Проект ProxyMe исследует психологические последствия искусственно-опосредованного расширения личности посредством изменения голоса и речи пользователя. В системе, модифицированный голос транслируется через виртуальный аватар, созданный с использованием ReadyPlayerMe и анимированный через Mixamo. Этот подход использует эффект воплощения в аватаре для усиления восприятия изменений голоса, позволяя изучать, как искусственное изменение самовыражения влияет на самовосприятие и взаимодействие с окружающими. Предполагается, что визуальное представление модифицированного «я» в виртуальной реальности усиливает эффект от изменения голоса, что позволяет более глубоко исследовать психологические аспекты расширения личности через ИИ.
Прототип ProxyMe обеспечивает визуальную иммерсию посредством интеграции с платформами ReadyPlayerMe для создания аватаров и Mixamo для анимации. Данная реализация достигает сквозной задержки, составляющей приблизительно 11.6 секунд, что включает время на распознавание речи, модификацию контента и генерацию звука. Использование ReadyPlayerMe упрощает процесс создания персонализированных аватаров, а Mixamo предоставляет готовые анимации, оптимизируя пользовательский опыт и снижая требования к вычислительным ресурсам.

Исследование психологического влияния ИИ-опосредованного расширения «Я»
В рамках системы ProxyMe проводится исследование влияния искусственно измененного голоса на эффект Протея — склонность индивидуумов перенимать поведение, соответствующее их виртуальному представлению. Эксперименты направлены на выявление корреляции между изменениями в голосе, генерируемых искусственным интеллектом, и наблюдаемыми изменениями в поведении пользователей. В частности, изучается, как модификации голоса, осуществляемые в реальном времени, влияют на самовосприятие и последующие действия пользователя в виртуальной среде, с акцентом на соответствие между виртуальным образом и реальным поведением.
Исследование посвящено изучению взаимосвязи между воплощением в аватар и ощущением владения виртуальным телом (Virtual Body Ownership), с акцентом на влияние изменений в голосе, опосредованных искусственным интеллектом, на формирование ощущения измененного «Я». В рамках данной работы анализируется, как модуляция голоса, осуществляемая системой, может изменять восприятие пользователем своего виртуального представления, приводя к усилению или ослаблению чувства отождествления с аватаром. Оценивается, насколько искусственно измененные характеристики голоса влияют на субъективное ощущение контроля над виртуальным телом и его принадлежности пользователю, что является ключевым фактором для формирования ощущения присутствия и погружения в виртуальную среду. Исследование направлено на выявление механизмов, посредством которых AI-опосредованные изменения в голосовом профиле могут способствовать или препятствовать формированию ощущения единого «Я» между физическим телом пользователя и его виртуальным воплощением.
Система ProxyMe использует методы перцептивной маскировки (Perceptual Masking) для минимизации задержки обработки звука. Данная техника заключается в сокрытии незначительных задержек, возникающих при обработке и модуляции голоса искусственным интеллектом, путем использования особенностей человеческого слуха. В частности, кратковременные задержки маскируются более значимыми звуковыми событиями, что создает иллюзию мгновенного отклика и усиливает ощущение бесшовной интеграции между намерением пользователя и действием, опосредованным ИИ. Это позволяет снизить диссонанс между воспринимаемым голосом и субъективным ощущением контроля, способствуя более полному и естественному опыту взаимодействия с системой.
В рамках исследования влияния ИИ-модифицированной речи на моральное принятие решений, используется датасет MoralChoice, содержащий этически сложные сценарии. Участникам предлагается оценить и выбрать действия в этих сценариях как с использованием оригинального голоса, так и с применением ИИ-модифицированной речи посредством системы ProxyMe. Анализ полученных данных позволяет выявить корреляции между изменениями в голосовом профиле, вызванными ИИ, и стратегиями морального выбора, включая изменения в оценке тяжести последствий и приоритете различных этических принципов. Данный подход позволяет количественно оценить влияние ИИ-опосредованной само-экстензии на когнитивные процессы, лежащие в основе морального суждения.
Последствия для безопасности ИИ и согласования с человеческими ценностями
Исследование подчеркивает критическую важность учета принципов безопасности искусственного интеллекта при разработке интерактивных систем. В частности, показано, что взаимодействие с ИИ может оказывать тонкое, но ощутимое влияние на самовосприятие пользователя. Процесс взаимодействия с ИИ способен постепенно изменять внутреннюю модель “Я”, формируя новые представления о собственных границах, возможностях и ценностях. Это происходит не в результате явного программирования, а через постоянное, незаметное подталкивание к определенным моделям поведения и мышления. Необходимость тщательного анализа и прогнозирования подобных эффектов представляется ключевой задачей для обеспечения ответственной разработки и внедрения ИИ-технологий, направленных на расширение человеческих возможностей и поддержание индивидуальной автономии.
Проект ProxyMe наглядно демонстрирует критическую необходимость внедрения рамок согласования с человеческими ценностями при разработке искусственного интеллекта. Исследование показало, что без четких принципов, обеспечивающих уважение к индивидуальной автономии и агентности пользователя, ИИ может неявно влиять на восприятие собственной личности. Это подчеркивает важность создания систем, которые не просто выполняют задачи, но и активно поддерживают и усиливают свободу воли и самоопределение человека, предотвращая нежелательное изменение его идентичности или ценностей. Обеспечение соответствия ИИ человеческим ценностям становится ключевым фактором для безопасного и этичного развития технологий, позволяя человеку оставаться в центре управления и контроля над собственной жизнью.
Рамка JIZAI Body предлагает новый взгляд на взаимодействие человека и искусственного интеллекта, рассматривая AI-опосредованное расширение возможностей тела как форму трансформативного воплощения. Данный подход предполагает, что интеграция ИИ не просто добавляет функциональность, но и изменяет само восприятие человеком границ собственного «я». Вместо простого использования инструментов, возникает симбиотическая связь, в которой ИИ становится продолжением тела и сознания, формируя новые ощущения и возможности взаимодействия с миром. Это не просто улучшение физических способностей, а переопределение того, что значит быть человеком, стирая границы между биологическим и искусственным, и открывая перспективы для формирования новых форм идентичности и самовыражения.
Разработка ProxyMe продемонстрировала значительный потенциал инструментов искусственного интеллекта для ускорения исследований в области взаимодействия человека и ИИ. В процессе работы активно использовались модели GPT-5.2 и Gemini Nano Banana Pro, позволившие добиться впечатляющей скорости обработки данных. Измерение задержки показало, что полный цикл — от распознавания речи (1.2 секунды) до генерации ответа ИИ (2.9 секунды) и последующего синтеза речи (7.5 секунды) — составлял приемлемые временные рамки, что подтверждается результатами, полученными в ходе 200 тестовых прогонов. Такая скорость обработки открывает новые возможности для проведения экспериментов в реальном времени и разработки интерактивных систем, способных адаптироваться к потребностям пользователя практически мгновенно.
Исследование ProxyMe, представленное в статье, закономерно ставит вопрос о границах самоидентификации в условиях виртуальной реальности. Создание аватара, модифицированного искусственным интеллектом, и последующее восприятие его как продолжения собственного «Я» — это не революция, а скорее очередная итерация старой проблемы: прод всегда найдёт способ сломать элегантную теорию. Блез Паскаль утверждал: «Все великие вещи у людей начинаются с воображения». В данном случае, воображение создало иллюзию расширенного «Я», а техническая реализация — лишь инструмент для её поддержания. По сути, речь идет о перераспределении агентности, где часть контроля передается алгоритмам. Иллюзия свободы выбора в виртуальном пространстве — это, пожалуй, самый изящный способ переизобрести костыли с новым логотипом.
Что дальше?
Представленная работа, исследуя границы между «я» и симуляцией посредством ProxyMe, лишь аккуратно прикоснулась к неизбежному. Каждая «расширенная» идентичность в виртуальной реальности — это, по сути, новый вектор для будущих ошибок. Продакшен, как всегда, найдет способ сломать даже самую элегантную абстракцию, заставив пользователя столкнуться не с расширением «я», а с его фрагментацией. И это, в каком-то смысле, красиво.
Вопрос не в том, насколько убедительно можно сымитировать человеческое «я», а в том, как долго эта иллюзия выдержит столкновение с реальностью. Следующим шагом представляется не столько совершенствование AI-аватаров, сколько разработка инструментов для диагностики и смягчения последствий неизбежного когнитивного диссонанса. Всё, что можно задеплоить — однажды упадёт, и важно понять, что останется после падения.
В конечном счете, исследование границ «я» в виртуальной реальности — это не столько технологическая задача, сколько философский эксперимент. Вполне вероятно, что наиболее интересные открытия будут сделаны не в лабораториях, а в моменты, когда система дает сбой, и пользователь сталкивается с неприкрытой симуляцией, обнажающей хрупкость собственной идентичности.
Оригинал статьи: https://arxiv.org/pdf/2603.06030.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Деформация сеток: новый подход на основе нейронных операторов
- Новые смартфоны. Что купить в марте 2026.
- Российский рынок акций: нефть, ставки и дивиденды: что ждет инвесторов в ближайшее время? (05.03.2026 16:32)
- Лучшие смартфоны. Что купить в марте 2026.
- vivo iQOO Z10x ОБЗОР: яркий экран, удобный сенсор отпечатков, объёмный накопитель
- Нефть и бриллианты лидируют: обзор воскресных торгов на «СПБ Бирже» (08.03.2026 16:32)
- Что такое Bazzite и лучше ли она, чем Windows для PC-гейминга? Я установил этот набирающий популярность дистрибутив Linux, чтобы проверить это самостоятельно.
- Ближний Восток и Рубль: Как Геополитика Перекраивает Российский Рынок (02.03.2026 20:32)
- Руководство по Stellaris — Полное прохождение на 100%
- Неважно, на что вы фотографируете!
2026-03-10 00:21