TLDR
- Исследователи работают над алгоритмами глубокого обучения, которые позволят пользователям наушников выбирать, какие звуки они слышат.
- Пользователи смогут выбирать из 20 классов звуков, включая сирены, детские крики, щебетание птиц и многое другое.
- Исследователи планируют создать коммерческую версию технологии.
Шумоподавление в наушниках отлично подходит, если вы хотите заблокировать весь шум вокруг себя. Но как насчет того, когда вы хотите услышать определенные звуки? Такие режимы, как Ambient Sound на Sony WF-1000XM5, позволяют вам слышать происходящее вокруг, но при этом пропускают все. Новая технология, разработанная для наушников, вскоре может позволить вам выбирать, какие звуки в вашем окружении вы слышите.
По данным Tech Xplore, исследователи из Вашингтонского университета в настоящее время работают над алгоритмами глубокого обучения, которые позволят пользователям наушников выбирать, какие звуки они слышат в режиме реального времени. Названная «семантическим слухом», технология наушников захватывает звук и отправляет его на подключенный телефон, чтобы подавить все звуки окружающей среды, кроме тех, которые вы выбрали.
Похоже, эта функция будет работать либо через голосовую команду, либо через приложение для смартфона. При активации пользователи смогут выбирать из 20 классов звуков, некоторые из которых включают детский плач, сирены, речь, щебетание птиц и многое другое.
Создать такой ИИ, который сможет быстро и точно сортировать эти звуки, непросто. Как объясняет старший автор и профессор Школы компьютерных наук и инженерии Пола Аллена Шьям Голлакота:
Проблема заключается в том, что звуки, которые слышат пользователи наушников, должны синхронизироваться с их зрительными ощущениями. Вы не можете услышать чей-то голос через две секунды после того, как он заговорит с вами. Это означает, что нейронные алгоритмы должны обрабатывать звуки менее чем за сотую долю секунды.
Скорость, с которой должна происходить эта обработка, также означает, что семантическое прослушивание невозможно выполнить через облако. Чтобы функция работала должным образом, обработку необходимо выполнять на устройстве, например на подключенном телефоне. Издание также отмечает, что, поскольку звуки доходят до вашего уха в разное время, технология также должна учитывать задержки.
До сих пор семантический слух проверялся в офисах, на улицах и в парках. В целом эта функция оказалась успешной, но, как сообщается, у нее возникли проблемы со звуками, имеющими определенные свойства. Например, ИИ с трудом отличал вокал от речи. Однако дополнительное обучение на реальных данных могло бы улучшить ситуацию.
Смотрите также
- Обслуживание и время простоя сервера Fortnite для обновления v28.00 — возможные исправления ошибки «Серверы не отвечают» (декабрь 2023 г.)
- Будет ли GTA 6 выпущена на PS4? Все детали объяснены
- Вышла iOS 17.1.2 с двумя критическими обновлениями безопасности
- Как присоединиться к Fortnite Live Event и гарантировать место на The Big Bang
- Ошибка Fortnite «Извините, вы слишком часто посещаете наш сервис»: причины и исправление
- PS5 Slim против PS5: чем новая консоль Sony действительно отличается?
- Где найти и обыскать ящик с оружием в локации Fortnite — что такое ящик с оружием
- Как исправить движение в Fortnite, глава 5
- WoW SoD: все руны, комбинации классов и местоположения на данный момент
- Последние коды активации Fortnite, декабрь 2023 г.: бесплатные В-баксы, эмоции и наряды