Платформа машинного обучения Hugging Face представила приложение для iOS, позволяющее использовать камеру iPhone для анализа окружающей среды. Достаточно направить её на сцену или сделать снимок, и искусственный интеллект будет активирован, чтобы объяснить видимое, распознавать объекты, выполнять переводы или извлекать текстовую информацию.
Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.
Купить акции "голубых фишек"Представляем HuggingSnap — универсальное приложение, которое интерпретирует ваше окружение с помощью многогранного подхода! Этот инновационный инструмент теперь бесплатно доступен в App Store. Он работает на SmolVLM2, открытой модели искусственного интеллекта, способной обрабатывать текст, изображения и видео как входные данные.
Основная цель этого приложения — помочь пользователям распознавать и получать знания о своем окружающем пространстве, особенно растениях, животных и других объектах. Оно имеет некоторые общие черты с функцией визуального интеллекта на iPhone, но HuggingSnap предлагает уникальные преимущества, которые отличают его от конкурентов на устройствах Apple.
Это не требует интернета для работы
https://www.youtube.com/embed/
Чтобы использовать HuggingSnap, необходимо лишь иметь iPhone с операционной системой iOS версии 18. После настройки он работает подобно Visual Intelligence по интерфейсу пользователя, однако имеет существенные различия в функционале.
Я, наблюдатель, могу видеть что Apple использует ChatGPT для своих задач визуального интеллекта. Это связано с тем, что в настоящий момент Siri не обладает возможностью работать как генеративный AI инструмент подобно ChatGPT или Gemini от Google. Эти инструменты имеют свои базы знаний. Вместо того чтобы самостоятельно генерировать ответы, Siri перенаправляет все подобные запросы пользователя к ChatGPT.
Для использования ChatGPT необходимо подключение к интернету, так как он не работает оффлайн. Тем не менее, HuggingSnap прекрасно функционирует без интернета. Кроме того, использование офлайн-метода гарантирует отсутствие передачи пользовательских данных с вашего устройства, обеспечивая высокую степень приватности по сравнению с традиционными методами.
Что можно делать с HuggingSnap?
Приложение HuggingSnap работает на модели SmolVLM2, созданной командой Hugging Face. Эта модель обладает универсальностью и может не только отвечать на вопросы, но и анализировать изображения через камеру iPhone или фотографии, хранящиеся в фотогалерее устройства.
Например, представьте изображение любого исторического памятника, и попросите предоставить рекомендации по поездке на основе информации, которую можно извлечь из этого изображения. Эта технология способна расшифровать данные с графиков или интерпретировать детали снимка счета за электричество, после чего ответить на вопросы, связанные с извлеченными данными.
Как исследователь, я обнаружил, что архитектура данной системы удивительно легковесная, что делает её идеальным выбором для применения ИИ на устройствах. В плане производительности она превосходит открытую модель Google Palimma (3B) в бенчмарках и даже сравнивается с моделью Qwen AI от Alibaba, демонстрируя аналогичные возможности в области компьютерного зрения.
Как исследователь, я нахожу одним существенным преимуществом минимальные требования к ресурсам для работы данного решения, что делает его идеальным выбором для устройств с ограниченными ресурсами, таких как смартфоны. Интересно отметить, что даже повсеместно используемый VLC медиаплеер внедрил модель SmolVLM2 для описания видео, позволяя пользователям исследовать ролики посредством запросов на естественном языке.
Описание приложения на GitHub поясняет, что SmolVLM способен отвечать на вопросы по изображениям, суммировать визуальный контент, генерировать повествования из разных изображений или функционировать только как текстовая языковая модель — все это при эффективном извлечении ключевых моментов из видео.
Смотрите также
- Новые смартфоны. Что купить в июле 2025.
- Неважно, на что вы фотографируете!
- Лучшие смартфоны. Что купить в июле 2025.
- Realme C71 ОБЗОР: плавный интерфейс, удобный сенсор отпечатков, большой аккумулятор
- Лучшие геймерские смартфоны. Что купить в июле 2025.
- AXGAMING запустил первый графический процессор GeForce RTX 50 с черным дизайном кулера: RTX 5050 X2B
- Типы дисплеев. Какой монитор выбрать?
- IdeaPad Slim 3 15IRH10R ОБЗОР
- 10 лучших OLED ноутбуков. Что купить в июле 2025.
- ZTE Blade A36 ОБЗОР: большой аккумулятор
2025-03-20 07:57