Откройте автономное приложение ИИ, которое превосходит визуальную интеллектуальность Apple!

Платформа машинного обучения Hugging Face представила приложение для iOS, позволяющее использовать камеру iPhone для анализа окружающей среды. Достаточно направить её на сцену или сделать снимок, и искусственный интеллект будет активирован, чтобы объяснить видимое, распознавать объекты, выполнять переводы или извлекать текстовую информацию.

📰 Думаешь, успеваешь за новостями, как за автобусом?
Новости Сегодня – твой саркастичный гид в мире крипты, где каждый день – премьера.

Прыгнуть в Telegram

Представляем HuggingSnap — универсальное приложение, которое интерпретирует ваше окружение с помощью многогранного подхода! Этот инновационный инструмент теперь бесплатно доступен в App Store. Он работает на SmolVLM2, открытой модели искусственного интеллекта, способной обрабатывать текст, изображения и видео как входные данные.

Основная цель этого приложения — помочь пользователям распознавать и получать знания о своем окружающем пространстве, особенно растениях, животных и других объектах. Оно имеет некоторые общие черты с функцией визуального интеллекта на iPhone, но HuggingSnap предлагает уникальные преимущества, которые отличают его от конкурентов на устройствах Apple.

Это не требует интернета для работы

https://www.youtube.com/embed/

Чтобы использовать HuggingSnap, необходимо лишь иметь iPhone с операционной системой iOS версии 18. После настройки он работает подобно Visual Intelligence по интерфейсу пользователя, однако имеет существенные различия в функционале.

Я, наблюдатель, могу видеть что Apple использует ChatGPT для своих задач визуального интеллекта. Это связано с тем, что в настоящий момент Siri не обладает возможностью работать как генеративный AI инструмент подобно ChatGPT или Gemini от Google. Эти инструменты имеют свои базы знаний. Вместо того чтобы самостоятельно генерировать ответы, Siri перенаправляет все подобные запросы пользователя к ChatGPT.

Для использования ChatGPT необходимо подключение к интернету, так как он не работает оффлайн. Тем не менее, HuggingSnap прекрасно функционирует без интернета. Кроме того, использование офлайн-метода гарантирует отсутствие передачи пользовательских данных с вашего устройства, обеспечивая высокую степень приватности по сравнению с традиционными методами.

Что можно делать с HuggingSnap?

Приложение HuggingSnap работает на модели SmolVLM2, созданной командой Hugging Face. Эта модель обладает универсальностью и может не только отвечать на вопросы, но и анализировать изображения через камеру iPhone или фотографии, хранящиеся в фотогалерее устройства.

Например, представьте изображение любого исторического памятника, и попросите предоставить рекомендации по поездке на основе информации, которую можно извлечь из этого изображения. Эта технология способна расшифровать данные с графиков или интерпретировать детали снимка счета за электричество, после чего ответить на вопросы, связанные с извлеченными данными.

Как исследователь, я обнаружил, что архитектура данной системы удивительно легковесная, что делает её идеальным выбором для применения ИИ на устройствах. В плане производительности она превосходит открытую модель Google Palimma (3B) в бенчмарках и даже сравнивается с моделью Qwen AI от Alibaba, демонстрируя аналогичные возможности в области компьютерного зрения.

Как исследователь, я нахожу одним существенным преимуществом минимальные требования к ресурсам для работы данного решения, что делает его идеальным выбором для устройств с ограниченными ресурсами, таких как смартфоны. Интересно отметить, что даже повсеместно используемый VLC медиаплеер внедрил модель SmolVLM2 для описания видео, позволяя пользователям исследовать ролики посредством запросов на естественном языке.

Описание приложения на GitHub поясняет, что SmolVLM способен отвечать на вопросы по изображениям, суммировать визуальный контент, генерировать повествования из разных изображений или функционировать только как текстовая языковая модель — все это при эффективном извлечении ключевых моментов из видео.

Смотрите также

2025-03-20 07:57