Все, что вам нужно знать о браузерном агенте OpenAI, Operator

Наконец-то OpenAI присоединилась к конкурентному полю агентного ИИ с дебютом своего Operator AI в январе. Эта автономная система создана для действий от имени своих пользователей и нацелена на то, чтобы бросить вызов устоявшимся отраслевым конкурентам, таким как Computer Use API Клода и агентам Copilot от Microsoft – как только она перейдет из статуса «исследовательского предварительного просмотра». Вот что вам следует знать о последнем агенте OpenAI, включая возможность протестировать его самостоятельно.


📱 🚀 Перестаньте бесцельно прожигать жизнь! Присоединяйтесь к нашему Telegram-каналу @lospopadosos, чтобы узнавать последние новости о мобильных гаджетах. Потому что кому нужно реальное общение с людьми, когда вы можете наслаждаться чудесами технологий? 😎 💥 👇

top-mob.com Telegram


Что такое оператор?

Оператор OpenAI — это тип искусственного интеллекта (ИИ), который функционирует независимо, принимая решения на основе данных, к которым у него есть доступ. В отличие от традиционных программ, этот ИИ может адаптироваться к изменениям в реальном времени в своей среде и реагировать соответствующим образом, а не просто следовать предопределенным инструкциям. В результате эти агенты ИИ достаточно универсальны, чтобы справляться со сложными, многоэтапными задачами, такими как расшифровка, обобщение и генерация пунктов действий из деловой встречи или даже бронирование рейсов, отелей и аренды автомобилей для предстоящего отпуска в соответствии с графиком вашей семьи. Они также могут независимо проводить исследования по различным темам и составлять обширные исследования по этим предметам.

Operator функционирует по-другому, чем большинство существующих агентов. Вместо того, чтобы быть API, как Claude’s Computer Use, или находиться в пользовательском интерфейсе чата, как агенты ИИ Microsoft, Operator работает независимо в отдельном окне веб-браузера, размещенном на серверах OpenAI. Это означает, что он выполняет задачи удаленно и не мешает вашему обычному использованию веб-браузера, позволяя вам продолжать просмотр в обычном режиме, пока Operator активен.

Приложение Operator работает с недавно разработанной системой «Computer-Using Agent» (CUA), которая работает поверх GPT-4o. Эта основа дает приложению его универсальные мультимодальные возможности. OpenAI объясняет, что CUA был обучен способом, аналогичным его моделям решения проблем o1 и o3. Следовательно, модель CUA решает сложные задачи, сначала разделяя их на более мелкие проблемы, прежде чем пытаться решить их систематически. Если в ходе этого процесса она сталкивается с какими-либо логическими препятствиями, она будет повторять свои шаги.

Когда был выпущен Operator?

23 января 2025 года OpenAI представила Operator. В настоящее время он доступен исключительно для подписчиков Pro из США, которые платят 200 долларов в месяц через Operator.chatgpt.com. Компания намерена в будущем расширить эту услугу для пользователей Plus, Team и Enterprise, а также планирует включить эти функции в ChatGPT.

Как работает оператор?

Пользователи могут запустить помощника ИИ непосредственно из главного интерфейса ChatGPT, который открывает отдельное окно браузера, где помощник выполняет свои обязанности. ИИ держит пользователей в курсе своих текущих действий с помощью постоянного объяснения, позволяя им вмешиваться при необходимости. Помощник может запрашивать помощь пользователя для выполнения определенных задач, таких как вход на защищенные сайты или перед началом критических операций. Кроме того, он может как визуально взаимодействовать с веб-сайтами (используя снимки экрана), так и тактически имитировать нажатия клавиш и щелчки мыши пользователя от его имени.

Что может делать Operator и насколько хорошо он это может делать?

В настоящее время Operator способен выполнять простые веб-задачи, такие как бронирование билетов на концерты, заказ еды из DoorDash или управление заказами Instacart из-за его браузерной природы. Однако компания ожидает, что в будущем агент сможет автоматизировать более сложные задачи, включая бронирование отелей и авиабилетов, бронирование ресторанов и даже онлайн-покупки.

В серии отраслевых тестов было отмечено, что Operator от OpenAI превзошел как Computer Use от Anthropic, так и Mariner от Google DeepMind в различных аспектах. Например, в тесте OSWorld, где оценивается способность агента выполнять такие задачи, как объединение файлов PDF, Operator (CUA) показал себя значительно лучше, чем Computer Use, с показателем успешности 38,1% по сравнению с 22,0% у Computer Use. Для сравнения, люди обычно достигают около 72% успеха в этих задачах. В тесте WebVoyager CUA также превзошел Mariner с показателями 87% и 83,5% соответственно, в то время как Computer Use показал относительно более низкий результат — 56%.

Тем не менее, первоначальные отклики пользователей на агента ИИ были разными. Например, обозреватель New York Times Кевин Руст сказал: «В целом, я обнаружил, что использование Operator доставляет больше хлопот, чем помогает. Большинство задач, которые он выполнял для меня, можно было бы выполнить быстрее и с меньшими сложностями, если бы я делал их сам».

Он продолжил: «Даже когда система работала правильно, ей требовалось множество подтверждений и заверений перед началом действия, из-за чего у меня возникало ощущение, будто я управляю слишком осторожным учеником, а не использую виртуального помощника».

Как я могу попробовать Operator самостоятельно?

Чтобы использовать агент оператора OpenAI, вам необходимо сначала подписаться на уровень Pro в OpenAI, а затем получить доступ через веб-сайт Operator.chatgpt.com.

Смотрите также

2025-02-05 21:27