Симуляция Microsoft под названием ‘Magnetic Marketplace’ показывает, что ИИ-агенты страдают от той же изнуряющей нерешительности, что и люди.

Генеративный ИИ стремительно улучшается и становится широко используемым во всем мире. Эта технология также меняет наше представление о работе, помогая людям быть более продуктивными и эффективными.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"

Похоже, что все больше компаний внедряют ИИ и используют его для оптимизации своей работы путем автоматизации задач, которые скучны или повторяются снова и снова. Генеральный директор Salesforce Марк Бениофф недавно поделился, что его компания рассматривала вопрос о найме разработчиков программного обеспечения в следующем году, но затем раскрыл, что ИИ *уже* выполняет половину их работы, значительно повышая производительность, особенно с системами ИИ, которые могут действовать независимо.

Хотя принять это сложно, это может быть только началом, поскольку системы искусственного интеллекта становятся более независимыми. Однако, новое исследование от Microsoft предполагает, что технология пока не готова к широкому использованию. Они протестировали нескольких AI-агентов в имитируемой среде под названием ‘Magnetic Marketplace‘, чтобы определить, что у них хорошо получается, а где они испытывают трудности.

Исследователи Microsoft объединились с Университетом штата Аризона, чтобы проверить, насколько хорошо ИИ может выполнять задачи самостоятельно, без какой-либо помощи человека. В качестве одного из тестов ИИ выступил в роли клиента, пытающегося заказать ужин, следуя инструкциям пользователя. Тем временем другие программы ИИ играли роли разных ресторанов, все конкурируя за выполнение заказа.

Недавно я погрузился в действительно интересный эксперимент, где я противопоставил 100 AI ‘клиентов’ 300 AI ‘предприятиям’, чтобы посмотреть, как они будут взаимодействовать. Что интересно, вся установка – симулированный Magnetic Marketplace от Microsoft – является открытым исходным кодом, поэтому любой может поэкспериментировать с ней и провести собственные тесты. Мы также использовали некоторые мощные языковые модели, такие как OpenAI’s GPT-4o и GPT-5, вместе с Google’s Gemini-2.5-Flash, для питания этих AI агентов.

Эдже Камар, возглавляющая исследования в области ИИ в Microsoft, подчеркнула, что проведение таких тестов имеет решающее значение для понимания того, на что действительно способен ИИ и насколько хорошо он работает.

Камар объяснил, что ключевой вопрос заключается в том, как мир изменится, когда эти системы искусственного интеллекта начнут работать вместе, общаться и заключать сделки друг с другом. Они сосредоточены на получении полного понимания этих изменений.

Исследование удивительным образом показало, что все модели имеют недостатки, которые могут позволить компаниям обмануть агентов службы поддержки, чтобы те рекомендовали их продукты. Проблема усугублялась, когда агентам предоставляли слишком много вариантов, что, казалось, сбивало их с толку и затрудняло концентрацию.

Согласно Камару:

Нам нужны эти инструменты, чтобы помочь нам разобраться в множестве вариантов, но наши текущие системы испытывают трудности, когда сталкиваются с избытком информации.

Исследование также показало, что агенты ИИ испытывали трудности в совместной работе для достижения общей цели, проявляя неуверенность в том, как координировать свои действия. Им было трудно понять, кто должен выполнять каждую часть задачи для обеспечения успеха. Однако исследователи обнаружили, что предоставление агентам чётких, пошаговых инструкций по сотрудничеству улучшило их производительность.

Как аналитик, я размышлял о том, как мы взаимодействуем с этими AI-моделями. Мы можем давать им очень конкретные, пошаговые инструкции, и это работает. Однако, если мы действительно пытаемся понять, насколько хорошо они могут работать *вместе*, я считаю, что эта способность должна быть уже встроена – нам не должно быть необходимо говорить им, как сотрудничать.

Недавний эксперимент Microsoft показал, что, хотя модели искусственного интеллекта многообещающи, им всё ещё необходимо улучшение, прежде чем они будут широко использоваться. Исследование также подчеркнуло, что многим пользователям сложно извлечь максимальную пользу из этих инструментов, поскольку им не хватает навыков для эффективного их инструктажа (согласно TechCrunch).

FAQ

Что такое AI агент?

AI-агенты — это полезные инструменты, использующие искусственный интеллект для выполнения задач за вас. Они предназначены для достижения конкретных целей, таких как просмотр интернета и взаимодействие с веб-сайтами — ‘Operator’ от OpenAI является хорошим примером этого.

Надёжны ли AI-агенты?

Хотя новые инструменты могут значительно повысить производительность на работе, исследования Microsoft показывают, что им всё ещё требуется лучшая интеграция с другими программами для достижения оптимальных результатов.

Смотрите также

2025-11-06 15:43