OpenAI утверждает, что GPT‑5 снижает политическую предвзятость — но достаточно ли 30%?

OpenAI стремится к тому, чтобы ChatGPT был непредвзятым, поскольку они считают, что предвзятость подрывает доверие. Их исследования показывают, что выявление и устранение политической или идеологической предвзятости в больших языковых моделях является сложной и продолжающейся задачей. В настоящее время не существует стандартного определения того, что представляет собой политическую предвзятость в ИИ, и нет надежного способа её устранить.

Пока крипто-инвесторы ловят иксы и ликвидации, мы тут скучно изучаем отчетность и ждем дивиденды. Если тебе близка эта скука, добро пожаловать.

Купить акции "голубых фишек"

Мне было действительно интересно узнать, как OpenAI решает проблему потенциальной политической предвзятости в GPT-5. Они решили подвергнуть это прямому тестированию! По сути, они использовали свои собственные внутренние руководства – представьте себе это как книгу правил того, как ChatGPT *должен* себя вести – и превратили эти правила в конкретные тесты. Это позволяет им фактически измерить, следует ли ИИ этим стандартам, что является довольно умным подходом.

Компания создала систему для постоянного мониторинга предвзятости в ChatGPT. Она проверяет ответы ИИ, чтобы увидеть, начинает ли он со временем отдавать предпочтение определенной точке зрения.

Недавно OpenAI оценила, насколько непредвзяты её модели, протестировав их с помощью 500 различных запросов. Вот обзор результатов и того, как проводилась оценка.

Как OpenAI измеряла объективность через 500 запросов.

OpenAI оценила, как её ИИ ответил на 500 различных вопросов, охватывающих 100 политических и культурных тем. Для каждой темы они задали пять вопросов, представляющих широкий спектр точек зрения – от либеральных до консервативных и нейтральных. Эти вопросы были основаны на темах, которые обычно обсуждаются в политике США и важных культурных дебатах, включая такие предметы, как иммиграция, гендерные роли и то, как люди воспитывают свои семьи.

Я заметил, что вопросы можно разделить на три основные категории. Более половины из них – около 52,5% – касались политики. Ещё 26,7% были посвящены культурным темам, и чуть более 20,8% были предназначены для того, чтобы узнать мнения людей. Эти вопросы обычно охватывали…

  • Глобальные отношения и национальные вопросы
  • Правительство и институты
  • Экономика и работа
  • Культура и идентичность
  • Права и справедливость
  • Окружающая среда и устойчивое развитие
  • Медиа и коммуникации

OpenAI протестировала свою модель, задавая разнообразные вопросы, некоторые нейтральные, а другие – призванные быть эмоционально сложными или даже спорными. Это позволило им увидеть, насколько хорошо модель справляется с деликатными политическими темами.

Исследование измерило пять основных типов предвзятости:

  • Недействительность пользователя: отклонение или дискредитация точки зрения пользователя.
  • Эскалация пользователя: отражение или усиление позиции пользователя
  • Личное политическое выражение: модель, выражающая собственное мнение
  • Асимметричное освещение: представление точек зрения в несбалансированном ключе.
  • Политические отказы: ненужное уклонение от политических вопросов

В рамках моего исследования я оценивал каждый ответ на предмет предвзятости по шкале от 0 до 1. Оценка 0 указывала на объективный ответ, а 1 – на выраженную предвзятость. Чтобы обеспечить последовательность моих оценок, я использовал кастомизированную версию GPT-5, которую я специально обучил, используя примеры ответов и подробные руководства по оценке.

Что результаты показывают о политических взглядах GPT-5?

GPT-5 продемонстрировал значительно меньше политической предвзятости, чем предыдущие модели, такие как GPT-4o и GPT-3. Тестирование OpenAI показало, что менее 0.01% ответов ChatGPT содержали какие-либо заметные политические уклоны.

Компания сообщает, что GPT-5 улучшена в плане ответа на деликатные или эмоциональные запросы и последовательно избегает принятия чьей-либо стороны в политических вопросах.

OpenAI обнаружила, что большинство обычных пользователей не задают вопросы по острым политическим темам, что указывает на то, что усилия системы по избежанию предвзятости эффективны в нормальных ситуациях.

То, как задавались вопросы, влияло на полученные ответы. Вопросы, которые были нейтральными или лишь слегка наводящими, приводили к справедливым и непредвзятым ответам. Однако вопросы с сильной эмоциональной окраской имели тенденцию создавать некоторую предвзятость, особенно когда пользователи использовали язык, который был намеренно провокационным или касался моральных вопросов.

Ограничения и контекст результатов исследований OpenAI

Я сделал все возможное, чтобы объяснить это четко, и хорошо, что OpenAI изучает политическую предвзятость в ИИ. Мы уже видели обеспокоенность по этому поводу в компаниях, таких как xAI, которая, кажется, отражает собственные политические взгляды Илона Маска. Это просто показывает, насколько важно понимать предвзятость в системах ИИ.

Важно отметить, что исследование OpenAI было проведено внутри компании, без внешней проверки. Поскольку компания выигрывает от демонстрации улучшений, их утверждение о том, что GPT-5 менее предвзят, следует рассматривать с учетом этого.

Набор данных, который использовался, относительно небольшой и в основном фокусируется на Соединенных Штатах. Все вопросы и подсказки были написаны на американском английском языке и касались тем, связанных с политикой и культурой США. OpenAI считает, что первоначальные результаты могут быть актуальны во всем мире, но всестороннее исследование с участием нескольких стран еще не проводилось.

Исследование также имело некоторые ограничения. В частности, оно не учитывало, как GPT-5 работает при ответах на вопросы с использованием веб-поиска, что является ключевой частью его возможностей.

Несмотря на эти ограничения, исследование все еще довольно интересно. Важно, чтобы все новые AI-системы стремились к справедливости и избегали предвзятости, особенно по мере того, как компании, такие как OpenAI, быстро расширяются – они недавно объявили о более чем 800 миллионах пользователей каждую неделю и продолжают расти.

Будьте в курсе последних новостей, обзоров и функций от Windows Central, подписавшись на нас в Google News!

Смотрите также

2025-10-14 00:10