Martin Helme

OpenAI o3 — это генеративная предварительно обученная трансформерная модель (GPT), разработанная OpenAI в качестве преемника OpenAI o1. Она предназначена для того, чтобы уделять дополнительное время обдумыванию при ответах на вопросы, требующие пошагового логического рассуждения[1][2]. Полная версия была выпущена для пользователей ChatGPT 31 января 2025 года[3].

История

Модель OpenAI o3 была анонсирована 20 декабря 2024 года, при этом обозначение «o3» было выбрано для избежания конфликта с товарным знаком мобильного оператора O2. Модель доступна в двух версиях: o3 и o3-mini. OpenAI пригласила исследователей в области безопасности и защиты для подачи заявок на ранний доступ к этим моделям до 10 января 2025 года[1][4]. 31 января 2025 года OpenAI выпустила o3-mini для всех пользователей ChatGPT (включая бесплатный тариф) и пользователей API. Также была выпущена более мощная модель — o3-mini-high[5].

Возможности

Для обучения o3 перед генерацией ответов использовалось обучение с подкреплением, при этом применялся подход, который OpenAI называет «частной цепочкой рассуждений». Этот метод позволяет модели планировать наперёд и последовательно обрабатывать задачи, выполняя серию промежуточных этапов рассуждения для помощи в решении проблемы, что требует дополнительных вычислительных ресурсов и увеличивает задержку ответов[6].

Модель o3 демонстрирует значительно лучшие результаты по сравнению с o1 при выполнении сложных задач, включая программирование, математику и науки. OpenAI сообщила, что o3 набрала 87,7 % по тесту GPQA Diamond, который включает вопросы по науке экспертного уровня, недоступные в открытом доступе[7].

На SWE-bench Verified — бенчмарке по программной инженерии, оценивающем способность решать реальные проблемы с GitHub, o3 набрала 71,7 %, тогда как o1 — 48,9 %. На платформе Codeforces o3 набрала 2727 баллов по рейтингу Эло, в то время как o1 – 1891 балл[7].

На бенчмарке Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI), оценивающем способность ИИ решать новые, сложные задачи по логике и освоению навыков, точность o3 оказалась в три раза выше, чем у o1[1][8].

См. также

Примечания

  1. 1 2 3 Will Knight. OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills (англ.) // Wired. — ISSN 1059-1028.
  2. Metz, Cade. OpenAI Unveils New A.l. That Can 'Reason' Through Math and Science Problems. The New York Times (20 декабря 2024).
  3. Warren, Tom. OpenAI launches new o3-mini reasoning model with a free ChatGPT version (амер. англ.). The Verge (31 января 2025). Дата обращения: 2 февраля 2025.
  4. Early access for safety testing. OpenAI (20 декабря 2024).
  5. Franzen, Carl. It’s here: OpenAI’s o3-mini advanced reasoning model arrives to counter DeepSeek’s rise (амер. англ.). VentureBeat (31 января 2025). Дата обращения: 1 февраля 2025.
  6. Wiggers, Kyle; Zeff, Maxwell. OpenAI announces new o3 models (амер. англ.). TechCrunch (20 декабря 2024). Дата обращения: 22 декабря 2024.
  7. 1 2 David, Emilia; Franzen, Carl. OpenAI confirms new frontier models o3 and o3-mini (амер. англ.). VentureBeat (20 декабря 2024). Дата обращения: 26 декабря 2024.
  8. Hsu, Jeremy. OpenAI's o3 model aced a test of AI reasoning – but it's still not AGI (амер. англ.). New Scientist (20 декабря 2024). Дата обращения: 22 декабря 2024.
No tags for this post.