Anton Dolin

OpenAI o1 — это генеративная предварительно обученная трансформерная модель (GPT). Превью o1 было выпущено компанией OpenAI 12 сентября 2024 года. o1 затрачивает время на «размышления» перед ответом, что делает его более способным к сложным задачам рассуждения, научным и программным задачам по сравнению с GPT-4o[1]. Полная версия была выпущена для пользователей ChatGPT 5 декабря 2024 года[2].

История

Предыстория

Согласно утечкам информации, o1 ранее был известен внутри OpenAI как «Q*», а затем как «Strawberry»[3]. Кодовое название «Q*» впервые появилось в ноябре 2023 года, во время отстранения и последующего восстановления Сэма Альтмана, когда появились слухи, что эта экспериментальная модель показала многообещающие результаты в математических тестах[4]. В июле 2024 года Reuters сообщил, что OpenAI разрабатывает генеративную предварительно обученную трансформерную модель, известную как «Strawberry»[3], которая позже стала o1.

Выпуск

«o1-preview» и «o1-mini» были выпущены 12 сентября 2024 года для пользователей ChatGPT Plus и Team[1]. GitHub начал тестировать интеграцию o1-preview в своей службе Copilot в тот же день[5]. 5 декабря 2024 года была выпущена полная версия o1[6].

Возможности

OpenAI утверждает, что o1 был обучен с использованием нового алгоритма оптимизации и специально подобранного набора данных, а также интеграции обучения с подкреплением в процесс обучения[7]. С января 2025 года, использование API для полной модели o1 будет ограничено для разработчиков и будет тарифицироваться пользователям по ценам уровня 5[8]. По словам OpenAI, o1 не заменяет GPT-4o, а дополняет его[9][10].

o1 затрачивает дополнительное время на размышления (генерацию цепочки рассуждений), что делает его лучше при решении сложных задач, особенно в науке и математике[1].

Ограничения

o1 требует больше вычислительных ресурсов, чем другие модели GPT от OpenAI, так как генерирует длинные цепочки рассуждений перед выдачей ответа[11].

См. также

Примечания

  1. 1 2 3 Metz, Cade. OpenAI Unveils New ChatGPT That Can Reason Through Math and Science. The New York Times (12 сентября 2024). Дата обращения: 12 сентября 2024.
  2. Introducing OpenAI o1. OpenAI. Дата обращения: 6 декабря 2024.
  3. 1 2 Tong, Anna; Paul, Katie. Exclusive: OpenAI working on new reasoning technology under code name 'Strawberry'. Reuters (15 июля 2024). Дата обращения: 12 сентября 2024.
  4. OpenAI researchers warned board of AI breakthrough ahead of CEO ouster, sources say. Reuters. 2023-11-23.
  5. Peters, Jay. GitHub has started testing OpenAI's o1-preview in GitHub Copilot. The Verge (12 сентября 2024). Дата обращения: 12 сентября 2024.
  6. Robison, Kylie (2024-12-05). OpenAI is charging $200 a month for an exclusive version of its o1 'reasoning' model. The Verge. Дата обращения: 2024-12-05.
  7. Robison, Kylie. OpenAI releases o1, its first model with 'reasoning' abilities (англ.). The Verge (12 сентября 2024). Дата обращения: 15 сентября 2024.
  8. OpenAI o1 and new tools for developers (амер. англ.). openai.com. Дата обращения: 26 января 2025.
  9. Knight, Will. OpenAI Announces a New AI Model, Code-Named Strawberry, That Solves Difficult Problems Step by Step. Wired (англ.). ISSN 1059-1028. Дата обращения: 2024-09-15.
  10. New reasoning models: OpenAI o1-preview and o1-mini (англ.). OpenAI Developer Forum (12 сентября 2024). Дата обращения: 17 октября 2024.
  11. Learning to Reason with LLMs. OpenAI. Дата обращения: 13 сентября 2024. Архивировано 12 сентября 2024 года.
No tags for this post.