Aja viide. Aja lugu.

OpenAI o3 — это генеративная предварительно обученная трансформерная модель (GPT), разработанная OpenAI в качестве преемника OpenAI o1. Она предназначена для того, чтобы уделять дополнительное время обдумыванию при ответах на вопросы, требующие пошагового логического рассуждения^[1]^[2]. Полная версия была выпущена для пользователей ChatGPT 31 января 2025 года^[3].

История

Модель OpenAI o3 была анонсирована 20 декабря 2024 года, при этом обозначение «o3» было выбрано для избежания конфликта с товарным знаком мобильного оператора O2. Модель доступна в двух версиях: o3 и o3-mini. OpenAI пригласила исследователей в области безопасности и защиты для подачи заявок на ранний доступ к этим моделям до 10 января 2025 года^[1]^[4]. 31 января 2025 года OpenAI выпустила o3-mini для всех пользователей ChatGPT (включая бесплатный тариф) и пользователей API. Также была выпущена более мощная модель — o3-mini-high^[5].

Возможности

Для обучения o3 перед генерацией ответов использовалось обучение с подкреплением, при этом применялся подход, который OpenAI называет «частной цепочкой рассуждений». Этот метод позволяет модели планировать наперёд и последовательно обрабатывать задачи, выполняя серию промежуточных этапов рассуждения для помощи в решении проблемы, что требует дополнительных вычислительных ресурсов и увеличивает задержку ответов^[6].

Модель o3 демонстрирует значительно лучшие результаты по сравнению с o1 при выполнении сложных задач, включая программирование, математику и науки. OpenAI сообщила, что o3 набрала 87,7 % по тесту GPQA Diamond, который включает вопросы по науке экспертного уровня, недоступные в открытом доступе^[7].

На SWE-bench Verified — бенчмарке по программной инженерии, оценивающем способность решать реальные проблемы с GitHub, o3 набрала 71,7 %, тогда как o1 — 48,9 %. На платформе Codeforces o3 набрала 2727 баллов по рейтингу Эло, в то время как o1 – 1891 балл^[7].

На бенчмарке Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI), оценивающем способность ИИ решать новые, сложные задачи по логике и освоению навыков, точность o3 оказалась в три раза выше, чем у o1^[1]^[8].

См. также

Примечания

↑ ¹ ² ³ Will Knight. OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills (англ.) // Wired. — ISSN 1059-1028.
↑ Metz, Cade. OpenAI Unveils New A.l. That Can 'Reason' Through Math and Science Problems (неопр.). The New York Times (20 декабря 2024).
↑ Warren, Tom. OpenAI launches new o3-mini reasoning model with a free ChatGPT version (амер. англ.). The Verge (31 января 2025). Дата обращения: 2 февраля 2025.
↑ Early access for safety testing (неопр.). OpenAI (20 декабря 2024).
↑ Franzen, Carl. It’s here: OpenAI’s o3-mini advanced reasoning model arrives to counter DeepSeek’s rise (амер. англ.). VentureBeat (31 января 2025). Дата обращения: 1 февраля 2025.
↑ Wiggers, Kyle; Zeff, Maxwell. OpenAI announces new o3 models (амер. англ.). TechCrunch (20 декабря 2024). Дата обращения: 22 декабря 2024.
↑ ¹ ² David, Emilia; Franzen, Carl. OpenAI confirms new frontier models o3 and o3-mini (амер. англ.). VentureBeat (20 декабря 2024). Дата обращения: 26 декабря 2024.
↑ Hsu, Jeremy. OpenAI's o3 model aced a test of AI reasoning – but it's still not AGI (амер. англ.). New Scientist (20 декабря 2024). Дата обращения: 22 декабря 2024.

[:3-1] ¹ ² ³ Will Knight. OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills (англ.) // Wired. — ISSN 1059-1028.

[2] Metz, Cade. OpenAI Unveils New A.l. That Can 'Reason' Through Math and Science Problems (неопр.). The New York Times (20 декабря 2024).

[3] Warren, Tom. OpenAI launches new o3-mini reasoning model with a free ChatGPT version (амер. англ.). The Verge (31 января 2025). Дата обращения: 2 февраля 2025.

[4] Early access for safety testing (неопр.). OpenAI (20 декабря 2024).

[5] Franzen, Carl. It’s here: OpenAI’s o3-mini advanced reasoning model arrives to counter DeepSeek’s rise (амер. англ.). VentureBeat (31 января 2025). Дата обращения: 1 февраля 2025.

[:1-6] Wiggers, Kyle; Zeff, Maxwell. OpenAI announces new o3 models (амер. англ.). TechCrunch (20 декабря 2024). Дата обращения: 22 декабря 2024.

[:2-7] ¹ ² David, Emilia; Franzen, Carl. OpenAI confirms new frontier models o3 and o3-mini (амер. англ.). VentureBeat (20 декабря 2024). Дата обращения: 26 декабря 2024.

[:0-8] Hsu, Jeremy. OpenAI's o3 model aced a test of AI reasoning – but it's still not AGI (амер. англ.). New Scientist (20 декабря 2024). Дата обращения: 22 декабря 2024.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Искусственный интеллект
История	Вычислительные машины и разум Зима искусственного интеллекта Бум искусственного интеллекта Джорджтаунский эксперимент Дартмутский семинар Отчёт Лайтхилла Регламент ЕС Гонка вооружений в области искусственного интеллекта Холодная война за искусственный интеллект
Философия	Тест Тьюринга Китайская комната Сильный и слабый искусственные интеллекты Дружественный искусственный интеллект Этика искусственного интеллекта Проблема контроля
Направления	Агентный подход Адаптивное управление Генеративный ИИ Инженерия знаний Модель жизнеспособной системы Машинное обучение Нейронная сеть Нечёткая логика Обработка естественного языка Персональный искусственный интеллект Распознавание образов Роевой интеллект Символический ИИ Эволюционные алгоритмы Экспертная система
Применение	Голосовое управление Задача классификации Классификация документов Кластеризация документов Кластерный анализ Локальный поиск Машинный перевод Оптическое распознавание символов Распознавание речи Распознавание рукописного ввода Игровой ИИ
Исследователи	Чарлз Бэббидж Владимир Вапник Джозеф Вейценбаум Норберт Винер Виктор Глушков Владимир Городецкий Рэймонд Курцвейл Ян Лекун Алексей Ляпунов Джон Маккарти Марвин Мински Аллен Ньюэлл Сеймур Пейперт Джуда Перл Гермоген Поспелов Дмитрий Поспелов Фрэнк Розенблатт Герберт Саймон Алан Тьюринг Патрик Уинстон Виктор Финн Сергей Фомин Демис Хассабис Джеффри Хинтон Ноам Хомский Клод Шеннон Эндрю Ын Элиезер Юдковский

E	T	K	N	R	L	P
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Aja viide. Aja lugu.

Värsked postitused

Most Used Categories

Soomes tuleb uus streik

USA relvaabi lennukid pöörasid õhus ringi, kui Trump andis esmaspäeval korralduse lõpetada abi saatmine Ukrainale

Kaasiku pani hindeks nelja miinuse: kvalifikatsioon oli väga hea, finaalis jäi puudu

Pärnu Fotofest viib avastama loodusliku ja tehisliku suhet

Rutiinne töö.“ Ukrainal läks korda maksta venelastele kätte nende treeningvälja verise rünnaku eest

Krahh Dallases: Irvingu hooaeg sai põlvevigastuse tõttu läbi

Türgi ehitab tara Kreeka piirile

Uus areng: Hiina tahab saata sõdurid Ukrainasse

Kas sul on selline? Selle Muumitassi hind on 1500 eurot

Martin Helme

Содержание

История

Возможности

См. также

Примечания