На фоне недавнего рывка китайской модели DeepSeek, угрожавшей лидерству OpenAI, американская компания представила свою новую разработку — o3-mini. Это первый из серии симулированных моделей рассуждения, который OpenAI делает доступным бесплатно для всех пользователей. Компания заявляет, что эта модель устанавливает новые границы для компактных ИИ, превосходя предшественников в науке, математике и программировании.
Чем o3-mini лучше предшественников?
Как и предшественник o1-mini, новый ИИ ориентирован на точность в STEM-дисциплинах, но работает быстрее и допускает меньше ошибок. Разработчики ввели три уровня сложности рассуждений, позволяя пользователям балансировать между скоростью и точностью ответов.
Минимальный уровень – по точности соответствует o1-mini.
Средний уровень – на 24% быстрее предшественника и реже ошибается.
Максимальный уровень – догоняет или превосходит полноразмерную модель o1 в математике и кодинге.
Тесты показали, что число критических ошибок снизилось на 39%, а пользователи предпочли ответы o3-mini в 56% случаев. При этом время отклика сократилось с 10,16 до 7,7 секунд.
ИИ с интернет-доступом? Уже скоро!
Одна из самых амбициозных функций o3-mini — встроенный механизм поиска. Это ранний прототип, который в перспективе позволит модели находить актуальные данные в сети и приводить ссылки на источники. Если эта технология будет доведена до ума, ИИ от OpenAI сможет конкурировать с поисковыми системами, предоставляя не только анализ информации, но и достоверные факты из сети.
Новый стандарт доступности
Впервые OpenAI предлагает бесплатный доступ к симулированной модели рассуждения. Теперь пользователи ChatGPT без подписки могут выбрать режим "Reason" в интерфейсе и использовать возможности ИИ наравне с платными пользователями.
Тем, кто оформил подписку Plus, Team или Pro, теперь доступен o3-mini вместо устаревшего o1-mini. Причем лимит сообщений увеличен в три раза – со 50 до 150 в день.
Саморазвитие? Пока нет
Несмотря на очевидные улучшения, OpenAI честно признает, что o3-mini не способен к самообучению и плохо справляется с заданиями, требующими анализа машинного обучения. В тесте на возможность автоматизированного написания кода на уровне инженеров OpenAI модель получила 0 баллов из 100.
Однако, учитывая прогресс и стабильное снижение количества ошибок, o3-mini показывает, что компактные модели могут становиться все более мощными. OpenAI явно готовит почву для следующего шага в развитии ИИ — вопрос лишь в том, насколько далеко компания готова зайти в гонке технологий.