Deep Research от OpenAI
Ссылка на первоисточник: https://openai.com/index/introducing-deep-research
OpenAI представила Deep Research — продвинутый агент в составе ChatGPT, предназначенный для проведения многоэтапных онлайн-исследований по сложным задачам. Этот инструмент автоматизирует процессы, которые обычно занимают у людей часы, что делает его незаменимым помощником в работе, требующей глубоких знаний и интенсивных исследований.
На данный момент Deep Research доступен только для пользователей Pro, однако в ближайшее время он станет доступен для Plus и Team пользователей.
Как работает Deep Research
Deep Research — это искусственный интеллект, который был обучен с использованием метода обучения с подкреплением (англ. reinforcement learning) для решения сложных задач по поиску информации и анализу в различных областях. Он способен:
- Планировать и проводить многошаговые исследования.
- Отслеживать и реагировать на изменения в информации в реальном времени.
- Просматривать загруженные пользователем файлы.
- Создавать и встраивать графики с помощью Python.
- Цитировать конкретные фрагменты из источников.
Эти функции значительно повышают качество решений, которые принимаются в реальных задачах и исследовательской деятельности.
Тест Humanity's Last Exam
Deep Research продемонстрировал впечатляющий уровень точности, составив 26,6% в тесте Humanity's Last Exam, который включает 3 000 сложных вопросов по более чем 100 различным предметам. По сравнению с другими моделями искусственного интеллекта, он особенно хорошо показал себя в областях химии, гуманитарных и социальных наук, а также математики, эффективно извлекая специализированную информацию.
Модель | Точность (%) |
---|---|
GPT-4o | 3.3 |
Grok-2 | 3.8 |
Claude 3.5 Sonnet | 4.3 |
Gemini Thinking | 6.2 |
OpenAI o1 | 9.1 |
DeepSeek-R1* | 9.4 |
OpenAI o3-mini (medium)* | 10.5 |
OpenAI o3-mini (high)* | 13.0 |
OpenAI deep research** | 26.6 |
GAIA Benchmark
Deep Research представил новый эталон (SOTA) в рамках теста GAIA, который оценивает способность решать задачи различной сложности в реальных условиях. Этот подход значительно превосходит предыдущие модели в логическом анализе, понимании многомодальных данных, поиске в интернете и использовании инструментов.
Уровень сложности | Уровень 1 | Уровень 2 | Уровень 3 | Средн. |
---|---|---|---|---|
Предыдущий SOTA | 67.92 | 67.44 | 42.31 | 63.64 |
Deep Research (pass@1) | 74.29 | 69.06 | 47.6 | 67.36 |
Deep Research (cons@64) | 78.66 | 73.21 | 58.03 | 72.57 |
Задачи экспертного уровня
Внутренние тесты показывают, что Deep Research может автоматизировать часы сложных исследований в различных областях, таких как финансы, наука, государственная политика и инженерия. Технология повышает точность благодаря многоэтапному поиску, прежде чем предложить окончательный ответ.
Для чего был создан Deep Research
Deep Research — инструмент, созданный для помощи профессионалам в проведении точных и детализированных исследований. Он особенно полезен для:
- Финансовых, научных, политических и инженерных изысканий.
- Поиска сложной и узкоспециализированной информации.
- Составления подробных и проверяемых отчетов.
- Создания персонализированных рекомендаций, например, по покупкам.
Deep Research, опираясь на логику и возможности веб-поиска, помогает устранить недостатки в извлечении и анализе информации, приближая OpenAI к цели создания искусственного интеллекта, способного на научные открытия.
Deep Research в ChatGPT
- В поле ввода выберите опцию Deep Research.
- Задайте свой запрос, например, проанализируйте конкурентов, сравните продукты или создайте исследовательский отчет.
- При необходимости загрузите файлы или таблицы для дополнительного контекста.
Через некоторое время (от 5 до 30 минут) Вы получите уведомление о завершении исследования. В отчет будут включены цитаты, встроенные изображения и графики (в ближайшем будущем).
Ограничения
Хотя Deep Research значительно повышает эффективность исследований, у него есть некоторые недостатки:
- Иногда он может выдавать ошибочные факты или делать неверные выводы, хотя и реже, чем другие модели ChatGPT.
- Иногда ему сложно отличить авторитетные источники от слухов.
- Не всегда корректно оценивает уровень своей уверенности в ответах.
- Возможны ошибки в форматировании отчетов и цитат.
- Исследование может занимать некоторое время перед запуском.
С развитием модели эти недостатки будут постепенно уменьшаться.
Доступ
Deep Research — это ресурсоёмкий инструмент, который в настоящее время доступен только пользователям уровня Pro с лимитом до 100 запросов в месяц. В ближайшее время он станет доступен для пользователей Plus, Team и Enterprise. На данный момент доступ к нему ограничен в Великобритании, Швейцарии и странах Европейской экономической зоны, однако OpenAI активно работает над расширением географии.
Вскоре появится более эффективная версия Deep Research с меньшими вычислительными затратами, что позволит увеличить лимиты запросов для платных пользователей.
Что нас ждет
Расширение доступа
Deep Research уже доступен в веб-версии ChatGPT и в скором времени будет представлен в мобильных и настольных приложениях.
Дополнительные источники данных
В будущем будут интегрированы подписочные и внутренние ресурсы для более качественных исследований.
Расширенные агентные возможности
Deep Research будет интегрирован с OpenAI Operator, что позволит ему выполнять реальные задачи в дополнение к онлайн-исследованиям.