OpenAI推ChatGPT新功能「Deep Research」 HLE測試準確率超越DeepSeek R1

2025-02-03 16:15:31 AASTOCKS

OpenAI公布，推出ChatGPT的新功能「Deep Research」，是一項全新的智能代理能力，能針對複雜任務在網絡上進行多步驟研究，能在數十分鐘內完成人類需要花費數小時才能完成的工作。用戶只需給出提示，ChatGPT便會查找、分析和整合數百個網絡資源，撰寫出一份達到研究分析師水平的綜合報告。

「Deep Research」由即將推出的OpenAI o3模型的特製版本提供支援，該版本針對網頁瀏覽和數據分析進行優化，並利用推理能力在互聯網上搜索、解讀和分析大量文本、圖像和 PDF文件，並根據所獲信息按需調整研究方向。

當中，在Humanity's Last Exam (HLE)測試中，「Deep Research」所使用的模型在專家級問題上達到26.6%的準確率，刷新之前的18.2%的紀錄。而DeepSeek的R1模型的準確率是9.4%。(jl/a)~

阿思達克財經新聞
網址: www.aastocks.com