OpenAI推ChatGPT新功能「Deep Research」 HLE測試準確率超越DeepSeek R1
OpenAI公布,推出ChatGPT的新功能「Deep Research」,是一項全新的智能代理能力,能針對複雜任務在網絡上進行多步驟研究,能在數十分鐘內完成人類需要花費數小時才能完成的工作。用戶只需給出提示,ChatGPT便會查找、分析和整合數百個網絡資源,撰寫出一份達到研究分析師水平的綜合報告。
「Deep Research」由即將推出的OpenAI o3模型的特製版本提供支援,該版本針對網頁瀏覽和數據分析進行優化,並利用推理能力在互聯網上搜索、解讀和分析大量文本、圖像和 PDF文件,並根據所獲信息按需調整研究方向。
當中,在Humanity's Last Exam (HLE)測試中,「Deep Research」所使用的模型在專家級問題上達到26.6%的準確率,刷新之前的18.2%的紀錄。而DeepSeek的R1模型的準確率是9.4%。(jl/a)~
阿思達克財經新聞
網址: www.aastocks.com