OpenAI與DeepSeek都靠邊!美國大學僅用50美元開發AI模型李佩璇 (2025-02-07 11:25:23)




史丹佛與華盛頓大學的一組研究團隊開發了一種成本不到50美元的人工智慧推理模型S1。在涉及數學與編碼的測試中,S1的表現甚至能媲美OpenAI的o1和DeepSeek的R1等尖端模型。編譯/高晟鈞


史丹佛與華盛頓大學的一組研究團隊開發了一種成本不到50美元的人工智慧推理模型S1。在涉及數學與編碼的測試中,S1的表現甚至能媲美OpenAI的o1和DeepSeek的R1等尖端模型。


[caption id="attachment_163391" align="alignnone" width="1200"]

國外開發了一種成本不到50美元的人工智慧推理模型S1。在涉及數學與編碼的測試中,S1的表現甚至能媲美OpenAI的o1和DeepSeek的R1等尖端模型。(圖/取自OpenAI官網)[/caption]


S1是怎麼做到的


研究團隊使用現成的基礎模型來開發S1,他們將此過程比喻為一種「提煉、萃取」的改造流程。就像從玫瑰中萃取精華一樣,S1 從 Google的推理模型之一Gemini 2.0 Flash Thinking Experiment中提煉出來的。透過這種方式,研究人員創建一個使用小型資料集,推理能力卻非常相對強大的模型。這相當於你能透過「效仿」其他模型的解答來進行訓練,並創建一個成本相對低廉,運算能力卻幾乎相當的AI模型,至少DeepSeek就是這麼做的。


更多新聞: TrendForce:DeepSeek帶動AI模型低成本化!「光收發模組」將扮演重要角色


S1模型使用僅包含1,000個精選問題和答案的小型資料集進行訓練,其中包括Google的Gemini 2.0每個答案背後的原因。儘管數據集很小,但該模型在AI基準測試中的表現令人印象深刻。事實上,它僅在16個Nvidia H100 GPU上訓練 30 分鐘後就取得了這些成果,成本約為50美元。這強化了這樣一種觀點:人工智慧的強大性能並不一定需要大量數據或昂貴的資源。


研究人員還添加了一個巧妙的組件來增強模型的推理能力。S1模型在運算時會進行一種特殊流程──「等待」,簡單來說就是暫停運算,從而有更多時間得出更精確的答案。這種策略顯著提高了S1答案的精確度。


人工智慧模型的商品化


DeepSeek的開源和開發方式,無疑成功引發了人們對AI模型「商品化」的質疑,S1模型就是最好的一個例子。人們對大規模人工智慧開發的未來以及主要人工智慧實驗室的競爭格局感到擔憂。如果一個小型研究團隊能夠以最少的資源取得這樣的成果,這對未來的人工智慧研究和開發有何影響?


當然,對於學術或者個人研究來說,S1這種極具成本效益的人工智慧模型,絕對能對科學和研究領域產生積極影響,並帶動科學的整體發展。當然,就商業層面來說,此舉也引發了業界對於AI知識產權與道德的擔憂。倘若未來AI仍舊不受版權保護,這種「萃取」式的開發過程很可能將引起許多激進的爭執與行為。



資料來源:Interesting Engineering


※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!


這篇文章 OpenAI與DeepSeek都靠邊!美國大學僅用50美元開發AI模型 最早出現於 科技島-掌握科技新聞、科技職場最新資訊

加密貨幣
比特幣BTC 87959.86 1,888.93 2.19%
以太幣ETH 2065.89 60.17 3.00%
瑞波幣XRP 2.46 0.02 1.01%
比特幣現金BCH 334.88 9.60 2.95%
萊特幣LTC 93.54 2.13 2.33%
卡達幣ADA 0.749037 0.04 5.57%
波場幣TRX 0.228520 0.00 -0.63%
恆星幣XLM 0.293066 0.01 3.59%
投資訊息
相關網站
股市服務區
行動版 電腦版
系統合作: 精誠資訊股份有限公司
資訊提供: 精誠資訊股份有限公司
資料來源: 台灣證券交易所, 櫃買中心, 台灣期貨交易所
依證券主管機關規定,使用本網站股票、期貨等金融報價資訊之會員,務請詳細閱讀「資訊用戶權益暨使用同意聲明書」並建議會員使用本網站資訊, 在金融和投資等方面,能具有足夠知識及經驗以判斷投資的價值與風險,同時會員也同意本網站所提供之金融資訊, 係供參考,不能做為投資交易之依據;若引以進行交易時,仍應透過一般合法交易管道,並自行判斷市場價格與風險。
請遵守台灣證券交易所『交易資訊使用管理辦法』等交易資訊管理相關規定本資料僅供參考,所有資料以台灣證券交易所、櫃買中心公告為準。 因網路傳輸問題造成之資料更新延誤,精誠資訊不負交易損失責任。