地表最快語言模型?蘋果新模型FS-DFM 實現長文本生成速度提升128倍Mily (2025-10-15 10:37:07)




蘋果公司(Apple)研究人員在與俄亥俄州立大學的合作研究中,發表了一款名為 「少步驟離散流匹配」(Few-Step Discrete Flow-Matching, FS-DFM)的新型語言模型。該模型在長文本生成方面展現出革命性進展,其寫作速度最高可比同類模型快上128倍,同時維持極高品質。記者孟圓琦/編譯


蘋果公司(Apple)研究人員在與俄亥俄州立大學的合作研究中,發表了一款名為 「少步驟離散流匹配」(Few-Step Discrete Flow-Matching, FS-DFM)的新型語言模型。該模型在長文本生成方面展現出革命性進展,其寫作速度最高可比同類模型快上128倍,同時維持極高品質。


[caption id="attachment_195325" align="alignnone" width="693"]

“ FS-DFM:使用少步擴散語言模型快速準確地生成長文本”的研究中,來自蘋果公司和俄亥俄州立大學的研究人員提出了一種名為少步離散流匹配(FS-DFM)的新模型,執行更大、更準確的更新,而不會「超出」預期文字。(圖/AI生成)[/caption]


傳統的語言模型(如 ChatGPT 所使用的 LLM)屬於自迴歸模型(Autoregressive Models),必須依序一個詞元(token)一個詞元地生成文本。與之相對的擴散模型(Diffusion Models)雖然能夠平行生成多個詞元,但往往需要數百甚至上千次的疊代修正才能產生最終結果。


延伸閱讀:

年底換機潮來襲!蘋果副總推文藏彩蛋、預告「怪獸級」MacBook Pro

告別 Plus!蘋果串流服務正式更名「Apple TV」解決名稱混亂


核心技術與優勢


這項名為《FS-DFM:使用少步驟擴散語言模型實現快速準確的長文本生成》的研究指出,FS-DFM 模型僅需八次快速修正,便能生成與需要超過一千個步驟的擴散模型品質相當的完整長篇段落。研究人員採用了精巧的三步驟方法來達成此一突破:




  • 訓練模型:


    使其能夠適應不同次數的修正預算。



  • 引入指導:


    使用一個引導性的「教師模型」(Teacher Model),幫助 FS-DFM 在每次迭代時進行更大、更精確的更新,同時避免文本「過度修正」。



  • 迭代優化:


    調整每次迭代的工作方式,使模型能以更少且更穩定的步驟達到最終結果。



  • 卓越的效能表現


    在兩個關鍵的文本品質衡量指標上,FS-DFM 的表現優於現有大型擴散模型。困惑度(Perplexity)是用於衡量文本自然度和準確度的標準指標,分數越低代表文本越流暢自然;熵(Entropy)則衡量模型選擇每個詞的信心,適度的熵值能確保文本既不重複單調,也不隨機 incoherence。


    與參數高達 70 億的 Dream 擴散模型和 80 億的 LLaDA 擴散模型相比,參數規模僅有 17 億、13 億甚至 1.7 億的 FS-DFM 變體,在所有迭代次數下,均能持續達到更低的困惑度,並保持更穩定的熵值。


    研究人員表示,鑑於這項方法所展現的卓越成果,以及目前類似模型研究的缺乏,他們計畫「發布程式碼和模型檢查點,以促進重現性與進一步的研究」。業界預期,這項技術的開源將加速高效能長文本生成領域的發展。相關實施細節與技術探討,可參閱發表於 arXiv 上的完整論文


    資料來源:9to5mac完整論文


    這篇文章 地表最快語言模型?蘋果新模型FS-DFM 實現長文本生成速度提升128倍 最早出現於 科技島-掌握科技新聞、科技職場最新資訊

    加密貨幣
    比特幣BTC 90105.73 827.92 0.93%
    以太幣ETH 3114.17 73.99 2.43%
    瑞波幣XRP 2.08 0.05 2.33%
    比特幣現金BCH 578.04 -5.79 -0.99%
    萊特幣LTC 83.39 1.69 2.07%
    卡達幣ADA 0.433238 0.02 4.66%
    波場幣TRX 0.283784 0.00 -1.27%
    恆星幣XLM 0.241705 0.00 0.84%
    投資訊息
    相關網站
    股市服務區
    行動版 電腦版
    系統合作: 精誠資訊股份有限公司
    資訊提供: 精誠資訊股份有限公司
    資料來源: 台灣證券交易所, 櫃買中心, 台灣期貨交易所
    依證券主管機關規定,使用本網站股票、期貨等金融報價資訊之會員,務請詳細閱讀「資訊用戶權益暨使用同意聲明書」並建議會員使用本網站資訊, 在金融和投資等方面,能具有足夠知識及經驗以判斷投資的價值與風險,同時會員也同意本網站所提供之金融資訊, 係供參考,不能做為投資交易之依據;若引以進行交易時,仍應透過一般合法交易管道,並自行判斷市場價格與風險。
    請遵守台灣證券交易所『交易資訊使用管理辦法』等交易資訊管理相關規定本資料僅供參考,所有資料以台灣證券交易所、櫃買中心公告為準。 因網路傳輸問題造成之資料更新延誤,精誠資訊不負交易損失責任。