Nvidia推新的AI訓練法 在預訓練階段就引入「思考過程」鄧天心 (2025-10-13 15:46:40)




Nvidia的研究團隊近日提出一種全新的大型語言模型(Large Language Models, LLMs)訓練方法,能在模型的預訓練階段就培養出「推理思考」能力,顛覆了既有AI學習架構的設計思維,AI推理能力正從「後期微調」邁向「前期內建」,或將重塑下一代生成式AI的基礎。記者鄧天心/綜合報導


Nvidia的研究團隊近日提出一種全新的大型語言模型(Large Language Models, LLMs)訓練方法,能在模型的預訓練階段就培養出「推理思考」能力,顛覆了既有AI學習架構的設計思維,AI推理能力正從「後期微調」邁向「前期內建」,或將重塑下一代生成式AI的基礎。


[caption id="attachment_195099" align="aligncenter" width="946"]

Nvidia的研究團隊近日提出一種全新的大型語言模型(Large Language Models, LLMs)訓練方法,能在模型的預訓練階段就培養出「推理思考」能力,顛覆了既有AI學習架構的設計思維。(圖/NVIDIA)[/caption]


延伸閱讀:


Meta Reels推出AI即時翻譯功能 能自動配音、同步口型


現有的大型語言模型,如ChatGPT或Claude,多數在訓練初期僅透過大量文本學習語言結構與關聯,並在完成語言建模後,額外透過微調(fine-tuning)或提示工程(prompt engineering)來提升推理與邏輯能力,這種流程導致模型「懂語言但不懂邏輯」,能回答語法正確的句子,卻無法真正模擬人類的思考過程。


Nvidia研究團隊提出的方法,則是在預訓練階段就引入「思考過程」的模擬。具體而言,模型不只是預測下一個字詞,而是同時生成內部的「思考軌跡」(internal reasoning traces),讓AI在理解內容時主動推演、驗證並調整其推理邏輯,這種作法可被視為為模型注入「內在對話機制」,讓AI不再只是被動輸出答案,而能在過程中學會思考。


初步實驗顯示,使用該訓練方法的語言模型,在數學推理、程式邏輯、甚至複雜文字理解等多項基準測試中,均顯示出顯著進步,特別是在需要多步推理(multi-step reasoning)的任務上表現最為突出。


資料來源:VentureBeatNVIDIA


這篇文章 Nvidia推新的AI訓練法 在預訓練階段就引入「思考過程」 最早出現於 科技島-掌握科技新聞、科技職場最新資訊

加密貨幣
比特幣BTC 90282.87 1,005.06 1.13%
以太幣ETH 3112.90 72.72 2.39%
瑞波幣XRP 2.08 0.05 2.33%
比特幣現金BCH 580.64 -3.19 -0.55%
萊特幣LTC 83.76 2.06 2.52%
卡達幣ADA 0.434486 0.02 4.97%
波場幣TRX 0.283840 0.00 -1.25%
恆星幣XLM 0.242634 0.00 1.23%
投資訊息
相關網站
股市服務區
行動版 電腦版
系統合作: 精誠資訊股份有限公司
資訊提供: 精誠資訊股份有限公司
資料來源: 台灣證券交易所, 櫃買中心, 台灣期貨交易所
依證券主管機關規定,使用本網站股票、期貨等金融報價資訊之會員,務請詳細閱讀「資訊用戶權益暨使用同意聲明書」並建議會員使用本網站資訊, 在金融和投資等方面,能具有足夠知識及經驗以判斷投資的價值與風險,同時會員也同意本網站所提供之金融資訊, 係供參考,不能做為投資交易之依據;若引以進行交易時,仍應透過一般合法交易管道,並自行判斷市場價格與風險。
請遵守台灣證券交易所『交易資訊使用管理辦法』等交易資訊管理相關規定本資料僅供參考,所有資料以台灣證券交易所、櫃買中心公告為準。 因網路傳輸問題造成之資料更新延誤,精誠資訊不負交易損失責任。