Meta推出超強語音AI 讓世界每種語言都能被自動辨識鄧天心 (2025-11-11 13:42:26)




Meta近日發表Omnilingual ASR自適應語音辨識模型,支援超過1600種語言──遠超OpenAI Whisper僅能處理的99種,更可利用「零樣本學習」讓AI現場學會新語言,推高理論支援數量達5400+,從語音科技競爭到文化平權,這是AI界難得一見的里程碑。記者鄧天心/綜合報導


Meta近日發表Omnilingual ASR自適應語音辨識模型,支援超過1600種語言,遠超OpenAI Whisper僅能處理的99種,更可利用「零樣本學習」讓AI現場學會新語言,推高理論支援數量達5400+,從語音科技競爭到文化平權,這是AI界難得一見的里程碑。


Meta此次釋出的Omnilingual ASR,是業界首套能直接支援1600多種語言的語音AI技術平台,最大亮點是內建「零樣本學習」機制,只要提供幾個語音+文字的例子,AI現場就能辨識新語言,徹底突破以往必須大量資料才能訓練AI的限制,可泛用於全球5400多種有書寫系統的語言,不只適合主流語種,也首次開放給少數民族、瀕危語言、方言。


[caption id="attachment_198163" align="aligncenter" width="1024"]

Meta近日發表Omnilingual ASR自適應語音辨識模型,支援超過1600種語言。(圖/Meta)[/caption]


延伸閱讀:


AI成職場標配!旭聯科技發表6雲端產品 打造數位人才培育生態系


Omnilingual ASR不但將模型、訓練資料與程式碼統一採用「Apache 2.0」開源授權,企業可直接用於商業部署、加工優化,無需另付使用費或面對Llama以往軟性限制,徹底降低跨語市場語音產品的門檻。


先前AI語音多侷限在大語種、本地化限制多、平台收費高,Meta此舉等同宣告:「世界上每一種語言,都值得被科技理解。」技術團隊強調:「沒有任何AI能預先囊括地球所有語言,但Omnilingual ASR讓社群能自己動手完善。」這對全球各地NGO、學術團隊、語言保存工作者都是重大利多。


今年Meta大型語言模型Llama 4評價不佳,反思後重新定錨AI路線,執行長馬克·祖克柏甚至砸下重金延攬Scale AI創辦人 Alexandr Wang 為首席AI長,大舉投資自主AI研發,Omnilingual ASR成了Meta重回開放、社群、包容性AI舞台的戰略代表作。


這套系統集合自監督wav2vec 2.0、語音-文字解碼、即時學習新語言等前沿技術,模型大小彈性(300M~70億參數),即便是偏鄉學校也可利用較小模型於一般設備部署。程式碼與資料全數上傳Github及Hugging Face,只需一行指令即可安裝使用。


以前想讓AI會本地語音,幾乎不可能,現在Meta Omnilingual ASR 把門檻徹底打破,無論是跨國教育、智慧客服、障礙輔助或地方語言都能被保存,保存古代的智慧供後人學習。


資料來源:AI at MetaVentureBeat


這篇文章 Meta推出超強語音AI 讓世界每種語言都能被自動辨識 最早出現於 科技島-掌握科技新聞、科技職場最新資訊

加密貨幣
比特幣BTC 89803.73 525.92 0.59%
以太幣ETH 3101.48 61.30 2.02%
瑞波幣XRP 2.07 0.04 1.84%
比特幣現金BCH 583.99 0.16 0.03%
萊特幣LTC 83.65 1.95 2.38%
卡達幣ADA 0.436490 0.02 5.45%
波場幣TRX 0.283156 0.00 -1.48%
恆星幣XLM 0.242431 0.00 1.14%
投資訊息
相關網站
股市服務區
行動版 電腦版
系統合作: 精誠資訊股份有限公司
資訊提供: 精誠資訊股份有限公司
資料來源: 台灣證券交易所, 櫃買中心, 台灣期貨交易所
依證券主管機關規定,使用本網站股票、期貨等金融報價資訊之會員,務請詳細閱讀「資訊用戶權益暨使用同意聲明書」並建議會員使用本網站資訊, 在金融和投資等方面,能具有足夠知識及經驗以判斷投資的價值與風險,同時會員也同意本網站所提供之金融資訊, 係供參考,不能做為投資交易之依據;若引以進行交易時,仍應透過一般合法交易管道,並自行判斷市場價格與風險。
請遵守台灣證券交易所『交易資訊使用管理辦法』等交易資訊管理相關規定本資料僅供參考,所有資料以台灣證券交易所、櫃買中心公告為準。 因網路傳輸問題造成之資料更新延誤,精誠資訊不負交易損失責任。