助力低階設備!Hugging Face推出超輕量AI模型SmolVLM
人工智慧(AI)開發平台Hugging Face團隊近日推出號稱是目前最小的AI模型SmolVLM-256M與SmolVLM-500M。這2款模型能夠處理圖像、短影片及文字,並專為低規格設備(如記憶體不足1GB的筆記型電腦)設計,適合需要低成本處理大量數據的開發者。
人工智慧(AI)開發平台Hugging Face團隊近日推出號稱是目前最小的AI模型SmolVLM-256M與SmolVLM-500M。這2款模型能夠處理圖像、短影片及文字,並專為低規格設備(如記憶體不足1GB的筆記型電腦)設計,適合需要低成本處理大量數據的開發者。
[caption id="attachment_161347" align="alignnone" width="1200"]
AI開發平台Hugging Face團隊近日推出號稱是目前最小的AI模型SmolVLM-256M與SmolVLM-500M。(圖/取自 Hugging Face 官網)[/caption]
2.56億與5億參數AI模型
據報導,SmolVLM-256M和SmolVLM-500M的參數規模分別為2.56億和5億。參數數量通常反映模型解決問題的能力,例如數學測試的表現。這兩款模型可執行圖像或影片描述,並能回答與PDF文件相關的問題,包括掃描文本和圖表分析等。
更多新聞:OpenAI最新AI模型o3 mini最終版來了 推理能力與功能更強大
依賴高品質數據集訓練
Hugging Face團隊使用自家開發的高品質數據集「The Cauldron」及文件掃描數據集「Docmatix」對這兩款模型進行訓練。這些數據集由Hugging FaceM4團隊建立,專注於多模態AI技術的研發,為SmolVLM提供了充足的圖像與文本配對訓練資源。
性能超越大模型Idefics80B
Hugging Face團隊表示,SmolVLM-256M和SmolVLM-500M在多項基準測試中超越了參數規模高達800億的Idefics80B,尤其是在AI2D測試中表現出色。AI2D主要測試AI對小學科學圖表的分析能力,顯示SmolVLM在處理科學圖示時具有競爭力。
這兩款輕量AI模型目前已可在Hugging Face網站上免費下載,並採用Apache 2.0授權,允許開發者無限制地使用,為需要低成本AI解決方案的企業與個人提供便利。
小型AI模型的潛在局限性
儘管SmolVLM具有低成本和高靈活性的優勢,但小型模型仍存在一定局限。根據Google DeepMind、微軟研究院及加拿大Mila研究機構的最新研究,較小的AI模型在處理複雜推理任務時表現不佳,可能因其僅識別表層模式,難以應用於新情境。
小型AI模型仍有成長空間
雖然小型AI模型在某些高階任務上仍有改進空間,但隨著技術進步及訓練數據的優化,這類輕量AI未來有望在更多領域發揮重要作用,特別是在資源受限的設備上。
參考資料:Tech Crunch
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
這篇文章 助力低階設備!Hugging Face推出超輕量AI模型SmolVLM 最早出現於 科技島-掌握科技新聞、科技職場最新資訊。