91精品无码人妻在线,国产最新三级强a乱在线看

Hugging Face 推出號稱“世界上最小的視覺語言模型”SmolVLM-256M

作者：牛馬軟件園發(fā)布時間：2025-01-27 11:19:37

本站 1 月 26 日消息，Hugging Face 發(fā)布了兩款全新多模態(tài)模型SmolVLM-256M和SmolVLM-500M，其中SmolVLM-256M號稱是世界上最小的視覺語言模型（Video Language Model）。

據(jù)悉，相應(yīng)模型主要基于 Hugging Face團(tuán)隊去年訓(xùn)練的 80B參數(shù)模型蒸餾而成，號稱在性能和資源需求之間實現(xiàn)了平衡，官方稱 SmolVLM-256M / 500M 兩款模型均可“開箱即用”，可以直接部署在transformer MLX和ONNX平臺上。

具體技術(shù)層面，SmolVLM-256M / 500M 兩款模型均采用SigLIP作為圖片編碼器，使用 SmolLM2作為文本編碼器。其中 SmolVLM-256M是目前最小的多模態(tài)模型，可以接受任意序列的圖片和文本輸入并生成文字輸出，該模型功能包括描述圖片內(nèi)容、為短視頻生成字幕、處理PDF 等。Hugging Face 稱由于該模型整體輕巧，可在移動平臺輕松運行，僅需不到1GB的GPU顯存便可在單張圖片上完成推理。

而 SmolVLM-500M針對需要更高性能的場景而設(shè)計，Hugging Face稱相關(guān)模型非常適合部署在企業(yè)運營環(huán)境中，該模型推理單張圖片僅需1.23GB的GPU顯存，相對 SmolVLM-256M 雖然負(fù)載更大，但推理輸出的內(nèi)容更精準(zhǔn)。

本站注意到，兩款模型均采用Apache 2.0開源授權(quán)，研究團(tuán)隊提供了基于transformer和WebGUI的示例程序。所有模型及其演示已公開便于開發(fā)者下載和使用，具體頁面可（點此訪問）。

相關(guān)文章

欲望婦女的迷離體驗：蕩岳第一篇章之真實誘惑何在？

如何選擇海棠正版app下載官網(wǎng)2024？了解平臺優(yōu)勢及用戶體驗：你的最佳下載平臺是什么？

如何下載9.1免費極速版國際服？提升游戲體驗的秘訣：全球玩家對戰(zhàn)暢享無延遲

黃金網(wǎng)站app免費下載2024：如何選擇最合適的黃金投資平臺

如何選擇三亞最適合的高清電視劇軟件：讓你輕松享受度假時光

岳陽樓下的風(fēng)華，啊聲不絕，昔日秦昔究竟如何惜重？

24小時無人直播帶貨：如何實現(xiàn)全天候不間斷銷售？

如何選擇適合自己的免費觀看電影電視劇的APP：7個必看功能解析

扒開肥嫩的肉蚌，如何品味海洋的鮮美？

如何在嗶哩嗶哩上免費觀看精彩少女題材動漫？你一定不能錯過的觀看技巧與推薦！

国产乱码在线精品可播放,a级情欲片在线观看免费女女,无码专区在线无码,亚洲无码人妻mv