微軟發布最新小型語言模型Phi-3-vision
編譯/黃竣凱
科技巨頭微軟發布了其小型語言模型 Phi-3 的新版本Phi-3-vision,可以為用戶分析圖像。Phi-3-vision 是一種多模態模型,可以讀取文字和圖像,非常適合在行動裝置上使用。
Phi-3-vision
微軟表示,現已提供預覽版的Phi-3-vision 是一個42 億個參數模型,可以執行一般的視覺推理任務,如提出有關圖表的問題等。Phi-3-vision 遠小於其他以影像為中心的 AI 模型,如 OpenAI 的 DALL-E 或 Stability AI 的 Stable Diffusion,與這些模型不同,Phi-3-vision 不會產生圖像,只能理解圖像中的內容,並為使用者進行分析。
輕量級AI模型成趨勢
隨著使用更具成本效益和運算密集度較低的AI服務需求不斷增長,AI模型開發人員一直在推出小型、輕量級的AI模型。小型模型可用於支援手機和筆記型電腦等設備上的AI功能,而無需佔用太多電腦記憶體,非常經濟實惠。除了 Phi-3 及其前身 Phi-2 之外,微軟還發布了其他小型模型。
Phi-3
4 月,微軟就發布了 Phi-3,以及最小、擁有 38 億個參數的 Phi-3 模型 Phi-3-mini,Phi-3 系列還有另外兩個成員,包括70 億個參數的Phi-3-small和 140 億個參數的Phi-3-medium。Phi-3-vision 現已提供預覽版。 Phi-3 系列的其他成員,包括Phi-3-mini、Phi-3-small 和 Phi-3-medium 則可透過 Azure 模型庫使用。
參考資料:The Verge
瀏覽 891 次