文本圖像音頻影片一起上 生成式 AI有場多模態大秀

編譯/夏洛特

根據高德納諮詢公司 (Gartner)的報告,「多模態解決方案」在人機互動中可能擁有優勢,並將成為生成式人工智慧(AI)的未來,隨著AI的快速發展,消費民生用品製造商(CPG),正面臨選擇整合AI技術的最佳格式與模型的挑戰,從開源大型語言模型到針對特定領域的格式,使市場環境日趨複雜,然而專家認為,多模態解決方案最可能脫穎而出。

人類在處理資訊時會依賴多種感官,包括聽覺、視覺等,因此,AI處理多模態數據的能力,使其能夠更有效地與人類互動。
人類在處理資訊時會依賴多種感官,包括聽覺、視覺等,因此,AI處理多模態數據的能力,使其能夠更有效地與人類互動。(圖/123RF)

多模態解決方案將成主流

據報導,Gartner副總裁分析師Erick Brethenoux指出,生成式AI市場正逐步轉向原生支援多模態模型,將有助於捕捉不同數據流之間的關係,並擴展AI技術在所有數據類型和應用中的潛在效益,基於多模態格式能夠適應不同的行業和應用場景,並能在人與AI的各種接觸點中發揮作用,Gartner預測,到2027年,40% 的生成式AI解決方案將是多模態的,涵蓋文本、圖像、音頻和影片等多種數據形式。

更多新聞:從提升效率到優化流程:生成式人工智慧為圖書出版產業帶來新氣象|專家論點【鄭緯筌Vista】

多模態數據的有效應用

Brethenoux還強調,人類在處理資訊時會依賴多種感官,包括聽覺、視覺等,因此,AI處理多模態數據的能力,使其能夠更有效地與人類互動,雖然目前許多模型僅支援兩到三種數據模式,但Gartner預計這一數字將在未來幾年顯著增加。

單一模式的挑戰與未來展望

相較之下,單一模態格式AI在支援多模態應用場景時,通常會導致延遲和結果不準確,進而影響整體體驗,Gartner預計,隨著生成式AI的普及,大型語言模型(LLM)的影響力將在未來五年內持續增長,並且針對特定領域的生成式AI模型和自主助理,將在未來十年內具備最大的發展潛力。

參考資料:Consumer Goods

※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!

瀏覽 238 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button