文本圖像音頻影片一起上生成式 AI有場多模態大秀

2024-09-11

編譯／夏洛特

根據高德納諮詢公司（Gartner）的報告，「多模態解決方案」在人機互動中可能擁有優勢，並將成為生成式人工智慧（AI）的未來，隨著AI的快速發展，消費民生用品製造商（CPG），正面臨選擇整合AI技術的最佳格式與模型的挑戰，從開源大型語言模型到針對特定領域的格式，使市場環境日趨複雜，然而專家認為，多模態解決方案最可能脫穎而出。

人類在處理資訊時會依賴多種感官，包括聽覺、視覺等，因此，AI處理多模態數據的能力，使其能夠更有效地與人類互動。（圖／123RF）

多模態解決方案將成主流

據報導，Gartner副總裁分析師Erick Brethenoux指出，生成式AI市場正逐步轉向原生支援多模態模型，將有助於捕捉不同數據流之間的關係，並擴展AI技術在所有數據類型和應用中的潛在效益，基於多模態格式能夠適應不同的行業和應用場景，並能在人與AI的各種接觸點中發揮作用，Gartner預測，到2027年，40% 的生成式AI解決方案將是多模態的，涵蓋文本、圖像、音頻和影片等多種數據形式。

多模態數據的有效應用

Brethenoux還強調，人類在處理資訊時會依賴多種感官，包括聽覺、視覺等，因此，AI處理多模態數據的能力，使其能夠更有效地與人類互動，雖然目前許多模型僅支援兩到三種數據模式，但Gartner預計這一數字將在未來幾年顯著增加。

單一模式的挑戰與未來展望

相較之下，單一模態格式AI在支援多模態應用場景時，通常會導致延遲和結果不準確，進而影響整體體驗，Gartner預計，隨著生成式AI的普及，大型語言模型（LLM）的影響力將在未來五年內持續增長，並且針對特定領域的生成式AI模型和自主助理，將在未來十年內具備最大的發展潛力。

參考資料：Consumer Goods

※探索職場，透視薪資行情，請參考【科技類-職缺百科】幫助你找到最適合的舞台！

瀏覽 426 次

覺得不錯的話就分享出去吧！

標籤

2024-09-11

文本圖像音頻影片一起上生成式 AI有場多模態大秀

多模態解決方案將成主流

多模態數據的有效應用

單一模式的挑戰與未來展望

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

多模態解決方案將成主流

多模態數據的有效應用

單一模式的挑戰與未來展望

推薦工作

延伸閱讀

AIF攜高通推「AI化大調查報告」！曝近7成企業對AI僅有初步認知

川普加徵關稅嚴控晶片出口 黃仁勳西裝現身北京：堅持深耕中國

關稅特別條例規模擴增？ 卓榮泰：880億產業支持再加碼50億元

關稅談判日、墨、義有大進展 川普：跟中國快要達成協議了！

企業憂關稅衝擊存準率 央行釋疑：新台幣資金流動充裕

TrendForce：美國關稅刺激產業拉貨保庫存 記憶體市場價格恐再變動

發佈留言 取消回覆

川普加徵關稅嚴控晶片出口黃仁勳西裝現身北京：堅持深耕中國

關稅特別條例規模擴增？卓榮泰：880億產業支持再加碼50億元

關稅談判日、墨、義有大進展川普：跟中國快要達成協議了！

企業憂關稅衝擊存準率央行釋疑：新台幣資金流動充裕

TrendForce：美國關稅刺激產業拉貨保庫存記憶體市場價格恐再變動

發佈留言取消回覆