全新NVIDIA AI Blueprint助開發視覺AI代理 為倉庫到世界各國首都提供洞察

記者 / 孟圓琦

人工智慧代理(AI agent)成為趨勢,世界各地都致力於相關領域的開發,用以提升團隊能力與效率。在這之中,工作團隊對於攝影機、物聯網感測器與車輛等,越來越多裝置所產生的視覺資訊相當依賴,而NVIDIA AI Blueprint可讓幾乎所有產業的開發人員,建立可分析視訊與影像內容的視覺 AI 代理,進行回覆、生成摘要,甚至是對於特定情境啟用警示功能。

延伸閱讀:Appier宣布與Apple Search Ads合作 AI技術助推精準行銷策略

將 AI 視覺化:任何產業現在都能搜尋並摘要大量的視覺資料。
將 AI 視覺化:任何產業現在都能搜尋並摘要大量的視覺資料。(圖/NVIDIA)

在全球系統整合商與技術解決方案供應商中,包含埃森哲(Accenture)、戴爾科技集團(Dell Technologies)與聯想集團(Lenovo)等,將用於視覺搜尋與摘要的 NVIDIA AI Blueprint 帶給全球企業與城市使用,掀起下一波 AI 應用的浪潮,這些應用可部署於工廠、倉庫、商店、機場、交通路口等,以提升生產效率與安全性。

使用者可以用自然語言提示來客製化這些視覺 AI 代理,降低在各產業和智慧城市應用部署虛擬助理的門檻。視覺 AI 代理由視覺語言模型(VLM)驅動,VLM 是一種結合電腦視覺與語言理解的生成式 AI 模型,可解釋實體世界與執行推理任務。適用於視訊搜尋與摘要的 NVIDIA AI Blueprint 可搭配 NVIDIA NIM 微服務來配置如 NVIDIA VILA 的 VLM、如 Meta 的 Llama 3.1 405B 的大型語言模型(LLM),以及適用於 GPU 加速問題解答與語境感知檢索增強生成的 AI 模型。

在倉庫環境中,利用這個工作流程建立的 AI 代理可以在工作人員違反安全規範時加以提醒。在繁忙的十字路口,AI代理可以識別交通事故,並且產生報告以協助緊急應變工作。而在公共基礎設施領域,維護人員可以要求 AI 代理檢視空拍畫面,找出老化的道路、火車軌道或橋樑,以支持更主動地維護。 除了智慧空間之外,視覺 AI 代理也可用於為視力受損人士摘要影片、自動產生體育賽事回顧,以及協助標示大量視覺資料集以訓練其他 AI 模型。

※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!

瀏覽 130 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button