機器人導航新篇章 PixNav顛覆傳統做法
編譯/曲姵蓉
康乃爾大學研究人員推出了一種新的導航技術PixNav,取代傳統的地圖導航模式,讓機器人可以用視覺提示進行導航。
傳統機器人導航技術鴻溝大
傳統的機器人導航技術一直面臨著零樣本物體導航的挑戰,簡單來說就是需要機器人自動搜尋並導航到它們從未見過的物體。雖然現代機器人系統已經可以比較輕鬆地識別和理解未知的物體,但實際的導航過程還是取決於地圖內建的規劃導航方法。如此一來,機器人內要配置不少昂貴的設備,並搭配深度感測器才有可能完成這種導航模式,即使能夠完成這個門檻,如何將地圖內建的導航知識、機器人視覺模型轉化成為適當且實際的導航任務,也有很大的技術落差需要彌補。
更多新聞:視覺轉化為聲音 專為盲人開發導航系統
全新PixNav技術 根據圖像進行導航
而新的PixNav技術,幾乎完全不依賴內建地圖,而是使用來自圖像作為導航標記。簡單來說,機器人會朝著視覺中特定的圖片或區域前進,使其能夠自動導航內指定環境內的物體或位置。
這種以圖像為思維中心的方法,不僅大幅簡化了導航任務,同時也有助於尋找建築物或物體的多功能導航策略。除此之外,PixNav的另一個優勢是能夠快速收集大量的導航數據,將每個圖像拆解成數千個畫素分子,每個畫素都代表一個潛在的導航目標,便能夠為訓練導航機器人提供豐富的數據庫。
引進大型語言模型技術神助攻
最重要的是,研究人員也為PixNav集成了大型語言模型技術(LLM),來輔助系統本身的不足。若設定導航的目標地不在機器人目前的視覺中,用戶可以用LLM技術來輔助,讓導航機器人了解導航目標的背景資訊以及可能所在位置。例如,要讓機器人找到一張床,就可以利用LLM技術先行教育它,典型的家居布局理解,並引導機器人前往臥室尋找床,這種作法經測試後有高達80%的成功率。
對此,研究人員也坦承該技術還有很多不足之處,特別是在長途路徑規劃方面,還需要更大量的技術與數據庫支援。不過這種研究啟發對於機器人導航領於而言,的確是很創新的一步,有望帶動此領域的重大變革。
瀏覽 2,731 次