認識Google最強語言模型Gemini
編譯/莊閔棻
Google終於發布新的生成式人工智慧(AI)模型 Gemini。這家科技巨頭表示,Gemini 是該公司至今為止開發的最強大、最通用的AI,並表示計畫明年擴展這種大型語言模型(LLM)的高級版本。該模型是多模態的,這代表著它可以理解不同類型的資訊,包括文字、音訊、圖像和影片。以下我們就帶大家看看目前已知關於該模型的一切。
三種型號
- Gemini Ultra:最大、功能最強大的版本,適用於高度複雜的任務
- Gemini Pro:適用於多種任務
- Gemini Nano:適合想要建立 Gemini 支援的應用程式的 Android 用戶。 例如,借助 Gemini Nano,人們現在可以總結使用 Pixel 8 Pro 手機上的錄音機應用程式進行的錄音
更多新聞:大型語言模型Gemini Google副總裁驚歎:非常驚人
多模態
Google的 Gemini 是一種多模態AI。這代表它可以處理多種資料類型,包括圖像、文字、音訊、影片和程式碼。 新功能還允許模型對可視化圖表進行書面分析。據悉,這家科技巨頭也正在提升該技術的程式碼產生能力,試圖與由 OpenAI 提供支援的微軟 GitHub Copilot 抗衡。
受到AlphaGo的啟發
Gemini是Google使用2016年第一個擊敗人類職業圍棋選手的技術AlphaGo製作的大型語言模型 Gemini。Google的AlphaGo 系統於2016年擊敗韓國職業圍棋選手李世乭,引起人們對AI技術的關注。Deepmind 首席執行長 Demis Hassabis表示,「從高層次上來說,你可以認為 Gemini 結合了 AlphaGo 類系統的一些優勢與大型模型令人驚嘆的語言能力。」
Bard得到更新
據Google稱,Bard現已升級為 Gemini Pro,這為該聊天機器人提供了更先進的推理和理解能力以及其他功能。 Gemini Pro 支援的 Bard 僅提供英文版本,並在 170 多個國家、地區提供。 Google表示,Bard將於明年與 Gemini Ultra 整合。 在接下來的幾個月中,該公司將在其他應用程式中添加 Gemini,包括搜尋、Google Ads 和 Chrome 瀏覽器。
Gemini 在 Google 的 TPU 上運行
Gemini在Google製造的張量處理單元(TPU)上運行。TPU是專門為訓練人工智慧模型而設計的硬體。 但Google雲端人工智慧副總裁 Amin Vahdat 在簡報中表示,未來 Gemini 將接受 TPU 和輝達生產的 H100 圖形處理單元 (GPU) 的培訓。 H100這是一種為生成式AI產品提供動力的熱門晶片。
早期版本
根據 The Information 報導,Google早於 9 月開始向一小部分公司分發該模型的早期版本。一位先前測試過該技術的人士就表示,該技術可能比 GPT-4 更具優勢,因為它利用了Google來自消費產品的數據,以及從網路收集的資訊,這讓該模型可以更準確地理解用戶的意圖。
此外,該人士還表示,該模型生成的錯誤答案似乎較少。一直以來大型語言模型都因為錯誤百出而引人詬病。SemiAnalysis 部落格背後的研究人員也預測,由於Google使用了頂級晶片,谷歌的 Gemini 可能會超越 GPT-4。
瀏覽 909 次