Gemini是什麼?關於Google新AI模型的一切

編譯/黃竣凱

Google的新 Gemini 模型是至今為止最大、最先進的AI模型,因其原生多模態特性而脫穎而出。圖取自Google

GeminiGoogle 推出的強大人工智慧(AI)模型,可以理解文字、圖像、影片和音訊。 作為一種多模態模型,Gemini 能完成數學、物理和其他領域的複雜任務,並理解和產生各種程式語言的高品質程式碼。

目前Gemini可透過Google的聊天機器人(前 Google Bard)和一些 Google Pixel 設備使用,並將逐漸合併到其他 Google 服務中。在 Google I/O 2024 期間,該公司宣布了 Gemini 的新功能,包括新的「Live」模式及與 Project Astra 的整合。此外,Gemini 也為 Google 搜尋中的AI概述(AI Overview)提供支援。

更多新聞:Google I/O 2024/推全新模型Gemini 1.5 Flash

Google DeepMind 執行長兼聯合創始人 Dennis Hassabis表示,「Gemini 是整個 Google 團隊大規模協作的成果,其中包括我們在 Google Research 的同事。它是從頭開始構建的多模態模型,可以概括和無縫地理解、操作和組合不同類型的資訊,包括文本、程式碼、音頻、圖像和影片。」

Gemini不同版本

Google將 Gemini 描述為一種靈活的模型,能夠在從Google資料中心到行動裝置的所有裝置上運行,而為了實現這種等級的可擴充性,Google也發布了三種尺寸的Gemini,包括Gemini Nano、Gemini Pro 和 Gemini Ultra。

  • Gemini Nano 1.0

Gemini Nano 專為在智慧型手機上運行設計,最初在Google Pixel 8 上推出,可以提供回覆建議、理解圖像或總結文字,該模型具有 32,000 個參數的上下文視窗。

  • Gemini Flash 1.5

此型號專為速度而設計,因此是一種輕量級且經濟高效的選擇,並具有較長的上下文窗口,預設具有100萬個參數上下文,足以處理一個小時的影片或超過 30,000 行程式碼。

  • Gemini Pro 1.5

Gemini Pro 在 Google 資料中心上運行,專為該公司最新版本的「付費」AI聊天機器人服務 Gemini Advanced 提供支援,該模型可以提供快速回應時間並理解複雜的查詢,此外Google也將把其上下文視窗升級到 200 萬個參數,成為目前可用的大型模型中最大的一個。

  • Gemini Ultra 1.0

Google將 Gemini Ultra 描述為其最強大的模型,其在大型語言模型(LLM)研究和開發裡使用的 32 個學術基準中,擁有 30 個當前最先進的結果,該模型專為高度複雜的任務而設計,可透過 Vertex AI 和 Google AI Studio 以及 Gemini API 使用。

如何使用Gemini

使用 Gemini 模型的最快方法,是進入 AI 聊天機器人的網站 Gemini.Google.com,用戶可以透過網站與 Gemini 進行對話,就像與 ChatGPT 和其他 AI 聊天機器人進行對話一樣。此外,Gemini 也適用於 Google 產品,例如安卓裝置、Gemini 行動App、具有 AI 概述功能的 Google 搜尋、Google Photos 等,隨後Google也計畫要將 Gemini 進一步整合到其搜尋、廣告、Chrome 和其他服務中。

開發者和企業客戶則也可以透過Google AI Studio和Google Cloud Vertex AI中的Gemini API使用Gemini Ultra,安卓Android 開發人員也可以透過 AICore 使用Gemini Nano。

Gemini 有何不同

目前Google的新 Gemini 模型是至今為止最大、最先進的AI模型,與其他支援人工智慧聊天機器人的流行模型相比,Gemini 因其原生多模態特性和一百萬個代幣的長上下文視窗而脫穎而出。

與主要基於文字的模型 GPT-4 相比,Gemini 可以輕鬆地在設備內執行多模態任務。 雖然 GPT-4 在與語言相關的任務(例如內容創建和複雜文本分析)方面表現出色,但該模型仍需要藉助 OpenAI 的外掛程式執行圖像分析和使用網路,並依賴 DALL-E 3 和 Whisper 生成影像和處理音訊。

此外,Google也比其他公司更注重AI與產品的結合,並將 Gemini整合到該公司的生態系統中,為聊天機器人和 Android 設備提供支援,而其他模型,如 GPT-4 和 Meta 的 Llama,則更面向服務,供各種第三方開發人員開發應用程式、工具和服務。

參考資料:zdnet

瀏覽 1,591 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button