大型語言模型Gemini  Google副總裁驚歎:非常驚人

編譯/莊閔棻

就在Google備受期待的新型大型語言模型 Gemini即將推出之際,現在又有更多進一步的消息。這一切的關鍵人物是  Google 副總裁兼 Bard 和 Google 助理的總經理 Sissie Hsiao就表示,她「看到了一些非常神奇的事情」,因為「Gemini能夠與人類透過圖像進行對話,而不僅僅是文字」。

就在Google備受期待的新型大型語言模型 Gemini即將推出之際,現在又有更多進一步的消息。(圖/123RF)

Gemini可以根據文字生成步驟式圖片

據外媒報導,Hsiao 並不是 Gemini 團隊的成員,但她負責開發讓用戶能夠訪問新AI系統主要產品,包括Bard。Hsiao提到,現在Gemini已經能夠為用戶將食譜從文字變成圖片,如,只要要求其「畫三張關於如何製作三層蛋糕的圖片」,Gemini就會創建教人們製作的圖像。此外,Hsiao還補充說,生成的都是完全新的圖片,而不是來自網路的圖片。

更多新聞:沉睡巨人正在甦醒!Google的Gemini將超越GPT-4 五倍

Gemini 將是多模態的

早先,Google就表示Gemini 將是多模態的,這代表該模型除了能夠理解和生成文字外,還能生成圖像和其他類型的內容。 執行長Sundar Pichai還暗示,Gemini也將在規劃方面做得更好。而DeepMind首席執行長Demis Hassabis則指出, Gemini正在使用該公司於2016年第一個擊敗人類職業圍棋選手的技術AlphaGo訓練。Google的AlphaGo 系統於2016年擊敗韓國職業圍棋選手李世乭,引起人們對AI技術的關注。

Google壓力非常大

目前所有壓力都在Google身上,因為如果 Gemini 真的如Google描述的如此強大,那它將幫助Google扭轉其落後地位,並追上微軟和 OpenAI ;但如果它令人失望,就會讓批評者更加確定Google已經落後了。為了與OpenAI 的LLM GPT-4 競爭,Google正在大力開發由 Google DeepMind 首席執行長 Demis Hassabis 領導的LLM Gemini。早先,Hassabis就曾表示,Gemini的性能將比 Open AI 的 ChatGPT更好。

參考資料:Insider

※更多ChatGPT相關訊息,請參考【生成式AI創新學院】。

瀏覽 650 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button