小技巧大力量 運用Google Gemini 的巨大潛力
編譯/黃竣凱
人工智慧(AI)已成為我們生活中不可或缺的一部分,而在眾多AI模型中,Google 的Gemini無疑是非常具革命性的存在之一。隨著Gemini的崛起,可以看到AI在多模式融合、影像分析、程式設計輔助等方面的巨大潛力,然而要充分發揮Gemini的優勢,仍需要深入了解其功能和應用技巧。
了解 Google Gemini 最擅長什麼
Google Gemini 是一個多模式模型,讓用戶可以發送其他輸出形式,包括圖像、音頻和影片,而不是只能輸入文字與 AI 對話。
更多新聞:ChatGPT Plus用戶獨享 OpenAI推出新「記憶」功能
向 Gemini 詢問 YouTube 影片分析
Gemini 具有 YouTube Vision 功能,透過在與 Gemini 對話時使用 @Youtube 命令,用戶可以要求它分析影片內容。若要使用該功能,只要透過官方行動App開啟 Google Gemini ,或在網頁瀏覽器中登入 Google Gemini,然後在提示框中,輸入 「@YouTube」 並貼上連結即可,預設情況下,Gemini 會為用戶總結影片,也可以向它詢問有關影片的問題。
使用圖像與Gemini交談
Gemini 是Google的多模態生成式AI,能夠創造多種類型的輸出,包括圖像,但目前因Gemini生成人物影像帶有種族偏見,Google暫停了人像生成功能,儘管如此,用戶仍然可以使用 Gemini 的內建影像產生器和識別工具做很多事,如要求 Gemini 僅使用文字建立其他圖像,或上傳圖像並提出問題等。
使用 Google Gemini 練習程式設計
Gemini 還可以作為程式設計輔助工具,讓開發人員驗證程式碼片段,或在程式設計任務中尋求協助。高級版本Gemini Advanced的訂閱者,甚至還可以直接在 Gemini 介面中執行和編輯 Python 程式碼。
文件翻譯
此外,Gemini 還提供無縫的文件翻譯服務,並可以根據用戶上下文和語氣,改進翻譯,讓其聽起來更自然。
創意表達
最後,使用者也可以透過提示Gemini,將文字內容轉化為饒舌歌曲或詩歌,藉此釋放創造力,提供一種令人耳目一新的方式來消化複雜的訊息。
參考資料:Android Police
瀏覽 685 次