【課堂筆記】知識爆炸時代的知識壓縮術｜尹相志　(7/17)

講師：尹相志 ● 台灣大學化學系學士/台灣大學新聞研究所碩士● 亞洲資採技術長/Deepbelief.ai人工智慧科學家● 臺灣微軟在數據科學領域的特約講師● 2006~2017 年微軟最有價值專家 (MVP) 在這個訊息爆炸的時代，每天都有成千上萬則文章或新聞，但我們也時常在花了大量時間閱讀後，才發現這些資料可能不是我們原本所需要的，或是根本不必花這麼多的時間閱覽。因此，我們希望透過這次的課程，介紹大家如何使用ChatGPT結合其他軟體，幫助我們摘要文章內容，讓我們可以迅速掌握文章重點，以節省閱讀的時間。 一、ChatGPT的限制 ChatGPT是一個很好的語言模型，龐大的資料庫也讓它能夠回答我們千奇百怪的問題。即便如此，ChatGPT也很常出現一本正經地胡說八道的現象，也就是我們俗稱的「瞎掰」。這是因為，ChatGPT資料庫中的資訊只更新到2021年9月，所以如果我們請它摘要的事件在這個時間之後，ChatGPT就會出現瞎掰的情況（圖1）。因此，在請ChatGPT進行摘要或是詢問問題之前，我們必須留意此時間點。 圖 1：請ChatGPT摘要近期引起熱議的「白飯之亂」事件， 但其回應出現明顯胡說八道的現象。 為了避免ChatGPT瞎掰的情況發生，我們在問問題時必須要給它足夠的訊息，讓它可以是有所本的回答問題，而非憑空捏造。因此，我們可以透過以下兩個方法，避免ChatGPT對我們一本正經地胡說八道。第一個方式就是使用Edge內建的AI機器人「Bing」。因為Bing本身也有搜尋引擎的功能，所以它可以打破ChatGPT的時間限制，並且在告訴我們事件的人、事、時、地、物之外，也提供我們相關的資訊連結（圖2），讓我們了解他的回答是有所本的，增加其回答的可信度。除了Bing以外，我們也可以用第二種方法，來避免ChatGPT瞎掰的現象。任何發生在2021年9月前的事件都是ChatGPT不知道的，因此我們在一開始最好先確認它是否知道我們想摘要的事件。我們可以先請ChatGPT所知道的先講出來，確認它知道人、事、時、地、物的細節再繼續詢問。如果確認ChatGPT對於我們所想知道的事件沒有概念，我們就可以直接將事件細節提供給它，讓它能夠了解相關資訊後，再有所本的幫助我們摘要。事實上，ChatGPT雖然只學習到2021年以前的資訊，但它的語言能力是沒問題的，所以我們只要能夠將事件細節提供給它，ChatGPT就能夠順利地幫我們摘要事件。 圖 2 ：因為Bing的搜尋引擎功能，所以當我們請Bing幫忙摘要「白飯之亂」時，它可以提供給我們該事件的基本資訊與相關新聞連結。 二、ChatGPT摘要術 基礎摘要術 目前大多數人請ChatGPT協助摘要時，通常是直接請ChatGPT在限定字數內，或者利用條列式等格式，針對我們想了解的事情提供摘要。此時，ChatGPT就會將事件內容以我們要求的格式生成一份摘要。 然而，這樣的方式雖然可以初步了解摘要內容，但無法明確地看出事件的細節。因此，我們可以請ChatGPT進行角色扮演，清楚地將它的人設以及技能告訴它。以下為老師提供的prompt公式：「你是萬能的文字助手，你擅長將任何事件相關的敘述在保持原意不變，但必須保留 [人名, 公司機構名稱, 事物名稱, 地點, 時間, 數值, 程式碼, 數據集, 陳述事實, 知識點]前提下，做最精簡的摘要，請為我摘要XX事件的始末及相關影響。」利用ChatGPT角色扮演的功能，AI就可以在摘要中提供更多事件的相關細節與重點。 以上兩個方法為最基礎的ChatGPT摘要術，兩者皆是單純文字形的摘要。除此之外，我們還可以將ChatGPT結合其他軟體，協助我們產生圖表，幫助我們更了解事件的始末與細節。 Mermaid摘要術 Mermaid是一款商用圖表的標記式語言（markdown），我們可以利用Bing要求AI幫我們以Mermaid甘特圖的形式摘要特定事件，AI就會提供我們Mermaid甘特圖的語法（圖3）。接著，我們只要再開啟Mermaid編輯器，將AI產出的語法直接複製貼上該編輯器後按下同步鍵，就能夠成功產生一份事件事發始末的甘特圖（圖4）。不過，有時候Bing生成的語法也會有錯誤，若出現Mermaid甘特圖語法中出現沒有標註時間的部分，系統會自動帶入現實的時間，導致時間軸混亂。為了解決這個問題，我們只要將沒有標註時間的語法刪掉即可。另外，Mermaid編輯器裡還有很多模板讓我們用來製作流程圖，大家可以針對自己的需求多加嘗試。 由於生成式AI可能會有上述問題的存在，所以我們還是要提醒大家，我們在請AI摘要時，自己對於事件與時間真偽對錯的敏銳度也相當重要。如果一味地依賴生成式AI產生結果，往往我們會忘記做事實的查核而害到自己，所以事實的查核仍然相當重要。 圖 3 ：因為Bing和ChatGPT都是一個語言模型，所以它並不能直接生成甘特圖，但AI機器人仍然可以提供我們Mermaid甘特圖的語法，我們再將其複製到Mermaid編輯器裡即可產生甘特圖。 圖 4：利用Mermaid編輯器產生的甘特圖。 Google Bard 日前Google的AI機器人「Bard」也已開始支援中文，但比較可惜的是它尚未能理解什麼是Mermaid甘特圖，所以還無法透過Bard產生Mermaid甘特圖的語法。Bard的理解能力大概跟ChatGPT3.5差不多，語言能力有限。另外，我們也要知道，雖然它有Google搜索引擎在背後撐腰，但資料仍有許多錯誤。因此，我們不能因為Bard背後有Google引擎撐腰，就相信它非常強大 Edge with ChatGPT 另一個可以用來協助摘要的軟體即為Edge with ChatGPT。Edge with ChatGPT並不是網頁版的Edge，而是一個嵌入ChatGPT的Edge。基本上，如果大家使用的是Windows平台，並有正常更新軟體，都可以在Edge瀏覽器中的右上角找到一個小寫的「b」。點選之後就會出現一個側邊攔，我們只要將想要讓AI分析的網頁或PDF檔案放在頁面的左手邊，它就可以直接閱讀並協助我們摘要文章。如果我們想要更深入了解文章內容，我們也可以和AI進行對談，釐清更多文章中的論點。 我們也可以將Edge with ChatGPT結合Mermaid編輯器協助摘要文件。首先要記得，我們必須告訴AI請它為我們摘要「這份文件/這個網頁」，也就是我們所開啟的文件/網頁，以免它出現瞎掰的現象。順帶一提，如果我們擔心AI回答到一半時突然變成簡體中文或英文，也可以在問句開頭加上「#zh-TW」，避免AI以多種語言回答。接著，我們只要將AI所整理出的文件重點，並要求ChatGPT保留這些重點，以Mermaid流程圖的形式進行摘要。然而，因為ChatGPT尚無法掌握Mermaid的語法，所以它僅會提供一個流程圖語法。我們只要再將該語法貼到Mermaid編輯器中，便可以成功產生一個流程圖（圖5）。 最後要提醒大家，當我們餵給Edge with ChatGPT一篇文章或檔案並請它進行摘要時，就是同意讓ChatGPT閱讀這份文件。因此為了保護我們個人或者公司的資訊安全，請大家避免將機密或私人檔案上傳至Edge with ChatGPT或其他相似的AI軟體。 圖 5：將ChatGPT產生的語法貼上Mermaid編輯器後，便可以產生文章內容的流程圖。 Show Me Diagrams 前述介紹結合Mermaid編輯器的ChatGPT摘要術，都因為軟體的限制而必須開啟不同頁面進行複製貼上。若想避免此麻煩，大家可以使用ChatGPT-4中的「Show Me Diagrams」，此功能是ChatGPT中專門用來畫圖表的工具，它特別擅長繪製Mermaid的圖形。我們只要開啟Show Me Diagrams，並把先前產生的Mermaid甘特圖的語法以及文字摘要貼上ChatGPT，請它以Mermaid心智圖的概念來整理以上文字，它就會直接在聊天室中產生圖片。如果我們想要編輯圖片，則只要直接點擊該圖片就可以了。 圖 6：利用ChatGPT-4中的Show Me Diagrams功能，就可以直接在與ChatGPT的對話中產生心智圖。 Prompt is all you need !! 最後，如果大家希望ChatGPT協助摘要的文章為長篇幅文章，上文所介紹的程式可能將不敷使用。因此，若大家懂得如何寫程式或使用Python，我們也可以下載尹相志老師設計的「Prompt is all you need !!」幫助我們摘要文件。可以直接下載安裝，但要在安裝前在電腦的環境變數中的使用者變數中加上「OPENAI_API_KEY」，並於設定完成後重新開機，便可以在下載後使用此應用程式。 「Prompt is all you need !!」的功能包含處理傳統自然語言的任務、以文生圖、利用不同風格改寫文章，以及長文本摘要等。提供長文本摘要所使用的檔案可以是文字檔，也可以是PDF檔，並有三個不同的摘要技術供我們使用，包含滾動式整合摘要、滾動式累加摘要、平行分塊摘要。另外一個較特別的功能為「會議記錄摘要」。此功能是特別為了摘要會議記錄重點而設計。我們可以在程式代碼中將現況說明、規劃、承諾、代辦事項等會議重要內容的定義列舉出來。如此一來，當我們請ChatGPT協助摘要會議記錄時，就可以讓AI基於我們所規範的定義，將會議記錄中的現況說明、規劃、承諾、代辦事項摘要出來。 三、結論 我們希望可以透過前述六種摘要術，讓大家在資訊爆炸的時代，學會運用最新的AI科技協助我們更快速地吸收更多的知識。最後也要提醒大家，為了解決ChatGPT資料庫時間限制的問題，以及避免它可能產生胡說八道的情況，我們可以在問題前面加上「基於這份資料」，或者提供ChatGPT足夠的上下文，讓它可以有所本的回答我們的問題。另外，不管我們所使用的是哪一種AI程式，都必須留意資安問題，千萬不要將自己或公司的機敏資訊餵給ChatGPT喔！ 【若想回顧完整版課程影音，請點選此連結；有任何問題或分享，也歡迎在本文底下留言。】

【課堂筆記】知識爆炸時代的知識壓縮術｜尹相志　(7/17)

推薦工作

One Comment

發佈留言取消回覆

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

【課堂筆記】從ChatGPT入門Excel VBA學習程式語言 ｜ 文琇老師

【課堂筆記】AIGC活出自己玩出個人品牌｜ 機車老酥

【課堂筆記】No Code 開發AI智能協作助理：微軟 Copilot Studio 與生成式AI 的創新整合應用 ｜ 吳奇珅

【課堂筆記】零程式碼打造生成式AI聊天機器人 ｜ 陳葵懋

【課堂筆記】高觸擊率寵物圖片、影片製作剪輯與音效合成 ｜ 陳志信

【課堂筆記】Co-Intelligence—與 GenAI共舞共教共學共事 … 共everything ｜ 張俊盛

One Comment

發佈留言 取消回覆

【課堂筆記】從ChatGPT入門Excel VBA學習程式語言｜文琇老師

【課堂筆記】AIGC活出自己玩出個人品牌｜機車老酥

【課堂筆記】No Code 開發AI智能協作助理：微軟 Copilot Studio 與生成式AI 的創新整合應用｜吳奇珅

【課堂筆記】零程式碼打造生成式AI聊天機器人｜陳葵懋

【課堂筆記】高觸擊率寵物圖片、影片製作剪輯與音效合成｜陳志信

【課堂筆記】Co-Intelligence—與 GenAI共舞共教共學共事 … 共everything ｜張俊盛

發佈留言取消回覆