【課堂筆記】知識爆炸時代的知識壓縮術|尹相志 (7/17)

講師:尹相志

● 台灣大學化學系學士/台灣大學新聞研究所碩士
● 亞洲資採技術長/Deepbelief.ai人工智慧科學家
● 臺灣微軟在數據科學領域的特約講師
● 2006~2017 年微軟最有價值專家 (MVP)

在這個訊息爆炸的時代,每天都有成千上萬則文章或新聞,但我們也時常在花了大量時間閱讀後,才發現這些資料可能不是我們原本所需要的,或是根本不必花這麼多的時間閱覽。因此,我們希望透過這次的課程,介紹大家如何使用ChatGPT結合其他軟體,幫助我們摘要文章內容,讓我們可以迅速掌握文章重點,以節省閱讀的時間。

 一、ChatGPT的限制

ChatGPT是一個很好的語言模型,龐大的資料庫也讓它能夠回答我們千奇百怪的問題。即便如此,ChatGPT也很常出現一本正經地胡說八道的現象,也就是我們俗稱的「瞎掰」。這是因為,ChatGPT資料庫中的資訊只更新到2021年9月,所以如果我們請它摘要的事件在這個時間之後,ChatGPT就會出現瞎掰的情況(圖1)。因此,在請ChatGPT進行摘要或是詢問問題之前,我們必須留意此時間點。

圖 1:請ChatGPT摘要近期引起熱議的「白飯之亂」事件, 但其回應出現明顯胡說八道的現象。

為了避免ChatGPT瞎掰的情況發生,我們在問問題時必須要給它足夠的訊息,讓它可以是有所本的回答問題,而非憑空捏造。因此,我們可以透過以下兩個方法,避免ChatGPT對我們一本正經地胡說八道。第一個方式就是使用Edge內建的AI機器人「Bing」。因為Bing本身也有搜尋引擎的功能,所以它可以打破ChatGPT的時間限制,並且在告訴我們事件的人、事、時、地、物之外,也提供我們相關的資訊連結(圖2),讓我們了解他的回答是有所本的,增加其回答的可信度。除了Bing以外,我們也可以用第二種方法,來避免ChatGPT瞎掰的現象。任何發生在2021年9月前的事件都是ChatGPT不知道的,因此我們在一開始最好先確認它是否知道我們想摘要的事件。我們可以先請ChatGPT所知道的先講出來,確認它知道人、事、時、地、物的細節再繼續詢問。如果確認ChatGPT對於我們所想知道的事件沒有概念,我們就可以直接將事件細節提供給它,讓它能夠了解相關資訊後,再有所本的幫助我們摘要。事實上,ChatGPT雖然只學習到2021年以前的資訊,但它的語言能力是沒問題的,所以我們只要能夠將事件細節提供給它,ChatGPT就能夠順利地幫我們摘要事件。

圖 2 :因為Bing的搜尋引擎功能,所以當我們請Bing幫忙摘要「白飯之亂」時,它可以提供給我們該事件的基本資訊與相關新聞連結。

二、ChatGPT摘要術

  1. 基礎摘要術

目前大多數人請ChatGPT協助摘要時,通常是直接請ChatGPT在限定字數內,或者利用條列式等格式,針對我們想了解的事情提供摘要。此時,ChatGPT就會將事件內容以我們要求的格式生成一份摘要。

然而,這樣的方式雖然可以初步了解摘要內容,但無法明確地看出事件的細節。因此,我們可以請ChatGPT進行角色扮演,清楚地將它的人設以及技能告訴它。以下為老師提供的prompt公式:「你是萬能的文字助手,你擅長將任何事件相關的敘述在保持原意不變,但必須保留 [人名, 公司機構名稱, 事物名稱, 地點, 時間, 數值, 程式碼, 數據集, 陳述事實, 知識點]前提下,做最精簡的摘要,請為我摘要XX事件的始末及相關影響。」利用ChatGPT角色扮演的功能,AI就可以在摘要中提供更多事件的相關細節與重點。

以上兩個方法為最基礎的ChatGPT摘要術,兩者皆是單純文字形的摘要。除此之外,我們還可以將ChatGPT結合其他軟體,協助我們產生圖表,幫助我們更了解事件的始末與細節。

  1. Mermaid摘要術

Mermaid是一款商用圖表的標記式語言(markdown),我們可以利用Bing要求AI幫我們以Mermaid甘特圖的形式摘要特定事件,AI就會提供我們Mermaid甘特圖的語法(圖3)。接著,我們只要再開啟Mermaid編輯器,將AI產出的語法直接複製貼上該編輯器後按下同步鍵,就能夠成功產生一份事件事發始末的甘特圖(圖4)。不過,有時候Bing生成的語法也會有錯誤,若出現Mermaid甘特圖語法中出現沒有標註時間的部分,系統會自動帶入現實的時間,導致時間軸混亂。為了解決這個問題,我們只要將沒有標註時間的語法刪掉即可。另外,Mermaid編輯器裡還有很多模板讓我們用來製作流程圖,大家可以針對自己的需求多加嘗試。

由於生成式AI可能會有上述問題的存在,所以我們還是要提醒大家,我們在請AI摘要時,自己對於事件與時間真偽對錯的敏銳度也相當重要。如果一味地依賴生成式AI產生結果,往往我們會忘記做事實的查核而害到自己,所以事實的查核仍然相當重要。

圖 3 :因為Bing和ChatGPT都是一個語言模型,所以它並不能直接生成甘特圖,但AI機器人仍然可以提供我們Mermaid甘特圖的語法,我們再將其複製到Mermaid編輯器裡即可產生甘特圖。
圖 4:利用Mermaid編輯器產生的甘特圖。

  1. Google Bard

日前Google的AI機器人「Bard」也已開始支援中文,但比較可惜的是它尚未能理解什麼是Mermaid甘特圖,所以還無法透過Bard產生Mermaid甘特圖的語法。Bard的理解能力大概跟ChatGPT3.5差不多,語言能力有限。另外,我們也要知道,雖然它有Google搜索引擎在背後撐腰,但資料仍有許多錯誤。因此,我們不能因為Bard背後有Google引擎撐腰,就相信它非常強大

  1. Edge with ChatGPT

另一個可以用來協助摘要的軟體即為Edge with ChatGPT。Edge with ChatGPT並不是網頁版的Edge,而是一個嵌入ChatGPT的Edge。基本上,如果大家使用的是Windows平台,並有正常更新軟體,都可以在Edge瀏覽器中的右上角找到一個小寫的「b」。點選之後就會出現一個側邊攔,我們只要將想要讓AI分析的網頁或PDF檔案放在頁面的左手邊,它就可以直接閱讀並協助我們摘要文章。如果我們想要更深入了解文章內容,我們也可以和AI進行對談,釐清更多文章中的論點。

我們也可以將Edge with ChatGPT結合Mermaid編輯器協助摘要文件。首先要記得,我們必須告訴AI請它為我們摘要「這份文件/這個網頁」,也就是我們所開啟的文件/網頁,以免它出現瞎掰的現象。順帶一提,如果我們擔心AI回答到一半時突然變成簡體中文或英文,也可以在問句開頭加上「#zh-TW」,避免AI以多種語言回答。接著,我們只要將AI所整理出的文件重點,並要求ChatGPT保留這些重點,以Mermaid流程圖的形式進行摘要。然而,因為ChatGPT尚無法掌握Mermaid的語法,所以它僅會提供一個流程圖語法。我們只要再將該語法貼到Mermaid編輯器中,便可以成功產生一個流程圖(圖5)。

最後要提醒大家,當我們餵給Edge with ChatGPT一篇文章或檔案並請它進行摘要時,就是同意讓ChatGPT閱讀這份文件。因此為了保護我們個人或者公司的資訊安全,請大家避免將機密或私人檔案上傳至Edge with ChatGPT或其他相似的AI軟體。

圖 5:將ChatGPT產生的語法貼上Mermaid編輯器後,便可以產生文章內容的流程圖。

  1. Show Me Diagrams

前述介紹結合Mermaid編輯器的ChatGPT摘要術,都因為軟體的限制而必須開啟不同頁面進行複製貼上。若想避免此麻煩,大家可以使用ChatGPT-4中的「Show Me Diagrams」,此功能是ChatGPT中專門用來畫圖表的工具,它特別擅長繪製Mermaid的圖形。我們只要開啟Show Me Diagrams,並把先前產生的Mermaid甘特圖的語法以及文字摘要貼上ChatGPT,請它以Mermaid心智圖的概念來整理以上文字,它就會直接在聊天室中產生圖片。如果我們想要編輯圖片,則只要直接點擊該圖片就可以了。

圖 6:利用ChatGPT-4中的Show Me Diagrams功能,就可以直接在與ChatGPT的對話中產生心智圖。

  1. Prompt is all you need !!

最後,如果大家希望ChatGPT協助摘要的文章為長篇幅文章,上文所介紹的程式可能將不敷使用。因此,若大家懂得如何寫程式或使用Python,我們也可以下載尹相志老師設計的「Prompt is all you need !!」幫助我們摘要文件。可以直接下載安裝,但要在安裝前在電腦的環境變數中的使用者變數中加上「OPENAI_API_KEY」,並於設定完成後重新開機,便可以在下載後使用此應用程式。

「Prompt is all you need !!」的功能包含處理傳統自然語言的任務、以文生圖、利用不同風格改寫文章,以及長文本摘要等。提供長文本摘要所使用的檔案可以是文字檔,也可以是PDF檔,並有三個不同的摘要技術供我們使用,包含滾動式整合摘要、滾動式累加摘要、平行分塊摘要。另外一個較特別的功能為「會議記錄摘要」。此功能是特別為了摘要會議記錄重點而設計。我們可以在程式代碼中將現況說明、規劃、承諾、代辦事項等會議重要內容的定義列舉出來。如此一來,當我們請ChatGPT協助摘要會議記錄時,就可以讓AI基於我們所規範的定義,將會議記錄中的現況說明、規劃、承諾、代辦事項摘要出來。

三、結論

我們希望可以透過前述六種摘要術,讓大家在資訊爆炸的時代,學會運用最新的AI科技協助我們更快速地吸收更多的知識。最後也要提醒大家,為了解決ChatGPT資料庫時間限制的問題,以及避免它可能產生胡說八道的情況,我們可以在問題前面加上「基於這份資料」,或者提供ChatGPT足夠的上下文,讓它可以有所本的回答我們的問題。另外,不管我們所使用的是哪一種AI程式,都必須留意資安問題,千萬不要將自己或公司的機敏資訊餵給ChatGPT喔!

【若想回顧完整版課程影音,請點選連結;有任何問題或分享,也歡迎在本文底下留言。】

瀏覽 1,059 次

覺得不錯的話就分享出去吧!

One Comment

發佈留言

Back to top button