剖析生成式AI潛能 設定角色可防止演算法疏失
記者/陳士勳
生成式AI帶來許多科技突破,現階段不僅擁有文字生成能力,還能進一步產出圖片、聲音、影像等內容物,中國智能產業服務平台《智次方》更強調,狹義的AIGC(Al Generated Content)較多關注文字、圖像、音訊、視訊等內容生成,廣義則涵蓋蛋白質結構、環境模擬、人工智慧體、虛擬人等各領域,也顯示大型AI模型經由訓練後的潛能,同時,建議使用前,先替AI設計一個角色,以辨識演算法的盲點。
GPT-4本質為文本預測模型
智用研究院AI產品總監周奇民表示,GPT-4本質上是一種逐字生成的文本預測模型,GPT的T代表Transformer,「給GPT一段上下文,GPT會預測下個字中機率最高的那個字,然後根據生成的字,再為上下文預測下一個字。」以「今天天氣真好」為例,把「今天天氣真」這5個字輸入模型,GPT會去計算下一個字在幾千、幾萬個中文漢字中出現的機率最高,計算出來得知「好」是機率最高的字,所以就把「好」這個字加進去,因此,ChatGPT的原理並未基於真實現實的原理,而是根據演算法計算出來的。
圖片、聲音及影片生成皆OK
圖片生成方面,周奇民指出,也可不斷訓練和優化演算法,使所生成圖片能更加接近真實人物的照片,至於聲音生成,以前想使用文字產生一段音樂,就會出現無法將人聲與背景音樂完全融合的瓶頸,「現在則能根據文字來生成音樂,和弦、人聲、音調、編排、和聲,所有聲音皆一氣呵成。」有了文字、圖片及聲音後,自然也就有機會生成影片,甚至跨模態生成,也就是文字、影像、音訊、影片間來回切換,「我輸入一段文字,竟可產出4秒鐘的影片。」
更多新聞:OpenAI執行長Altman來台解惑 建立正確流程、法規為AI發展關鍵
進階資料分析插件創造更多潛能
GPT-4強大的插件生態可讓GPT實現更多可能性,周奇民觀察,使用進階資料分析插件(原始程式碼解釋器),還能按照需求直接產生程式碼,並對自己產生的程式碼運行輸出,如果遇到報錯也能自行調試修改程式碼,直到能正常運作,「假如現在上傳一張包含文字的圖片,要求把文字抽出出來,便能解析該問題,立刻就在新建環境中撰寫一段Python的程式碼,並在其環境中運作。」另外,還能執行數據分析視覺化,藉由上傳文件,說明自身意圖,使ChatGPT能分析文件,編寫程式碼且產生表格,進行價格預測。
設定角色避免演算法疏失
周奇民認為,使用GPT過程中,可先替GPT設計一個角色,且告訴它只能基於自己的資料來源來回答問題,對於其他不知道的事情,要回答「不知道」,避免生成虛假或錯誤的內容,「這是演算法本身無法避免的特性,但還是有些辦法來緩解影響。」
瀏覽 559 次