講師:侯宜秀 台灣人工智慧學校(AIA) 秘書長 律師,專注於創新科技、開放資料、開放政府等數位治理議題及相關法律規範。2017年協助設立台灣人工智慧學校基金會,2021 年起擔任秘書長,推動課程轉型及開源AI平台「風火輪計畫」。 前言 在AI大爆發的年代,隨著人機協作愈來愈頻繁,許多的法律問題也不斷產生。本次課程將討論AI科技對現代社會與法制面的衝擊與生成式AI相關的爭議案件,並在課程最後提供企業運用生成式AI的規範指引。不過,我們也要提醒大家,今天所分享的內容並非法律意見,所以如果大家對於個案的適用結果有疑義,還是需就個案內容仔細地與律師討論。 一、AI法律的第零課 雖然本次課程名稱是AI法律第一課,但要真正了解AI相關法律問題,我們還是要先從第零課開始,在正式進入第一課前與大家分享四件事。首先,當我們討論AI法律時遇到的第一個問題就是如何定義人工智慧(Artificial Intelligence, AI)。雖然法律中對於AI的定義尚未有共識,但對AI之結構可以理解為「透過大數據,加上演算法訓練,最後得到的AI行為,而其背後有軟硬體的基礎建設支撐此結構」。然而,由於生成式AI的崛起,使得AI行為中有更多的人類行為因素加入,導致人機協作的特徵更加明顯。因此,我們現在所講的人工智慧就不只如上述所說是單純的資料加上演算法訓練所產生的AI行為而已,而是要再加上更多的人類行為。而本次課程所要討論的範疇即為此人機協作下的人工智慧相關法律問題。 第零課的第二個重點為AI近年開始快速發展,法律卻難以趕上AI發展速度。自從2016年AlphaGo在圍棋競賽中擊敗韓國世界圍棋冠軍李世乭後,AI開始以超乎想像的速度發展。AI能夠做的事愈來愈多,且懂得運用AI的人也愈來愈多,這樣的快速發展使得法律的規範難以趕上。我們必須了解的第三點則是「人工智慧的背後還是人」。目前AI擬人化的狀況相當嚴重,於是有許多人開始討論AI如何負起相關權責。不過我們必須了解,由於人工智慧的背後還是人,所以權利與義務的主體最終還是「人」。最後,在現今人工智慧的時代,虛擬世界的法律是由傳統政府所頒布的法律、市場、工程師所寫的原始碼與各類社群規範和條約共構而成。因此在制定AI相關法條時,我們必須納入上述四個面向,並在討論時邀請多方利害關係人參與討論,共創AI相關法條。 二、AI是取代人類工作,或是人類的好幫手? 生成式AI如果能夠妥善運用,將會是人類的好幫手。然而,生成式AI也已經開始取代人類的工作。近期好萊塢編劇與演員罷工的訴求就與生成式AI有關。生成式AI龐大的資料庫再加上它的演算法,讓AI可以很快地生成一個故事或是劇本,好萊塢編劇因而要求電影公司在劇本的創作階段不得使用生成式AI。另外,生成式AI影響了文化多元性。由於目前生成式A大多使用西方白人世界的資料,因此其所生成的結果也是以西方白人的價值觀為主。在這樣的情況之下,東方文化與中文形成相對弱勢,更不用說我們所使用的繁體中了。因此,身在台灣的我們應了解生成式AI對我國文化所帶來的衝擊,並在可能的情況下開始訓練我們自己的大型語言模型。 那麼,生成式AI究竟是會取代我們的工作或是增能人類?根據今年6月麥肯錫全球研究院(McKinsey Global Institute)調查,生成式AI能夠替其分析的63個使用案例中增加2.6兆至4.4兆美元的價值,其中受到影響的大部分案例分布於客戶服務、行銷與銷售、軟體工程與研發此四個領域。另外,也有研究指出,與上一波工業革命影響藍領階級不同,此次由AI所領導的科技革命之影響預計將涵蓋所有工資水平,而高收入工作與白領階級將有高機率被AI替代。 然而,生成式AI的影響也擴及不同面相。以職業方面,有些工作會消失,但也有可能產生新的工作。在人機協作的時代,由於目前生成式AI的發展尚未成熟,因此不要求正確性與高品質的工作將可能先被取代,像是淘寶的模特兒與心靈導師等。不過,生成式AI的出現也讓某些新工作應運而生,例如詠唱詩與AI訓練師。另外,生成式AI對於不同年齡層的衝擊也有所不同。對於AI原生世代與AI移民者(即出生時尚未有AI的世代),其學習成本會有所不同。最後,由於各地區的職業分布、監管法規、文化差異與AI技術導入程度不同,生成式AI的影響也會對不同地區產生大小不一的衝擊。不過需要注意的是,雖然對某些地區的影響可能較小,但長遠來講將會影響到國家整體的發展,絕對不能大意。 三、AI對財產權的影響 討論AI對財產權的影響前,我們要先將前述所說的AI的基本架構分成兩個部分。第一部分為資料訓練階段。在此階段可能產生的法律相關疑慮包含訓練資料是否侵權、是否可以主張轉換性合理使用、有無侵害著作權或個人隱私。第二部分則為人機協作階段。此階段所產生的法律疑慮則包含生成結果的財產權歸屬、權利主體有哪些、是否具有獨創性與是否可以主張轉換性合理使用。 模型訓練資料 研究顯示,AI模型訓練所用的資料種類包括網頁、對話資料、書籍、科學資料、程式原始碼(圖1)。可想而知,以上所列的資料來源有許多應該都是沒有經過授權的,而原始碼是最早被訴訟的項目,生成式AI應用程式Stable diffusion與Midjourney都因可能侵犯著作權的疑慮而被告上法庭。然而,這些生成式AI是否有利用他人圖片並不是爭議點,真正的爭議點是如果AI利用這些圖片做訓練,那麼是否為合理使用的保護範圍,而是否為合理使用,則不同國家會有不同的規範。對台灣來說,我們非常需要一個有權責的機關解釋訓練資料是否可以主張合理使用。國科會近期已開始進行開發台版ChatGPT的計畫,然而此計畫是利用llama 2的模型再加入台灣在地的資料進行訓練。因此,加入台灣在地的資料進行訓練是否需要取得授權,或者是具有主張合理使用的保障,將是非常重要的問題,且也會對未來相關案例產生示範性作用。針對這個問題,我們認為是有機會透過法條解釋將此問題歸於合理使用的範疇。我國法律規定,「著作權人團體與利用人團體就著作之合理使用範圍達成協議者,得為前項判斷之參考」,也就是若著作權人團體和利用人團體能夠針對合理使用的範圍達成協議,將可以解決生成式AI是否侵害著作權之疑慮。 圖 1:AI模型訓練用資料種類圓餅圖,大致包含網頁、對話資料、書籍、科學數據與程式原始碼。 生成物的財產權歸屬 生成式AI所引發的法律爭議中討論最熱烈的可以說是其生成物的財產權歸屬問題了。其實,生成物的財產權歸屬非常簡單,如同本文開頭所說,人工智慧的背後還是由人主導,因此權利義務的主體也都還是人。以2019年中國深圳法院的判決為例,AI程式的著作人享有AI程式生成物的著作權。該法院認為,該案的AI團隊包含編輯、產品與技術開發,而AI運作時數據類型的輸入與數據格式的處理、觸發條件的設定、文章框架模板的選擇和語料的設定、校驗演算法模型的訓練等都是由該AI團隊人員選擇與安排,所以深圳法院認為AI程式的製作團隊享有AI生成物的著作權。 而我國的著作權保護則可以概括為「四必一沒有」五項要件: 必須是人類精神力作用的結果:即法律保障的主體是人,所以我們若想登記AI的生成物,則必須以做prompt的人或製作AI的人之名義登記。 必須經由「表達」而外顯:舉例來說,若我們寫了一本書教導讀者對抗情緒勒索的方法,則著作權法所保障的是我們在書中的文字,而不是我們的方法論。 必須獨力創作且具有創作性。 必須屬於文學、科學、藝術或其他學術範圍。 「一沒有」則指不得是著作權法第9條明文規定不保護的標的,如憲法、法律、命令或公文;中央或地方機關就前款著作作成之翻譯物或編輯物;標語及通用之符號、名詞、公式、表格、簿冊或時曆;單純為傳達事實之新聞報導所作成之語文著作;依法令舉行之各類考試試題及其備用試題。 簡言之,在判斷一件作品或者AI生成物是否得以受著作權保護,必須符合四個必須,且不能是第9條明文規定排除保護的範圍。然而,不受著作權保護的生成物,也有可能可以尋求其他法律的保障,如商標法與民法等。 四、結語:企業用AI須注意的事 隨著AI的快速發展,未來將產生更多AI相關法律問題。因此在課程尾聲,我們想提醒公司在使用AI時需要特別注意的幾件事。首先,由於AI還處於發展階段且變化相當快,所以若公司欲訂定相關規範管理AI的使用,建議可以每3個月定期檢討改善。第二,在開始詠唱之前,我們必須了解,公司應明訂內部可以使用的生成式AI、禁止使用的功能(像是取得事實資訊)以及誰需要負最後的責任。我們也必須注意,我們輸入生程式AI的所有資料都是向第三方皆露,且輸入的資料也會被欲設為訓練資料,所以要小心不要將機密資訊輸入生成式AI中。第三,在輸入資料時則要避免利用他人著作進行訓練、輸入他人的商標、個資或公司內部資料。最後,利用AI生成物時要注意,由於生成的內容可能包含不實訊息、可能毀損他人名譽或侵害他人著作權,所以建議大家不要使用學習特定的作者或畫家作品的AI,除非該AI有經過授權。我們也要避免在提示中輸入現有著作物、作者名或作品名稱,以免侵犯他人著作權。而在使用生成內容時,我們也要確保生成物不與現有著作物相似。我們也建議,公司行號可以建立一套機制紀錄生成、後製、編輯與改作的過程,以便在出問題時可以舉證,以保護自己的權益。 【若想回顧完整版課程影音,請點選此連結;有任何問題或分享,也歡迎在本文底下留言。】