什麼是生成式人工智慧?(上)│「創作」技術的四階段
「大數據分析」一詞已經不再是陌生的名詞,而人工智慧應用於資料分析的技術也日異月新,形成你我熟知的分析式人工智慧或是傳統人工智慧。現在,除了分析之外,人工智慧也能夠進行「創造」的行為,這樣的技術至今已經越來越廣泛;然而,在日常生活的運用,才剛揭開序幕。
根據《紅杉資本》(Sequoia Capital)的介紹,所謂生成式人工智慧(Generative AI)的技術規模已經變得更快速且更便宜,在某些狀況下的創作品質更超越了人類手作,並會在未來於每個需要進行創作的領域,大幅度地改變遊戲規則,甚至取代人力。此技術的願景,是藉由生成式人工智慧將創作與知識工作的邊際成本降至趨近於零,進而括勞動生產率與經濟價值。
這家投入於生成式人工智慧的公司將該技術的發展切分為四個階段。
- 第一波:小型模型、至高無上(2015年之前)
這個時期,小型模型被認為是語言理解技術的「天花板」,除了擅長分析任務,且能在貨運公司的工作上進行有效運用,不過在產出或是創作方面,還仍在發展階段。
- 第二波:規模競賽(2015年至今)
以 Google Research 的一篇論文(Attention is All You Need)作為分水嶺。其中描述了一種新型的自然語言認知的神經網路架構,稱為轉換器(transformer),它可以生成高品質的語言模型,也具有更高的可並行性,同時模型的訓練時間明顯減少。
隨著模型逐漸擴增,人工智慧的水準漸漸地從與人類水準並駕齊驅,再到超越人類的層級。在這個階段,人工智慧在手寫、語音、圖像識別、閱讀理解以及語言理解方面已經有超越人類的水準了。例如: OpenAI 的 GPT-3 已經可以從代碼產出帶有黑色幽默的笑話了。
儘管技術規模仍尚未廣泛,且作為雲端服務的成本仍然偏高,但是生成式人工智慧已經開始加入了這個領域的戰爭。
- 第三波:更好、更快、更便宜(2022年以上)
時至今日,運算成本變得相對便宜。諸如擴散模型(diffusion models)的新型技術充分降低了模型訓練和進行推理所需的成本。在這個趨勢下,研究人員能夠持續研發更好的演算法以及更龐大的模型。對於一直無法獲得大型語言模型(Large Language Model)的開發人員來說,這扇大門已經敞開,可以提供更多的探索與應用開發。
- 第四波:殺手級 APP 出現(現在)
隨著平台層的鞏固,模型繼續發展得更好、更快、更便宜,模型的訪問也趨向於免費和開源,更重要的是應用層已經成熟,可以激發更多的創造力。正如當今不同的設備透過 GPS、鏡頭和無線傳輸等新功能產出新的 APP 一樣,《紅杉資本》預計大型模型的開發將會刺激新一代的生成式人工智慧 APP。(編譯/戴偉丞)
延伸閱讀:人工智慧「創作」作品 生成式AI在矽谷逐漸抬頭
科技評論:Midjourney 人工智慧可以打敗藝術家嗎?|專家論點【朱楚文】
資料來源:SEQUOIA
瀏覽 2,034 次