將文字變成音樂 Google開發新的人工智慧
編譯/莊閔棻
Google研究人員新開發的一款人工智慧應用MusicLM,可以根據文字提示生成長達數分鐘的音樂片段,甚至還可將口哨或哼唱的旋律轉換為其他樂器。
根據《The Verge》的報導,Google推出了自己的文字轉音樂人工智慧模型,雖然現在還未公開此模型讓大家使用,但是他們已經上傳了一些使用該模型製作的音樂樣本。
範例:這是Google根據以下文字生成的音樂範本(點擊聆聽)
電玩遊戲中的電子樂 (0:00-0:15)
在河邊聆聽的冥想歌 (0:15-0:30)
火的聲音 (0:30-0:45)
煙火聲(0:45-0:60)
簡單來說,就是針對相對應的文字內容,模型就可以生成相對應的音樂或是類似的聲音。MusicLM 甚至還可以模擬人聲,不過,雖然音調和整體聲音看似正確,但音質似乎不好。The Verge的記者就表示其聽起來有顆粒感和靜電聲。(點擊聆聽)
其實AI 生成音樂並不是現在才出現,據報導,其歷史甚至可以追溯到幾十年前。有些系統被大為稱道,因為可以創作流行歌曲、或是做出比 90 年代人們更佳的巴哈模仿、甚至還可以進行現場伴奏。不久前也有一個人工智慧模型Riffusion推出,它利用 AI 圖像生成引擎 StableDiffusion 將文本提示轉換為音訊圖,然後再轉換為音樂。但據Google稱,MusicLM 在「品質和對指令的還原度」、接收聲音和複製旋律方面優於其他系統。
然而令人失望的是,與其他涉足此類的人工智慧一樣,目前Google對 MusicLM 的謹慎程度仍然明顯高於其他人工智慧公司對類似技術的態度。Google表示,他們目前沒有發布模型的計畫,因為創意內容的潛在抄襲和文化扭曲的風險仍然很高。
參考資料:The Verge
瀏覽 626 次