練習時長兩分半,大家都能發專輯!音樂界GPT帶你寫歌

36氪 發佈 2024-03-28T18:19:30.487112+00:00

文|陳斯達編輯|鄧詠儀音樂界也被AI拿下。莫扎特和貝多芬如果在世,得到的是或許是驚嚇而不是驚訝——怎麼大伙兒幾秒就能「寫」出專業水準的歌?這支音樂界的馬良神筆,便是文生音樂模型Suno V3,由AI音樂生成創企Suno AI於3月22日發布。

文|陳斯達

編輯|鄧詠儀

音樂界也被AI拿下。

莫扎特和貝多芬如果在世,得到的是或許是驚嚇而不是驚訝——怎麼大伙兒幾秒就能「寫」出專業水準的歌?

這支音樂界的馬良神筆,便是文生音樂模型Suno V3,由AI音樂生成創企Suno AI於3月22日發布。

圖源:X

與此前發布的V2相比,V3生成的作品質量提升明顯,涵蓋風格流派更多,對提示詞的依從性更強,幻覺問題更少。

創作詞曲的同時,Suno還把專輯封面都設計好了。

Suno的首頁榜單里,已經出現涵蓋不同語言、風格迥異的曲子。

一首名為We Go!的中文重金屬搖滾播放直逼13萬,點讚過千,在眾多英文歌中顯得格外耀眼。

圖源:Suno

還有把宮保雞丁的食譜作為prompt的,寫出一首歌劇。

圖源:Suno

好玩易上手,曲子給你改到滿意為止

Suno的創作界面大道至簡:輸入提示詞,稍等片刻,便能等來一段兩分鐘長的曲子。

咱要求也別太高,先不說是不是真好聽,Suno至少兌現了承諾——」曲由心生(From your mind to music)「。

Suno有兩個可選按鈕——「自定義」與「純音樂」。

點」自定義」,相當於開「手動擋」,即自行填詞,細化音樂流派,給即將生成的作品提前取歌名。這樣能對生成的作品有更多決定空間。

點「純音樂」,即不能生成與自定義歌詞了。

圖源:Suno

和當下Midjourney、Pika等AIGC應用的邏輯類似——「傻瓜式」操作,提需求即可。

但你要做一個合格的甲方,至少告訴Suno需要的主題、流派、風格、情緒、樂器、人聲。畢竟創作有一定水準的、或者腦海中的音樂,少不了精準全面的提示詞prompt。

雖然練習時長只有兩分半,但有了ChatGPT和Claude,就能做你的創作小助理(甚至已有相關插件)。

圖源:ChatGPT

心裡有數之後,又讓GPT給我總結了幾個詞(cyberpunk, futuristic, tension, synthesizers),隨後把顆粒度給Suno對齊,實現一套賽博作曲組合拳。

乙方Suno就給我反饋了作品。還別說,真像那麼回事!

Suno生成的曲目,圖源:Suno

但不是特別滿意的地方在於:鼓點加的太遲了,節奏不夠快。再改!點擊歌曲封面下方的Remix,Suno就支持在原曲基礎上疊代修改了。

除了自己創作的曲目,其他用戶上傳的作品裡,如果你喜歡,也能點擊「在原曲基礎上創作」(Continue From This Song),打造自己的新曲目!

圖源:Suno

目前,在免費版里,Suno所有功能都能體驗。每天50積分能寫10首歌,質量好點,還能湊合著發個專輯。你說自己創作欲爆棚?就是另外的價錢了。每月10刀升級成Pro Plan,夠你寫500首!

Suno的付費標準,圖源:Suno

但玩笑歸玩笑。Suno在官網裡明確指出,只有尊貴的付費玩家才能將生成的歌曲用於商業目的。

Suno對版權的表述,圖源:Suno

沒付錢問題也不大,你寫的歌,Suno幫你記著,等哪天你付錢了才變成你的。只是發發社交媒體,完全沒問題。

更別說如果你的歌收集到網友們足夠多的贊,還有機會登上Suno自己的Trending榜單。親自寫歌打榜,你就是朋友圈裡最靚的仔!

Suno里的熱歌榜,圖源:Suno

像GPT一樣訓練,讓10億人更多參與音樂

世界上聽歌的遠遠多過做歌的人,Suno 正是要打破這種不平衡。

據《滾石》報導,Suno的CEO及聯合創始人Shulman提到, 「如果人們更加熱愛音樂,更加專注於創作,培養更加獨特的品味,這對藝術家來說顯然是件好事。我們的願景是希望創造一個有利於藝術家的環境。我們並不是想取代藝術家。」

Suno官網轉載的《滾石》雜誌特稿,圖源:《滾石》雜誌官網

Suno 希望」讓十億人比現在更多地參與音樂」,將音樂創作進一步大眾化。

總的來說,Suno 的工作方式和 ChatGPT 等語言模型差不太多,將語料分解為token,學習數百萬種用法、風格和結構,然後按需重建。基於大量訓練數據,Suno便能根據提示「創作」詞曲。

但這讓AI學習音樂無比困難。Mikey Shulman提到:「音頻不像單詞一樣獨立,它是一種波,一種連續信號。「高質量的音頻採樣通常達到44khz或48hz,意味著每秒48000個token。他表示,如何以合理方式將音頻切分供模型學習十分關鍵,未來也還有很長的路要走。

這個爆火全球的產品,背後的公司成立不到兩年,目前有12名員工。聯合創始人都是機器學習方面專家。一直到2022年,他們都在劍橋的另一家AI公司Kensho共事,專注於為複雜商業問題提供AI方案。

四人在Kensho的時候開發了一種技術,用於轉錄上市公司的財報電話。當時Shulman和同事們便開始關注AI音頻的潛力。一開始還只是想做某種助聽器,甚至想通過音頻分析發現機器故障。

他們後來發布的第一款產品是名為Bark的文本轉語音程序。但對Bark早期用戶進行調查時,他們發現用戶更想要一種音樂生成工具,這成為Suno誕生的緣由之一。

Suno V3版本可能還有諸多弊端,如生成音頻的壓縮感強,有些流派的作品創作效果不佳。但Suno的V4版本已經在路上了。

今天,AI生成音樂的玩家不只有Suno。Adobe的Project Music GenAI、YouTube的Dream Track此前都引起不少討論,Suno目前生成的質量無疑「遙遙領先」。

大家似乎對版權都格外謹慎。Suno V3為了進一步防止音頻被濫用,同時也開發了專有的不可聽水印技術,可檢測歌曲是否使用 Suno 製作。Dream Track由谷歌 DeepMind的Lyria音樂生成模型提供支持。谷歌表示,使用 Lyria 創建的曲目將帶有肉耳聽不見的 SynthID 水印,並且可以在修改曲目時保留。

圖源:Suno

但Suno對自身的定位略有不同。當Dream Track允許用戶使用像 Charlie Puth 知名歌手的聲音創作音頻時,Suno明確指出:Suno為原創音樂而設計,不允許用戶在提示中指定任何特定藝術家的風格,同時也不會使用真實藝術家的聲音。

另外,每次在Suno里編輯歌詞時,都有點讓人汗流浹背,Suno不厭其煩地說:要麼AI幫你寫,要麼你自個兒寫,除非你複製來的詞有版權!

圖源:Suno

不過,「高傲」的Suno,還未針對進行模型訓練的數據來源進行說明。比起文字,音樂生成領域尚在很早的階段。

關鍵字: