練習時長兩分半，大家都能發專輯！音樂界GPT帶你寫歌

文｜陳斯達

編輯｜鄧詠儀

音樂界也被AI拿下。

莫扎特和貝多芬如果在世，得到的是或許是驚嚇而不是驚訝——怎麼大伙兒幾秒就能「寫」出專業水準的歌？

這支音樂界的馬良神筆，便是文生音樂模型Suno V3，由AI音樂生成創企Suno AI於3月22日發布。

圖源：X

與此前發布的V2相比，V3生成的作品質量提升明顯，涵蓋風格流派更多，對提示詞的依從性更強，幻覺問題更少。

創作詞曲的同時，Suno還把專輯封面都設計好了。

Suno的首頁榜單里，已經出現涵蓋不同語言、風格迥異的曲子。

一首名為We Go！的中文重金屬搖滾播放直逼13萬，點讚過千，在眾多英文歌中顯得格外耀眼。

圖源：Suno

還有把宮保雞丁的食譜作為prompt的，寫出一首歌劇。

圖源：Suno

好玩易上手，曲子給你改到滿意為止

Suno的創作界面大道至簡：輸入提示詞，稍等片刻，便能等來一段兩分鐘長的曲子。

咱要求也別太高，先不說是不是真好聽，Suno至少兌現了承諾——」曲由心生（From your mind to music）「。

Suno有兩個可選按鈕——「自定義」與「純音樂」。

點」自定義」，相當於開「手動擋」，即自行填詞，細化音樂流派，給即將生成的作品提前取歌名。這樣能對生成的作品有更多決定空間。

點「純音樂」，即不能生成與自定義歌詞了。

圖源：Suno

和當下Midjourney、Pika等AIGC應用的邏輯類似——「傻瓜式」操作，提需求即可。

但你要做一個合格的甲方，至少告訴Suno需要的主題、流派、風格、情緒、樂器、人聲。畢竟創作有一定水準的、或者腦海中的音樂，少不了精準全面的提示詞prompt。

雖然練習時長只有兩分半，但有了ChatGPT和Claude，就能做你的創作小助理（甚至已有相關插件）。

圖源：ChatGPT

心裡有數之後，又讓GPT給我總結了幾個詞（cyberpunk, futuristic, tension, synthesizers），隨後把顆粒度給Suno對齊，實現一套賽博作曲組合拳。

乙方Suno就給我反饋了作品。還別說，真像那麼回事！

Suno生成的曲目，圖源：Suno

但不是特別滿意的地方在於：鼓點加的太遲了，節奏不夠快。再改！點擊歌曲封面下方的Remix，Suno就支持在原曲基礎上疊代修改了。

除了自己創作的曲目，其他用戶上傳的作品裡，如果你喜歡，也能點擊「在原曲基礎上創作」（Continue From This Song），打造自己的新曲目！

圖源：Suno

目前，在免費版里，Suno所有功能都能體驗。每天50積分能寫10首歌，質量好點，還能湊合著發個專輯。你說自己創作欲爆棚？就是另外的價錢了。每月10刀升級成Pro Plan，夠你寫500首！

Suno的付費標準，圖源：Suno

但玩笑歸玩笑。Suno在官網裡明確指出，只有尊貴的付費玩家才能將生成的歌曲用於商業目的。

Suno對版權的表述，圖源：Suno

沒付錢問題也不大，你寫的歌，Suno幫你記著，等哪天你付錢了才變成你的。只是發發社交媒體，完全沒問題。

更別說如果你的歌收集到網友們足夠多的贊，還有機會登上Suno自己的Trending榜單。親自寫歌打榜，你就是朋友圈裡最靚的仔！

Suno里的熱歌榜，圖源：Suno

像GPT一樣訓練，讓10億人更多參與音樂

世界上聽歌的遠遠多過做歌的人，Suno 正是要打破這種不平衡。

據《滾石》報導，Suno的CEO及聯合創始人Shulman提到，「如果人們更加熱愛音樂，更加專注於創作，培養更加獨特的品味，這對藝術家來說顯然是件好事。我們的願景是希望創造一個有利於藝術家的環境。我們並不是想取代藝術家。」

Suno官網轉載的《滾石》雜誌特稿，圖源：《滾石》雜誌官網

Suno 希望」讓十億人比現在更多地參與音樂」，將音樂創作進一步大眾化。

總的來說，Suno 的工作方式和 ChatGPT 等語言模型差不太多，將語料分解為token，學習數百萬種用法、風格和結構，然後按需重建。基於大量訓練數據，Suno便能根據提示「創作」詞曲。

但這讓AI學習音樂無比困難。Mikey Shulman提到：「音頻不像單詞一樣獨立，它是一種波，一種連續信號。「高質量的音頻採樣通常達到44khz或48hz，意味著每秒48000個token。他表示，如何以合理方式將音頻切分供模型學習十分關鍵，未來也還有很長的路要走。

這個爆火全球的產品，背後的公司成立不到兩年，目前有12名員工。聯合創始人都是機器學習方面專家。一直到2022年，他們都在劍橋的另一家AI公司Kensho共事，專注於為複雜商業問題提供AI方案。

四人在Kensho的時候開發了一種技術，用於轉錄上市公司的財報電話。當時Shulman和同事們便開始關注AI音頻的潛力。一開始還只是想做某種助聽器，甚至想通過音頻分析發現機器故障。

他們後來發布的第一款產品是名為Bark的文本轉語音程序。但對Bark早期用戶進行調查時，他們發現用戶更想要一種音樂生成工具，這成為Suno誕生的緣由之一。

Suno V3版本可能還有諸多弊端，如生成音頻的壓縮感強，有些流派的作品創作效果不佳。但Suno的V4版本已經在路上了。

今天，AI生成音樂的玩家不只有Suno。Adobe的Project Music GenAI、YouTube的Dream Track此前都引起不少討論，Suno目前生成的質量無疑「遙遙領先」。

大家似乎對版權都格外謹慎。Suno V3為了進一步防止音頻被濫用，同時也開發了專有的不可聽水印技術，可檢測歌曲是否使用 Suno 製作。Dream Track由谷歌 DeepMind的Lyria音樂生成模型提供支持。谷歌表示，使用 Lyria 創建的曲目將帶有肉耳聽不見的 SynthID 水印，並且可以在修改曲目時保留。

圖源：Suno

但Suno對自身的定位略有不同。當Dream Track允許用戶使用像 Charlie Puth 知名歌手的聲音創作音頻時，Suno明確指出：Suno為原創音樂而設計，不允許用戶在提示中指定任何特定藝術家的風格，同時也不會使用真實藝術家的聲音。

另外，每次在Suno里編輯歌詞時，都有點讓人汗流浹背，Suno不厭其煩地說：要麼AI幫你寫，要麼你自個兒寫，除非你複製來的詞有版權！

圖源：Suno

不過，「高傲」的Suno，還未針對進行模型訓練的數據來源進行說明。比起文字，音樂生成領域尚在很早的階段。