36氪首發|「DeepMusic」完成近千萬美金A+輪融資,用AIGC音樂引擎打造「全民音樂創作時代」

36氪 發佈 2024-02-27T14:49:19.157591+00:00

36氪獲悉,人工智慧音樂服務商「DeepMusic」於日前宣布完成了近千萬美金的A+輪融資,GGV紀源資本領投,豐元資本跟投。

36氪獲悉,人工智慧音樂服務商「DeepMusic」(靈動音)於日前宣布完成了近千萬美金的A+輪融資,GGV紀源資本領投,豐元資本跟投。融資額將用於自研AIGC音樂引擎及其應用的研發,加速國內外市場拓展。一葦資本擔任長期獨家財務顧問。

「DeepMusic」成立於2018年,是國內首家基於自研AIGC能力打造音樂引擎的國內人工智慧音樂服務商,致力於將AI音樂技術轉化為面向各類音樂人群的場景級應用及產品。

「AIGC的出現,極大地變革了人與內容的關係。」

「DeepMusic」創始人兼CEO劉曉光告訴36氪,在大模型正在迅速分走一部分內容創作心智的當下,音頻模態還沒有像自然語言、圖像等一樣被廣泛應用和場景化。而音樂實際上和繪畫、影像等其他藝術形式一樣,雖然進行過系統性學習的人總是愛好者中的極少數,但每個人其實都有非常個性化的喜好和理解。在AIGC越來越垂直的技術與資本趨勢下,AI所帶來的更普惠的音樂創作方式和技術交互價值即將到來。

音樂知識雲化,讓AI「聽懂」音樂

對市場的初步理解和把握,來自於劉曉光在音樂社團中度過的大學生活。2013年,在清華就讀化學專業的劉曉光成為了一名頗有名氣的音樂製作人,也結識了同在清華熱愛音樂和人工智慧的夥伴 。劉曉光和其他幾個同時愛好音樂和編程創始成員,發現了「AI x 音樂」的魅力,組建了「DeepMusic」的創始團隊。

數據顯示,目前全球音樂用戶已經高達16.3億,但音樂作為社交媒體、短視頻平台等流行視角下最重要的自我表達方式之一,專業性門檻卻一直沒有被降下來。儘管近年來,庫樂隊等工作站已經一定程度上簡化了編曲的入門難度,但樂理知識和數字演奏能力的阻礙,導致了距離「全民音樂創作時代」的到來,還有很長的路要走。

而產業機會的背後,一邊是唱片公司和有限且昂貴的專業編曲資源幾乎壟斷了傳統編曲流程,另一邊是個人用戶的創作影響力正在與日俱增。根據抖音數據,在播放量大於1萬的視頻中,有62%的內容來自於粉絲量1萬以下的普通創作者。

「我們想要讓音樂愛好者可以不用花大量的時間系統學習音樂,沒有樂理知識的人也能表達自己的音樂天賦。」

劉曉光直言,當下,數字世界留給非專業音樂愛好者參與創作的方式十分有限。由於缺乏出色的音樂底層基礎設施,音樂創作的門檻之高、創作耗時之長,都令普通人望而卻步。就像我們很難想像在全民K歌等翻唱應用出現之前,有多少熱愛唱歌的人善於使用電腦上的專業錄音軟體混縮聲軌。

在AIGC時代,一切關於全民創作的「癢點」,都有了更直白的回答。

相比AI繪畫、ChatGPT等所代表的模態形式,用AI生成音樂的難點之一在於更大的語義鴻溝,即語言描述與音樂內容的對應。這也是傳統音樂製作人最重要的工作:拿到曲譜之後,製作人不只需要編曲,還需要通過溝通或協調音樂人把創作者抽象的風格描述和情緒語言轉化為音樂符號。

除了自然語言處理這一更下游的能力,在過去的AI音樂產業中,結構化數據是更關鍵的痛點。

「可以說,音樂的知識從來沒有能夠被人類檢索過。」

沒有公開的結構化數據,是智能音樂這一交叉領域沒有先於其他賽道爆發的原因。回想起過去參與音樂教育的經歷,劉曉光表示,樂理結構本身是枯燥的,比如教一個小孩「四三拍」,最好的學習方式就是跟著熟悉的兒歌打拍子。但在人們日常聽的流行音樂里,大多數人還是不知道哪些歌是四三拍的,也不知道諸如「悲慘」、「激進」的聽感是通過哪些音樂符號的應用來實現的。只有先通過數據標註把人類音樂存量中的音樂知識和信息拆解出來,進行連接和雲化,才能讓AI聽懂音樂,從而構建貼近人類專業製作過程的AIGC。

為了實現這一目標,「DeepMusic」創建了音樂結構標準UMP及自動標註技術,並在過去幾年中分析了大量音頻文件,將它們的每個小節用了什麼樣的音高、和弦、段落等等音樂符號,將超過2萬首歌的樂理信息轉化為一個可用於訓練模型的資料庫,使得識別準確率能夠達到90%以上,能夠滿足大部分C端用戶的場景需求。

當技術環境來到AIGC進入到自然語言大模型的時代,「DeepMusic」自研的AIGC音樂引擎「Mutrix」在兼容開源語言模型的基礎上擴展為多模態模型,最終達成自然語言對音樂的控制。

目前,「DeepMusic」的音樂結構標準UMP已經被TME旗下全民K歌、QQ音樂多個場景應用。與此同時經過多次疊代的UMP Board已經自主完成了40萬首歌曲的AI自動標註。在輸出的音樂風格上,「DeepMusic」也正在進行出海內容的擴充,加速推進海外市場布局。

工作站嵌入工作流,元宇宙打開泛C端市場

「一個音樂愛好者想要創作一首歌,需要支付的編曲費用平均在5000元左右。」

根據劉曉光的介紹,單就編曲而言,這一價格甚至和一般唱片公司支付給編曲師和後期的成本差不多。但普通愛好者創作音樂的初步目的可能並不是變現,而是個人愛好或者社交目的,這就導致了一個內容創作收益和成本極其不對等的情況。

然而,儘管音樂創作並不是一個很「痛」的生活必需品,需求卻在文化娛樂、青少年教育、遊戲等多個領域保持著顯著增長。數據顯示,2021年中國在線音樂用戶達6.89億,在全球16.3億左右的活躍音樂用戶中占比可觀。同時,中國K12階段進行音樂學習的青少年占比高達56.5%

產品方面,技術特點決定了AIGC目前還是一個只能應用於生產端的能力,而流行音樂卻似乎是一個「供大於求」的產業。考慮基於音樂引擎打造面向各層級音樂用戶的音樂消費端的新機遇,「DeepMusic」的產品矩陣目前包括:旨在降低專業創作門檻的音樂工作站「和弦派」,該產品已進入內測階段;以及致力於覆蓋泛音樂用戶的社交娛樂元宇宙產品「音夢島」,將線下音樂娛樂場景線上化;已上線了「口袋樂隊」作為音樂創作與音樂元宇宙玩法的試驗場。

「和弦派」產品界面

「口袋樂隊」產品界面

其中,「和弦派」作為比庫樂隊門檻降低極大的音樂工作站,對於AIGC音樂能力、實時渲染能力等具有更高的技術要求,將幫助「DeepMusic」把底層AI音樂技術率先嵌入到音樂創作的工作流中。

從2019年開始,「DeepMusic」團隊用了很長時間打通引擎級的工程化開發,使得一個跨平台的高性能音頻引擎成為了可能。與近來炙手可熱的Google MusicLM相比,「DeepMusic」將目光聚焦於與創作者深度結合的音樂的創作以實現自我表達,而非價值占比僅為1%的功能性音樂(如輕音樂、睡眠音樂、視頻配樂等)。

團隊方面,「DeepMusic」核心成員均為清華教育或科研背景,且在音樂學習和編曲方面有著深厚造詣。CEO劉曉光作為音樂製作人主導製作近百首作品;CTO苑盛成本碩博畢業於清華大學工程物理系,在美國羅格斯大學大數據實驗室任博士後,從事音樂和聽覺模型研究。

談及AIGC可能會涉及的版權問題,劉曉光表示,在當前流行音樂的話語體系下,所謂的「創意」都是有規律可循的。在此背景下,用AI去積累和理解足夠多的音色、演奏方式等,從而建立全集,是完全可實現的。

目前,「DeepMusic」已經和全民K歌落地了多項合作,例如上線了一個把存量歌曲一鍵remix成其他風格的功能,為用戶提供更豐富的內容表達空間。這項技術已經觸達了上千萬的用戶,被使用超過3億次。

「短期內,我們會想辦法把AIGC的能力更多地嵌入到音樂人熟悉的工作流中。」

未來,「DeepMusic」將繼續深耕技術成果的產品化轉化和商業化探索,迎著AIGC的浪潮,讓音樂創作變得像現在的視頻創作等場景一樣簡單快捷,讓普通人的靈感和天賦不再因為專業門檻而被扼殺。

-----------------------

GGV紀源資本執行董事羅超:我們從2019年開始持續掃描娛樂科技賽道,關注遊戲、影視、動漫、音樂等大的娛樂主題下的技術公司,包含了渲染物理仿真、AI生成等各種技術,支撐如今多媒體的豐富的數位化娛樂方式。娛樂看似是情感驅動的事,但背後又有很多理性的技術可以驅動和助力的方式。音樂是娛樂科技的重要賽道,也是一個離我們生活如此之近的行業,但同時又如此傳統。我們認為AI+數據驅動的方式,可以讓整個行業有革新。DeepMusic在這件事情上技術積累非常深厚,團隊對此又有著非常深的熱愛。我覺得只有真的愛一個行業,並且把自己所學投入在自己愛的事情里,把感性和理性做一個最完美的結合,才能夠把它做到最好。所以在看完這個行業之後,DeepMusic團隊是我願意去支持、去陪伴一起創業的團隊。

一葦資本合伙人林文欣:一葦長期關注AI、XR等底層技術因素對生產力及C端消費者生活與娛樂方式的改變,從22年初起尤其關注生成式AI給各行各業帶來的深切變革。很榮幸持續與DeepMusic團隊合作,合作中始終被DeepMusic團隊對音樂的純摯熱愛、極致的聰明和自我疊代能力,以及不斷被驗證的技術遠見所深深感染。作為AIGC音樂賽道占據絕對優勢的先行者,期待DeepMusic引領「人人都是音樂家」的時代向我們大步走來。

關鍵字: