TTS技術成熟,主流媒體加速入駐喜馬拉雅

fans news 發佈 2021-11-22T17:05:50+00:00

5G時代的到來對新聞傳播的形態產生了重要影響,對媒體來說,音頻已經成為新聞傳播的新陣地。2021年,眾多主流媒體加速入駐喜馬拉雅,藉助喜馬拉雅TTS ( Text-to-speech)技術加速製作新聞類音頻節目,讓聽眾有了更多的渠道聽到更權威的新聞。

5G時代的到來對新聞傳播的形態產生了重要影響,對媒體來說,音頻已經成為新聞傳播的新陣地。2021年,眾多主流媒體加速入駐喜馬拉雅,藉助喜馬拉雅TTS ( Text-to-speech)技術加速製作新聞類音頻節目,讓聽眾有了更多的渠道聽到更權威的新聞。


TTS技術又稱語音合成技術,是將輸入的文本轉換為語音的技術統稱。喜馬拉雅音頻算法團隊自研的TTS框架已處於行業領先水平,目前已經廣泛被運用於新聞等多種內容的製作中。


據悉,已有超過20家主流媒體和優質自媒體接入喜馬拉雅TTS進行日常音頻內容生產,包括新京報、環球時報、瀟湘晨報、時代周報、海外網、刺蝟公社等,共上線超過40張專輯,日均生產約500條聲音,覆蓋新聞短資訊及長資訊。其中,新京報在喜馬拉雅的TTS專輯共有16張,包括《新京報評論》、《鯨快訊》、《運動家》、《貝殼財經》、《政事兒》等,涵蓋財經、政治、體育等多方面的內容,日均產出聲音超過300條。表現亮眼的《鯨快訊》自2021年7月上線後,曾連續多周位列喜馬拉雅新聞類專輯新品榜第一位,現在也仍位於喜馬拉雅新聞類內容熱播榜的前列,播放量近7000萬,得到了用戶的廣泛好評。而環球時報上線的《環球觀察》專輯播放量也近千萬,評分高達9.2分。時代周報則上線了專注於財經新聞的《時代周報》專輯、專注於深度報導的《猛獁工作室》專輯和專注於區域報導的《讀城記》。


新京報APP運營部副主編、音頻負責人梅棟表示,通過喜馬拉雅的TTS技術,新京報快捷地實現了文字報導向音頻的轉化,開闢了新京報在音頻新媒體的新賽道,讓新京報優質報導有了新的附加價值,有了觸達用戶的新方式,突破了新京報內容傳播的閾值。


據悉,目前喜馬拉雅新聞類內容中日活躍用戶量最高的專輯均為TTS生產專輯。許多用戶表示,這些來自權威媒體的TTS新聞專輯,時效性強,且客觀可靠。一位用戶評價《鯨快訊》說:「挺好的一檔播放新聞的節目,時效性強、內容全面、涉及廣泛、播放清晰。」另一位用戶評價道:「就喜歡這類短資訊,突出重點即可,適合坐車的時候聽,時效性高,聲音也不錯。」可見,好的TTS技術與權威媒體內容的結合,既能夠滿足人們對於新聞實時性的需求,同時也滿足了人們對好內容的需求。


TTS技術將助力喜馬拉雅在現有的「UGC + PGC + PUGC」內容生態之外,進一步拓展AIGC的可能性。未來,喜馬拉雅將通過TTS技術平均每日為媒體生產1萬至2萬條新聞聲音內容。對於用戶來說,TTS技術的應用,會給他們帶來更豐富的好內容。而對於媒體來說,在無需投入更多人力的情況下,TTS技術將為他們打開新媒體轉型的新渠道,讓好的內容觸達更多的用戶。


喜馬拉雅已在TTS領域潛心鑽研多年,已經擁有非常成熟先進的TTS框架來支持新聞類聲音內容的生產。目前,喜馬拉雅新聞TTS支持多種標準普通話男聲和女聲的音色選擇,也支持多種生產方式,包括同步、異步、流式,每分鐘內能轉化約3000字左右。


負責喜馬拉雅TTS技術研發的喜馬拉雅智能語音實驗室團隊中擁有多名語言學專家,他們從科學專業的角度,定義了新聞播報中發音、韻律、重音、風格等標準規範,是喜馬拉雅TTS精品品質的強力保障。喜馬拉雅TTS新聞音庫製作也已建立起完善的標準化流程,從音色選擇、版權簽約、聲音錄製、數據標註、模型訓練等各個環節,都有完整的工具和質量把控。

技術上,喜馬拉雅TTS通過使用基於BERT模型的多任務建模,在文本正則化、多音字識別、韻律預測等NLP任務上,取得了行業領先的精度,使得TTS能夠對新聞中的日期、數字、縮寫、人名、生僻字、英文詞等進行正確發音。另外,喜馬拉雅TTS採用自研的聲學模型和聲碼器結構,既能高度還原錄音數據的音色和韻律,又能學習和遷移其他音色的風格,從而讓AI合成音的新聞播報也擁有更加細膩的情感和抑揚頓挫的起伏。


喜馬拉雅智能語音實驗室的盧恆博士表示,喜馬拉雅在小說TTS音色演繹方面已經積累了豐富的經驗。他說,用TTS音色演繹小說是非常難的,需要學習小說中的抑揚頓挫、情感表達、上下文關係,區分旁白和對白,並最終將作品完美演繹出來,這正是喜馬拉雅的優勢。而這些經驗可以運用到新聞TTS中來,讓新聞類的TTS內容更加準確、生動。


目前,傳統媒體或者自媒體若需要基於已有文字內容開發音頻內容,只需通過智能音頻平台或接口服務,選定喜馬拉雅已有的TTS音色,喜馬拉雅便能快速將這些文字轉化為音頻內容進行站內分發。同時,喜馬拉雅也支持媒體定製新音色,儘管這會需要更長的開發時間。


音頻的伴隨性、多場景共存等特性,能夠很好地滿足新時代下用戶獲取信息的習慣。在車載智能終端方面,喜馬拉雅與多個頭部車企品牌牽手,特斯拉中國、通用、上汽、吉利、比亞迪、蔚來汽車、理想汽車等都在合作名單中,為車主提供海量音頻服務。在家用智能終端方面,喜馬拉雅與阿里巴巴、小米、百度、騰訊、華為、美的等頭部企業達成合作,將內容生態與硬體產品進行廣泛的連接。 喜馬拉雅在全場景生態上的布局,讓媒體所生產的新聞資訊,可以滲透到用戶生活的各種場景,滿足不同用戶群體碎片化閱讀需求。


據透露,喜馬拉雅仍在持續推進不同音色的簽約和製作,以及多情感、多風格的TTS技術研發與升級,進一步提升內容生產的質量和效率。未來喜馬拉雅將會推出更加全面的新聞音色矩陣和更加自然逼真的新聞播報風格,助力更多媒體無縫銜接文字和聲音內容,搶占音頻新陣地,不斷打開對於聲音的想像,讓技術加持聲音、讓聲音服務生活。

關鍵字: