算法新聞|周末讀書

德外5號 發佈 2020-03-08T15:04:24+00:00

目錄第一章個性化分發與內容生產變革第二章 算法推薦原理第三章 用戶畫像的標籤體系第四章 文本型內容的建模與分析第五章 智能推薦算法第六章 大數據與推薦系統第七章 基於算法推薦的自媒體定位第八章 新媒體背景下的內容生產第九章 新媒體時代的標題第十章 新媒體內容的製作第十一章 新媒體

內容簡介

《算法新聞》由兩位不同專業背景的作者聯手完成——具備計算機專業背景的塔娜老師,從淺顯易懂的角度揭開算法的「黑匣子」,告訴廣大內容生產者,在每篇新聞的內容經由算法平台分發到用戶手中時,計算機都做了什麼,是怎麼做的。而具備多年媒體實務操作經驗的唐錚老師,則站在內容生產的角度,告訴內容生產者要如何更新操作理念和寫作方式,以便更加適應算法平台上的推送原則,更加符合新媒體背景下移動終端用戶的閱讀需求。

作者簡介

塔娜,2017年博士畢業於清華大學計算機系,同年進入中國人民大學新聞學院任教。研究方向為計算傳播學、新聞大數據、新媒體與數字傳播技術等。近年來以第一作者或通訊作者身份發表多篇CCF(中國計算機學會)A類及SCI(科學引文索引)論文,主持國家自然科學基金項目及北京市社會科學基金項目等科研課題。

唐錚,1998年就讀於中國人民大學新聞學院,2004年碩士畢業後從事媒體工作十餘年,多次獲得亞洲卓越新聞獎、中國新聞獎、北京新聞獎,獲評北京市優秀新聞工作者。2016年起回到人大新聞學院任教,講授「新聞采寫」「深度報導」「新媒體寫作」等課程,研究新聞實務及媒體融合,主持多項國家級及省部級相關課題。

目錄

第一章 個性化分發與內容生產變革

第二章 算法推薦原理

第三章 用戶畫像的標籤體系

第四章 文本型內容的建模與分析

第五章 智能推薦算法

第六章 大數據與推薦系統

第七章 基於算法推薦的自媒體定位

第八章 新媒體背景下的內容生產

第九章 新媒體時代的標題

第十章 新媒體內容的製作

第十一章 新媒體的內容生產運營

第十二章 人工智慧與推薦系統

書摘

時代發展和技術進步的速度之快,總是超乎人們的想像。至少對於自20世紀90年代起處在傳統媒體市場化黃金期的人來說,這些年來他們一直在追趕技術的腳步。

從單一媒體看,20世紀90年代初期後的十年里,報紙從徹頭徹尾的官辦媒體、郵局發行、每天一到兩個印張,變成全鏈條運營、全市場化運作,發行量超過百萬,版面數量最高曾達千版,單個城市最高容納報紙數量超過20家。

20世紀90年代中期後的十年里,電視從中央電視台3個頻道擴展到16個頻道,從每個省市自治區一兩個地方電視頻道、彼此不相通,變成數十家省級上星衛視、上百家地方單品類頻道和數百家收費電視頻道。

廣播從各地三四個調頻、一度經營窘困,到借著轎車私人化和城市道路擁堵的契機,一舉變成利潤率最高的傳統媒體,頻道也迅速增長到幾十個。

門戶網站從2000年時網際網路泡沫初次破裂、股票跌成幾分錢「仙股」的三大門戶,變成用戶總量超過五億的國民信息獲取第一平台,後起的百度更是因其搜尋引擎功能實現了人對信息的精準搜索,一躍成為網際網路巨頭。

然而,門戶網站的暴利時代僅僅維持了幾年,以微博、微信、今日頭條等為代表的信息客戶端就實現了人們獲取信息從台式機向移動終端的遷移。而今,新的變化又在醞釀。微信日活躍用戶量已經超過十億,今日頭條則有望在未來幾年內成為全國廣告收入最高的單體公司。

發展和變化是如此迅速,所有站立在這個時代的人必須去了解身處的這個時代,並且能夠大致預測和管窺未來的變化,這也是我們引入「算法新聞」這門課程的目的。如果借用媒介巨擘普利茲的一句名言,「倘若一個國家是一條航行在大海上的船,新聞記者就是船頭的瞭望者,他要在一望無際的海面上觀察一切,審視海上的不測風雲和淺灘暗礁,及時發出警告」,那麼,身處這個大時代的新聞人,不僅要出自公共利益而起到監督觀察的作用,更要對自身所處的媒介形態和環境進行不斷的觀察和預測。

算法新聞,其實並不是一個非常準確的概念。事實上,正在算法分發平台上像海水一樣奔涌著的新聞,和我們幾百年以來演變下來的新聞並沒有本質上的差異,仍然要遵循真實性、客觀性等基本新聞原則。內容生產者也同樣要遵循客觀、中立、公正等職業操守。

然而,算法的出現會改變很多現行的規則。此前,在傳統媒體時代,新聞從業者只需要完全自主性地生產內容,而現在,算法將成為主導用戶閱讀方向和感受的幕後力量。作為生產者的新聞記者第一次要聽從於計算機所規定的分發法則,算法或將決定他們精心生產的內容能否傳播及能走多遠。

這本《算法新聞》試圖帶領大家進入這樣一個全新的圖景中:技術體系成為信息傳播的社會性基礎,數字化平台上奔流的信息使傳統的內容生產者成為「媒體之媒體」——今天,我們閱讀的信息必須經過網際網路平台的傳遞,信息與人之間的對接從過去的「信息-媒體-人」變成了「信息-網際網路平台-人」

新聞業界所遇到的巨大挑戰正來源於此。計算機平台正在對整個社會的空間時間和權力關係進行重新建構。對新聞業而言,這是一個顛覆性的時代,也是一個充滿機會的時代。未來的新聞業,註定要以計算機和不斷疊代的程序作為自己生存的基礎。

基於這個邏輯,內容生產者需要更加清晰地了解算法的原則、原理、運行方式,以便對內容生產起到更直接有效的幫助。

本書共分為12章。

第1章結合國內外的實例,概述從傳統媒體到新媒體的變化下,新聞傳播從中心式分發向非中心式分發(算法分發+社交分發)的轉變,用更加貼近實際的案例化方式介紹雖然漸變但是顛覆性的傳播範式變化,進一步探討算法分發和社交分發的異同點,並對算法分發下的平台責任和倫理進行了簡要的分析。通過本章的學習,我們能夠了解算法分發的特徵,並理解在新媒體背景下掌握技術原理和內容生產原則的緊要性和迫切性。

第2章介紹算法分發系統的原理和概念。一個基本的算法推薦系統原型包括「用戶」「內容」「分發算法」以及用戶對推薦算法的反饋優化。通過標籤化的用戶畫像、文本型內容的建模與分析方法,以及協同過濾推薦算法,介紹算法分發系統的若干基本要素,並對這些要素的功能和相互作用進行梳理。通過本章的學習,我們能夠了解算法分發系統的基本原理,並初步形成對系統要素的認識。

第3章介紹如何認識和理解算法推薦系統服務的對象――「用戶」,以及在算法推薦系統中如何使用計算的手段為用戶建立模型。以標籤化的「用戶畫像」為主線,介紹「結構化」標籤用戶畫像以及「非結構化」標籤用戶畫像的特點和異同。通過本章的學習,我們能夠理解用戶畫像的概念及應用,並熟悉用以完成計算任務的批量化計算以及流式計算框架。

第4章介紹算法推薦系統對文本型內容進行個性化推薦時所需的建模與分析、計算手段。在經過數據預處理、內容安全審核等前置處理過程後,算法推薦系統可以通過語義特徵、隱式語義特徵、時空特徵、質量相關特徵等維度計算內容與用戶興趣的匹配程度,指導算法推薦。通過本章的學習,我們可以深入領會內容的管理、組織與面向算法推薦的建模。此外,本章也介紹了知識圖譜等相關概念。

第5章圍繞智能推薦算法的起源、發展、應用和評估展開介紹。通過本章的學習,掌握和理解經典的關聯規則推薦算法之原理與過程,對於學習新興的推薦算法具有知識儲備和借鑑的意義。此外,從系統的角度,本章介紹如何對推薦算法進行評估,給算法推薦系統提供算法選擇的依據。

第6章介紹大數據的基本原理和概念,大數據在算法推薦系統的應用,深度學習和神經網絡的原理及其在算法推薦系統的應用。通過本章的學習,理解大數據概念和原理、了解相關的軟硬體平台、掌握大數據在算法推薦系統的典型應用以及算法推薦系統在內容和用戶兩個維度上的數據依賴,了解深度學習和神經網絡算法的應用。

第7章從內容生產者的實務操作角度出發,介紹目前比較常用的幾類基於算法進行分發的內容平台,介紹它們的特點,再根據其特點介紹在不同平台上進行內容生產的要點和注意事項。通過本章的學習,達到初步了解內容平台,並能夠隨著它們的發展分析其內容生產要求的水平。

第8章從內容生產者的視角,結合實例和數據,對新媒體平台尤其是算法分發平台上的內容生產進行更加深入和系統的介紹。通過本章的學習,我們能夠從觀念和方法上,掌握在算法分發平台上進行的內容生產和傳統新聞生產的不同點及注意事項。

第9章從內容生產者的視角,深入介紹算法分發平台上與傳統環境下新聞標題的異同點,在認識到新聞標題在算法分發背景下的重要性後,進一步從結構、功能等不同分類來了解標題的特點,並結合大量的實例分析,掌握其製作方法和原則,最後對於在新媒體環境下出現的「標題黨」現象進行深入分析。通過本章的學習,我們能夠掌握新形勢下新聞標題的製作方法和理念,獲得獨立製作新聞標題的能力。

第10章從內容生產者的視角,將在算法平台上獨立推送的一則新聞按照摘要、正文、多媒體等不同組成部分,通過實例講解,介紹製作的要點、原則和注意事項。通過本章的學習,我們能夠掌握內容製作的基本方法和原則。

第11章從內容生產者的視角,系統介紹新媒體狀態下運營的概念和必要性,並介紹運營的基礎原理。通過本章的學習,我們能夠了解在新媒體平台上進行內容運營的必要性和迫切性,提升內容生產者在這一方面的認識,並初步掌握內容運營的理念和原則。

第12章介紹人工智慧與智能媒體,以及相關應用領域。人工智慧與媒體結合形成了智能媒體,本章介紹針對智能媒體的研究方向和相關實踐,如自動化新聞、自動事實核查等。通過本章的學習,我們能夠理解人工智慧技術的基本概念、起源、發展過程和發展層次,以及人工智慧的技術原理。

新媒體背景下的變化,其迅疾超乎人們想像。算法與人性的磨合日益增加,算法一方面展現出進一步智能化和人性化的進步,另一方面也帶來了諸如信息繭房、數據造假等令人擔憂的危害。

算法新聞的發展不過短短几年的時間,從理論到實踐都不夠完善、不夠成熟,但是,它是這一代新聞傳媒人繞不過去的一個實際存在。未來的傳媒業必然還會不停地大踏步向前發展,所有身在其中的人都在摸索、探究。生活在這個時代中的每一個人,都應該立足當下,開始學習和行動。只有不斷進行自我疊代、自我更新,才能在未來的全媒體生態系統中獲得一席之地。

這也是本書在算法新聞領域進行初步嘗試的初衷所在。

關鍵字: