探索大數據相關關係的因果模型 | 社會科學報

社會科學報 發佈 2022-12-20T06:02:44.033733+00:00

國家社科基金優秀項目大數據浪潮的沖刷將相關關係和因果關係問題全面展開,對傳統因果觀構成了巨大衝擊,為因果模型的升級提供了歷史性條件。

國家社科基金優秀項目


大數據浪潮的沖刷將相關關係和因果關係問題全面展開,對傳統因果觀構成了巨大衝擊,為因果模型的升級提供了歷史性條件。國家社科基金優秀項目「大數據相關關係與因果關係研究」(17AZX003)從大數據作為信息數字編碼發展的產物出發,展開大數據及其基本特徵的哲學刻畫和大數據相關關係的因果模型研究。


原文 :《探索大數據相關關係的因果模型》

作者 | 上海大學教授 王天恩

圖片 | 網絡


大數據相關關係和

因果關係的信息基礎


從傳統因果觀到基於當代複雜因果模型的探索,因果關係研究經歷了一個曲折的發展過程。量子物理學的發展對傳統因果觀構成了嚴峻挑戰。這一挑戰推進了因果概念的重新刻畫:原因是因素的相互作用過程,結果是因素相互作用的效應及其痕跡。因素未進入相互作用,不構成作為相互作用過程的原因;原因的作用和結果的形成實際上是同一過程的兩個方面。原因和結果間的聯繫是必然的,這是事物過程的決定論方面;而因素和結果間的聯繫是或然的,這是事物過程的非決定論方面。二者構成事物過程的決定性與非決定性的具體統一。而大數據的發展則為在信息層次深化因果關係的認識,進一步展開重新刻畫的因果概念,提供了全新的時代條件。


大數據相關關係和因果關係的最深層次問題是大數據的信息基礎。實際上,正是大數據等信息科技的發展,使信息的感受性關係性質日益凸顯:信息既不是物質,又不是能量,而是基於物能的感受性關係。信息的基本特性主要包括信息的創生性、湧現性、相互性和共享性。信息的感受性關係理解,意味著大數據是信息數字編碼發展的產物。作為信息的數字編碼,大數據意味著在相關關係和因果關係的關聯中,信息具有基礎性地位。


大數據基本特徵的哲學理解和刻畫


大數據相關關係和因果關係的關鍵問題是大數據及其基本特徵的哲學層次把握。在哲學層次深化大數據特徵的理解,對於大數據概念的哲學把握具有基礎意義。從哲學層次看,大數據的「4V」特徵排序有更強的邏輯關聯。而其含義則更加遠不只是技術意義上的大規模(volume)、多樣性(variety)、高速率(velocity)和價值低密度(value),而是意味著大數據的規模整全性、實時流動性、結構開放性和價值創生性。


數據採集方式從抽樣到自然生成,使從小數據到大數據的發展意味著數據的「自然化」。數據的自然化具有重要的存在論意蘊,大數據的「大」根本上不在於數據量大,而在於數據的完備性。正是數據的完備性,使大數據具有規模整全性。大數據的規模整全性,在直覺的整體性和概念的整體性之外,為人類認識提供了新的量化的整體性。直覺的整體性基於經驗,概念的整體性基於邏輯,而大數據量化的整體性則基於數據,三種整體性意味著三種整體觀照。作為整體觀照的第三種形式,大數據的規模整全性為因果關係的大數據相關關係整體觀照提供了新的時代條件。


大數據只具有相互關聯意義上的結構,作為數據之間的關係,大數據的數據結構具有相對於人的需要及其發展的開放性。由於數據之間不可能直接相互作用,因此,其所構成的只能是相關關係。大數據相關關係的豐度與大數據的結構開放性密切相關。



大數據與樣本數據的根本不同在於,取樣構成的樣本數據是乾枯的標本,而自然生成的大數據是沒有失活的具體數據存在,具有與對象世界過程同步的實時流動性。具有實時流動性的大數據意味著維度的充分展開,不僅從單個數據到樣本數據,而且從低維大數據到高維大數據,發展出越來越深遠的未來向度。


信息是創生的,這使作為信息數字編碼產物的大數據具有價值創生性。大數據的價值創生性意味著存在論意義上的無中生有,這為人類創構——創生意義上的創造——提供了一個發展的無限空間。可見,大數據價值創生性不僅具有重要價值論乃至存在論意蘊,而且將展開因果關係的價值維度。


大數據基本特徵的信息層次哲學理解,不僅展現了因果關係的信息基礎,而且凸顯了大數據為大自然所沒有的前提性預設,從而深入涉及人類認識從描述到創構的發展。創構認識論的發展,曉示著人類活動從認識世界和改變世界發展到創構世界。


大數據相關關係的因果派生


大數據相關關係和因果關係的核心問題是相關性和因果性之間的關係。大數據的信息性質及其空前凸顯的相關關係,促使人們對傳統因果概念進行深入的反思。數據化使因果關係量化為變量之間的關係,獲得了關係強度和正負性質,由此構成質性描述向量化描述的發展,為相關性和因果性之間關係的理解創造了條件。正是基於大數據相關關係,可以進一步展開和深化因果概念的重新刻畫:因果關係是對因素相互作用過程與其效應之間內在關聯的描述;而相關關係則是對因果派生關係的描述,這是相關關係的因果性根基。相關關係及其與因果關係的關聯,正是大數據時代人們關注越來越多的難題。


作為因果派生關係,相關關係包括三種基本類型:一是因素和結果間相關關係,包括直接因素和直接結果、直接因素和間接結果、間接因素與直接結果、間接因素與間接結果間相關關係;二是結果間相關關係,包括直接結果內部要素、間接結果間相關關係;三是因素間相關關係,包括現實因素間和潛在因素間相關關係。正是潛在因素之間的相關關係,為人類創構活動提供了前所未有的新空間。


相關關係提供了由因素創構結果的無限空間,呈現出建立在「為什麼」基礎上的新的「是什麼」,這正是數據物化的因果性根據;數據分析的性質是因素分析,定量分析的根基是因果關係,相關分析的依據是因果派生,這則是大數據分析的因果基礎。大數據因果關係基礎的廓清曉示了其深層哲學內涵。因素關係的未來空間凸顯了創構認識論,因果派生關係的全數據定量分析凸顯了量的整體把握,而因果關係從描述到創構的發展凸顯了哲學是以滿足人的需要為最終目的。



由大數據相關關係的因果派生機制,可以推導出人類認識中的所有複雜相關關係,甚至包括一些尚未出現的相關關係,從而為因果模型研究奠定了新的發展基礎:在描述的因果模型基礎上展開創構的因果模型研究。


從描述的因果模型

到創構的因果模型


大數據相關關係和因果關係的根本問題是如何理解和建立包含大數據相關關係的因果模型。人類因果觀念經歷了兩次重要轉換,形成了三種基本的因果觀:實在論因果觀、描述論因果觀和模型論因果觀。從實在論因果觀到描述論因果觀,肇因於從經典物理學到量子力學的發展;從描述論因果觀到模型論因果觀,則源自信息科技,特別是大數據的發展。實在論因果觀是關於對象確定性聯繫的把握;描述論的因果觀是將實在論因果觀抽象為描述的產物;而模型論因果觀則是描述論因果觀發展到完全抽離具體經驗條件而量化的結果,由此可以在信息層次大大拓展對因果關係的理解。


隨著大數據發展對信息的開顯,從物能性因果關係到信息性因果關係的深入,在更深層次展開了因果關係研究的巨大空間,為將物能性因果關係推升到信息性因果關係,從而建立起物能性因果關係和信息性因果關係一體化的更高層次因果觀念,奠定了數字數據基礎。


大數據相關關係具有深層因果模型意蘊,蘊含著因果時態的維度。大數據維度提升了未來向度,展開了因果時態研究的空間。從過去時推展到將來時,意味著追溯既往的因果關係量化把握和探向未來的新因果關係創構。在此基礎上,不僅因果關係和相關關係及二者間相互關係可以達到更高層次的把握,而且對物理因果性和心理因果性的關係可以有更深層次的理解,對上向因果性和下向因果性及其關聯機制也可以有整體的透視。心靈哲學中關於下向因果性的排除處理,肇因於在人類心靈,而不是更基本的信息層次研究下向因果性。所謂上向因果性,是從物能因素相互作用過程到信息因素相互作用過程的因果性;下向因果性則是從信息因素相互作用過程到物能因素相互作用過程的因果性。心靈哲學中的上向因果性和下向因果性研究,正是物能性因果關係和信息性因果關係的心靈層次探索。



深入到更基本的信息層次,我們可以看到信息更到位的理解所帶來的基本範式轉換。正是從物能範式到信息範式的更深層次理解,涉及複雜因果模型的信息層面,特別是創構的因果模型及其雙向循環機制。與描述的因果模型不同,創構的因果模型根植於人的需要深處的主觀能動性。在描述的因果模型基礎上,系統探索創構的因果模型自然而然導向雙向循環因果機制的進一步研究。這是大數據相關關係基礎上因果模型研究進一步的課題,可望就此在人工智慧研究領域走向通用智能核心機制。


文章為社會科學報「思想工坊」融媒體原創出品,原載於《社會科學報》第1833期第5版,未經允許禁止轉載,文中內容僅代表作者觀點,不代表本報立場。



拓展閱讀

中國大數據發展:包容性生態塑造競爭優勢 | 社會科學報

視域 | 大數據之「大」,從規模整全到維度展開


關鍵字: