重磅發布!百分點科技正式發布數據科學基礎平台DeepMatrix

數據猿 發佈 2024-02-26T15:07:26.827400+00:00

3月30日,由百分點科技主辦的「2023數據科學峰會」在北京金隅智造工場·科技秀場成功召開。

3月30日,由百分點科技主辦的「2023數據科學峰會」在北京金隅智造工場·科技秀場成功召開。此次大會以「數據·進階」為主題,邀請權威專家學者以科學視角和全球視野解讀數據科學、數字政府建設及數位化業務,在現場重磅推出一站式數據價值實現平台——數據科學基礎平台DeepMatrix,並聯合IDC發布了首份數據能力進階白皮書。

數位化業務發展「奇點時刻」已至

「奇點」(Singularity)是一個由科幻小說家弗諾·文奇提出的概念。在未來學和人工智慧領域中,「奇點」通常是指一個時刻,在這一時刻技術將迅速發展,以至於傳統的預測方法和規律將無法維持,這個時刻通常被稱為技術奇點或智能奇點。

縱觀人類社會核心技術發展史,從蒸汽動力技到信息技術,再到如今5G、雲計算、大數據、人工智慧等為代表的數位技術,技術進步在生產力發展和社會經濟演變的升級過程中,始終扮演著不可或缺的角色。

現階段,數位技術的發展速度越來越快,推動了各個領域的創新和變革,加速了數字經濟發展的步伐,帶動產業數智化轉型進入縱深階段。

峰會上,IDC中國副總裁兼首席分析師武連峰分享了IDC最新觀點:數位化業務時代已經來臨。在數位化轉型1.0階段,是利用技術,部分變革業務,試點創新;2.0階段,利用技術全面變革業務,進行規模化創新。可以看到,無論是1.0階段還是2.0階段,其核心都是業務的數位化。進入數位化業務時代,最核心的是做好「數據」的業務化,即提供可持續創新運營可行的數位化業務。

據IDC《中國數位化轉型市場預測,2021-2026》,中國2022-2026年數位化轉型支出合計將達到2.38萬億美元。

但現實可能比預想發展得更快!

根據我國《「十四五」數位化經濟發展規劃》,提及的五年發展目標中,「千兆寬帶用戶數」一項的原發展目標是到2025年增至6000萬戶,增長規模接近8.3倍。

而在近日工信部發布2023年1-2月份通信業經濟運行情況中,「千兆寬帶用戶數」已突破億級規模,三大運營商僅用兩年時間就超額完成了「千兆寬帶用戶數」原五年目標!

「千兆寬帶用戶數」只是我國數字經濟發展總體目標下的一個細分目標,從其過往兩年的表現可以明顯感知到,數字經濟整體發展呈指數級增長,早期規劃已跟不上現實的發展速度。

數位化業務發展的「奇點時刻」已經降臨。

數位化業務時代浪潮激盪,無論是為數位化業務賦能的科技廠商供給方,還是亟待業務數位化轉型的需求方,都需要加快思考、理解、踐行數位化優先策略。對此,北京大學數學科學學院、光華管理學院教授、中國科學院院士陳松蹊認為:數字中國建設,釋放數據生產力是關鍵。真正要把生產力釋放出來,不能只靠存儲和算力等基礎設施建設,更需要「數據文化」建設,尤其是場景驅動的數據分析等數據科學「軟」實力建設。

數據科學基礎平台(DeepMatrix)為數據價值實現賦能

基於市場需求的敏銳洞察和對行業發展趨勢的前瞻性預判,百分點科技在「數據·進階」峰會上推出一站式數據價值實現平台——百分點數據科學基礎平台(DeepMatrix),服務於數據工程師、數據分析師和數據科學家,助力便捷高效地將數據轉化為業務知識並輔助決策和行動,最終釋放數據價值。

傳統企業數位化轉型過程中,可能沒有相關的數位化經驗和能力,從而面臨「從零開始」、「沒有任何經驗和資源」的局面,即所謂的「冷啟動」問題,比如硬體基礎設施購置及升級、技術堆棧的更新和疊代、數位化響應的組織架構和人才支持、數據資產的整合和優化等,這些問題都需要投入時間、資源和人力去克服。

其中,數據資產整合和優化問題是企業數位化轉型的核心。對集團型企業、政府機構來說,越來越多的業務和複雜多樣的信息化系統,讓政企擁有了海量數據,但是分散的數據、隔離的系統,又形成了一個個數據孤島。於是,為了利用好數據,政企就需要建立數據倉庫。

但不同業務線、不同場景的數據要如何整合到同一個資料庫中呢?這就需要構建數據模型。通過高度抽象的數據模型,整合各個源系統的數據,最終形成統一、規範、易用的數據倉庫。

從市場需求上來看,當下市場已不滿足單點的技術和單點的工具,而是端到端的數據科學的解決方案。百分點數據科學基礎平台 (DeepMatrix) 作為一站式的數據價值實現平台,它涵蓋數據應用構建的全棧工具集,能夠高效支撐數據收集、數據治理、數據處理、數據分析、數據可視化和數據產品開發等工作;內置行業數據標準、算法模型、知識圖譜等領域知識,賦能數據價值實現的各個環節,幫助提高構建數據應用的效率及深度廣度。

據百分點科技CTO劉譯璟介紹,面對傳統企業的「冷啟動」問題,百分點數據科學基礎平台(DeepMatrix)能夠藉助行業內已有的專業知識為其破局。此外,數據科學基礎平台內置了智能輔助開發系統,可以自動化地輔助開發者選擇方案以及完成數據適配,並智能化地進行方案精調和改進。同時,能夠在數據治理的多個環節依託知識庫及語義理解等智能技術幫助開發者提高效率。

在產品優勢方面,DeepMatrix平台表現為:

第一,專業化。產品圍繞數據集成、治理、建模、分析和應用的價值鏈條,構建了一系列功能強大的專業化工具,滿足數據工程師、數據科學家和數據分析師在數據價值實現工作中的各類需求。

第二,一體化。產品功能覆蓋從數據到信息、從信息到知識、從知識到決策的全過程,且所有模塊都遵循一體化的技術架構和數據交換協議,支持決策端到端的數據科學解決方案構建。

第三,智能化。產品包含了很強的領域知識管理和應用能力,並結合語義分析實現智能化的數據科學解決方案構建和輔助開發。

第四,低代碼。通過可視化和低代碼的交互方式,降低數據管理的技術門檻,提高數據處理效率。

第五,廣泛的生態適配。適配主流存儲計算基礎設施,如MySQL、Oracle、華為Guass等資料庫,HDP、CDH、華為雲MRS等大數據平台,以及國產化作業系統和晶片。

相關統計數據顯示,政府及大中型國企占到數位化轉型支出的 70% 左右,是數位化轉型的主力軍。百分點科技此次發布數據科學基礎平台 (DeepMatrix)正是基於政府及大中型國企數位化轉型的應用場景,以解決其數據價值實現過程中的「核心痛點」。

關於數據科學的未來

AI時代的開啟,給數據科學帶來了新的挑戰與機遇。自2022年11月ChatGPT發布,2023年初又發布了新版本GPT4.0,其強大的信息整合和對話能力震驚世界。百分點科技董事長兼CEO蘇萌認為,AI能力驅動下,數據科學將加速數智化能力進階。

「以ChatGPT為代表的內容生成技術(簡稱AIGC)可能逐漸會成為新一代的基礎設施,同網際網路、雲計算一樣,很多的應用將會成長在GPT之上。新的技術和應用將會帶來更加豐富的數據、更加多模態的數據,而這些數據同樣需要可分析、可解釋、可應用,進而參與到真正的預測和決策的場景中。」

對於數據科學的未來挑戰和發展趨勢,蘇萌認為:

一是,AI生成數據會帶來很多困擾。隨著ChatGPT應用的不斷普及,產生了有別於人類真實活動的數據。比如,人們用ChatGPT生成的論文、文學作品等,這些生成式AI數據是否會再次進入到下一輪的訓練語料之中,如何評估這些數據的質量,如何實現它們的數據價值,這些都是需要重新考量的。

二是,領域知識的賦能。各個領域的科學和知識本身就是一個數據體,以數據的形式存在並且不斷更新。未來數據科學將與領域知識進行更加深度的合,領域知識的自動抽取、構建和服務將成為主流,GPT終將從無所不知的寫手走向知識淵博的領域高精尖專家。這也為數據科學的行業化細分帶來無限商機。

三是,數據科學平民化。數據科學的通用工具的一體化和平台化,領域知識的電腦程式化和服務化,以及交互方式的自然化,這三件事情會導致未來業務和決策人員可以跨過程式設計師直接與數據進行交互,提高分析和決策效率,這將是革命性的變化。許多重複性工作將被智能技術替代,人們將從數據密集型、計算密集型、事務密集型的工作中被釋放出來,專注於創造性高、藝術性高、價值密集型工作,追求自我實現。

四是,重塑生產關係和商業秩序。生產關係是由生產力決定的,數據科學技術在不斷的疊代升級,它也會作為重要的生產力來推動商業模式和企業組織的變革。未來,全球80億人和無數的物聯網設備連接到網絡並成為數據源,不斷產生關於他們的活動、認知和智慧的大量數據。數據將變成普惠的生產要素,每個人都能通過數據的生產和使用獲益,形成更加平等的生產關係,最終形成更加和諧的社會關係。

從蘇萌的描述中,AI 技術變革加快了數據科學的疊代步伐,同時也帶來了重新定義數據質量、數據價值的難題。但毋庸置疑的是,數據科學將持續與行業融合,更智能地為企業數位化轉型賦能,助力數字經濟宏偉藍圖徐徐展開。

在數字經濟建設過程中,以百分點科技為代表的數據科學基礎平台及數據智能應用提供商,將以「用數據科學構建更智能的世界」為使命,並為此不懈努力。

文:木陽 / 數據猿

關鍵字: