新資料庫時代,不要只學 Oracle、MySQL

csdn 發佈 2022-06-30T21:09:50.757545+00:00

6月29日,CSDN 創始人&董事長、極客幫創投創始合伙人蔣濤在騰訊雲資料庫&CSDN工程師能力輕量認證發布會上發表了《新資料庫時代》主題演講分享。

整理 | 彭慧中 責編 | 何苗

出品 | CSDN(ID:CSDNnews)

目前,中國已經進入「人人都是開發者,家家都是數據公司」的新資料庫時代。

6月29日,CSDN 創始人&董事長、極客幫創投創始合伙人蔣濤在騰訊雲資料庫&CSDN工程師能力輕量認證發布會上發表了《新資料庫時代》主題演講分享。他指出,在開源吞噬世界的背景下,資料庫也在大力擁抱開源。不同於傳統關係型資料庫,新型資料庫已成為行業風口,急需大量相關人才匯入,青年才俊應當抓住機遇,迎接挑戰。

CSDN 創始人&董事長、極客幫創投創始合伙人 蔣濤

以下是蔣濤演講實錄:

大家好,我是CSDN創始人蔣濤。我是程式設計師出身,30年前資料庫就是程式設計師的必備技能,而近幾年,資料庫又有了很大的發展。作為投資人,我也曾投資過巨杉資料庫。

CSDN目前是中國知名的技術社區,據最新數據顯示,CSDN的用戶量已經超過3,600萬,公司規模也在不斷發展壯大。如今,開發者變得越來越重要,我們圍繞著開發者建立了一系列業務支持體系,幫助開發者獲得能力與成長。其中,不僅有協助開發的工具開發雲(https://dev.csdn.net),還有幫助大家找到更好職業的人才雲等。目前,開發者市場越來越好,相信「人人都是開發者,家家都是技術公司」的時代不久後就要到來。

在此背景下,中國想要構建自己的核心技術生態,資料庫是其中關鍵。今天我將圍繞三個部分分享《新資料庫時代》:

  • 第一是揭示「我們正在進入的數據大時代」現狀;

  • 第二是了解「開源正在吞噬資料庫」的改變;

  • 第三是把握「新型的資料庫人才特別搶手」的趨勢。

數據大時代

我們正處於大數據時代,幾乎每家公司都在對自己的業務進行數位化變革。據統計,全球數據量每年持續增加,去年全球產生的數據總量是79ZB2025年預計將達到180ZB

由於雲技術的發展,越來越多的數據都存儲在雲端。數據顯示,在2016年只有10%的數據儲存在雲端的數據倉庫里,但到了2022年,這個數字已經快速增長到了75%,這說明隨著數字經濟的發展,每家公司都將成為數據公司,資料庫市場也迎來了爆炸性增長。

資料庫市場歷史其實非常悠久,從1964年,世界上第一個資料庫系統IDS(Integrated Data Storage,集成數據存儲)誕生開始,到今天資料庫發展已經快60年。1980年代,資料庫開始在中國生根發芽。直到現在,整個全球市場依然保持了20%以上的增長規模。儘管資料庫是個古老的技術,但其中又蘊含了很多新的機會。

從資料庫技術公司融資情況來看,數字非常驚人。過去10年,資料庫公司融資總額87億,其中一半是在過去兩年內完成的。2021年,超級獨角獸大數據公司Databricks兩輪融資總額為26億美元。如此看來,資料庫技術也進入到了一個新時代。

開源吞噬資料庫

那麼資料庫的技術進入到新時代的標誌是什麼?

即「開源吞噬資料庫」。

開源已經成為所有開發者的必選項,據GitHub統計數據:2016年僅有80萬人第一次做出開原始碼貢獻,而2021年,這個數字已經增長到300萬

在資料庫領域中,開源的「吞噬」情況也十分明顯。dbdb.io(卡內基梅隆大學維護的全球資料庫信息庫)分析了全球知名的841個資料庫系統,其中開源資料庫有608個,占比72%,只有200多家是商業資料庫。在全球頂尖資料庫排行榜中,開源資料庫也占到一半。

在CSDN製作的2021 資料庫全景圖(V1.0)中,我們將不同領域的資料庫按照開源和閉源兩類進行顏色區分,右側淺綠色的部分是開源資料庫,左側深綠色的部分是閉源資料庫。可以很明顯地看到開源在快速發展,且有吞噬閉源資料庫的趨勢。

來源:《新程式設計師 002》

中國資料庫在發展核心技術生態的大背景下,也發展得非常的迅猛。dbdb.io(卡內基梅隆大學維護的全球資料庫信息庫)統計的全球800多家資料庫企業中,中國有56家,但實際上中國資料庫廠商有200多家。尤其在新型資料庫上,中國企業「冒頭」較多,例如現在發展勢頭強勁的TiDB,在GitHub上非常活躍。

當然,開發者目前使用較多的還是相對傳統的基礎關係型資料庫MySQL,還有大數據領域Redis、Apache/Hive、MongoDB等相對比較傳統的技術,但絕大部分都是開源的。儘管最普遍被使用的依然是關係型資料庫,但新型資料庫則代表了未來趨勢。根據CSDN 2021-2022年資料庫開發者大調查顯示,在雲趨勢下,有52%的公司已經部署了雲資料庫,只有23%的公司尚未計劃部署雲資料庫。

新型資料庫人才搶手

對於目前的就業環境,我認為開發者應當好好學習資料庫技術,並且不要局限於僅學習關係型資料庫,更要學新型資料庫。為什麼呢?

新型資料庫的技術棧跟過去大有不同,關係型資料庫只是裡面最基礎的一環,而數據分析、數據倉庫、可視化等很多新型技術棧在湧現。開源中比較熱門的新資料庫類型包括分布式資料庫、時序資料庫、圖資料庫、流式資料庫等都在GitHub上排名非常靠前,Star數也非常高。

20年前,市面上只有關係型資料庫,主要面向事務性的交易。而如今得益於雲、微服務、分布式應用、全球規模、實時數據、深度學習等,新的資料庫架構應運而生,以解決新的性能需求:快速讀取和快速寫入的不同系統;專門用於支持實時分析的系統;用於非結構化、半結構化、事務性、關係、圖形或時間序列數據的系統;適用於緩存、搜索、基於索引、事件等的數據……據統計,一家企業平均在七個或更多不同的資料庫中存儲數據

這些新技術帶來了新機會,同時也加大了市場對人才的需求。我國數據工程師真正誕生是在十幾年前。而現在,隨著數據量的激增且更多地存儲在雲端,越來越多公司變成數據公司、市場對數據公司的需求也在持續增長。基於數據做分析的數據分析工程師也非常重要,他們既要了解資料庫的技術,又要懂業務,才能更好地進行數據分析,這樣的人才在未來會非常緊俏。

據Glassdoor(美國一家做企業點評與職位搜索的職場社區)統計,從2016年到2020年,「數據科學家」在美國最佳工作排行榜中一直位居榜首,被稱為21世紀最性感的工作。現在,數據科學家和數據工程師的需求還在持續上升,薪資也是。

目前,中國對資料庫人才的需求也具有相同趨勢,儘管過去在關係型資料庫領域處於引領地位的還是Oracle的MySQL資料庫。但我相信,中國未來會構建自己的資料庫新生態。中國也非常有機會在新技術上進行彎道超車,例如騰訊雲資料庫TDSQL,以及其他新型資料庫。同時,也希望更多CSDN平台上的開發者能夠加入新型資料庫賽道中來,並歡迎大家去參加能力認證活動。

END

《新程式設計師002:新資料庫時代&軟體定義汽車》,由60餘位專家傾力創作,包含世界級技術大師的深邃思考、前沿技術的發展,以及深入行業的應用實踐。隨書附贈《2021資料庫全景圖V1.0》和《2021汽車技術與產業生態全景圖V1.0》,同時內含《2021年度資料庫發展研究報告》和《2021年度軟體定義汽車研究報告》,圖文與視頻多媒體呈現。

成就一億技術人

關鍵字: