清華大學計算機系教授鄭緯民:中國存儲系統的先行者

名校風華 發佈 2020-01-07T12:27:15+00:00

鄭緯民走起路來健步如飛,上起課來激情澎湃,談起研究來妙語連珠……你或許不太相信,年過七旬、白髮蒼蒼的鄭緯民現在仍是課題組裡每天最早到達實驗室的那個人。

鄭緯民

走起路來健步如飛,上起課來激情澎湃,談起研究來妙語連珠……你或許不太相信,年過七旬、白髮蒼蒼的鄭緯民現在仍是課題組裡每天最早到達實驗室的那個人。組裡的師生笑稱鄭老師是位「模範生」,每次見他不是在實驗室就是在會議現場,研討、講課、debug、攻克技術難關……在過去的幾十年里,鄭緯民唯一的愛好就是搞研發、帶學生。

1965年,鄭緯民考入清華大學自動控制系時,計算機還只是自動控制系的一個專業,算法、存儲、系統等基礎理論的研究,國內還比較落後,沒有人能準確判斷中國的計算機事業將有怎樣的未來。

改革開放後,鄭緯民先後前往美國、英國從事分布作業系統與函數語言編譯研究。回國後聚焦計算機並行/分布處理研究,並率先在高性能存儲領域深耕發力。

2016年,鄭緯民及其團隊參與的項目斬獲有著世界超級計算應用領域「諾貝爾獎」之稱的「戈登·貝爾獎」,實現了我國高性能計算應用成果在該獎項上零的突破。

2019年,鄭緯民當選中國工程院院士

在存儲系統領域,從一張白紙到世界領先,中國花了不到半個世紀,這一近乎奇蹟的「逆襲」,鄭緯民功不可沒。

存儲系統背後的團隊

在足球場大小的機房裡,密密麻麻存放著高速運轉的設備,一台台超級計算機正在執行快速計算任務。「超級計算機」,顧名思義,擁有超大的數據存儲容量和超快速的數據處理速度,其中所涉及的技術遠比目之所及的龐大機器更為複雜。繞不過去的核心技術就有集群計算機設計、CPU設計、網格計算、高性能存儲等等,層出不窮的難題擺在計算機系高性能計算研究所時任所長鄭緯民面前,作為計算機系統結構學科帶頭人的他,毫不猶豫地將這些技術難題作為研究所的主攻方向,帶領團隊「啃最難啃的骨頭」。

當整個行業醉心於研究各類複雜精巧的算法時,鄭緯民敏銳地意識到數據存儲技術將面臨巨大挑戰。上個世紀90年代起,他在國內率先開展網格存儲系統關鍵技術研究,並一再打破國際存儲公司的技術壟斷。「計算、互聯、存儲三大部件組成一個大信息系統,存儲越來越成為其中的核心問題。當下,存儲已成為關係到國計民生和國家戰略安全的關鍵信息基礎設施之一。」鄭緯民說。怎樣才能迅速、完整且長久地保留數據?怎樣才能在即使部分硬碟被損壞的情況下確保數據安全完整?鄭緯民帶領整個團隊,逐一攻破存儲系統的可擴展性、可靠性等一道道難關。

但他們並沒有止步於此。在此基礎上,能否用更少的空間儲存更多的數據?有別於通過降低解析度等直接「打包」壓縮的方法,鄭緯民及其團隊提出了新的思路。「通常而言,備份越多,數據越不容易滅失,但需占用大量存儲空間。比如一部電影,拷貝三份分別存儲,那就多花費了200%的空間。但如果把電影切割成若干段進行存儲,例如存儲32段電影內容,並同時生成16段校驗碼,當任何一個部分出錯時,可以根據校驗碼進行糾正,則只需要多花費存儲校驗碼的空間,也就是多增加33%左右的空間。」鄭緯民說。

這一思路為節約硬碟存儲空間打開了新的大門,然而最困難的是要實現數據存儲和校驗的實時同步。數據受網絡環境的影響很可能產生錯誤,對原數據進行校驗非常重要,使得再次使用這部分數據時,可以重新計算校驗碼並與之前的進行對比驗證。鄭緯民說:「在將數據寫入硬碟時,要對原數據計算校驗碼並一同傳輸,在很長一段時間內,國際上認為這兩者是不可能實時完成的。」而鄭緯民完成了這一創舉。他研製的自維護存儲系統,實現了數據存儲和校驗的實時同步,整體技術達到國際領先水平,目前已被成功應用到審計、公安、油田、電信、教育等行業及部門。

鄭緯民還創造性地提出了另一思路——社區共享。如果能夠實現社區共享,則不需要重複存儲,這就是現在流行的雲盤技術的基本原理。這一技術的多種應用現在已「飛入尋常百姓家」,而在21世紀初,仍處於「摸著石頭過河」的探索狀態。鄭緯民承擔的項目通過網格技術將各高校的資源串聯,存儲一份,即可全網下載。依託基於社區概念的網絡數據共享和存儲技術,鄭緯民主持研製了國內首個雲計算平台「Tsinghua Cloud」,並對外提供服務。

2016年,鄭緯民獲何梁何利基金科學與技術進步獎

憑藉這些積累和突破,鄭緯民拿下了國家科技進步一等獎1次、二等獎2次,國家發明二等獎1次,2016年獲何梁何利基金科學與技術進步獎,2016年、2017年他的團隊連續兩次獲得「戈登·貝爾獎」。2018年,鄭緯民成為首位中國存儲終身成就獎獲得者。

鋪就邁向世界一流之路

當地時間2016年11月17日,在美國鹽湖城召開的全球超級計算大會(SC2016)上,「千萬核可擴展大氣動力學全隱式模擬」聯合成果獲得「戈登·貝爾」獎,實現了該獎創辦30年來我國在此大獎上零的突破。2017年清華團隊再次藉助「神威·太湖之光」超級計算機,成功設計實現了高可擴展性的非線性地震模擬工具,實現了對唐山大地震發生過程的高解析度精確模擬,再次斬獲「戈登·貝爾」獎。兩次「捧杯」,鄭緯民及其團隊作出了突出貢獻。

邁向世界一流並非一日之功。時間回到改革開放之初,一切從零起步。那時的鄭緯民如饑似渴地閱讀國外前沿論文,參加各類同行會議,到美國、英國訪學,在各地合作開展科研項目,滿腦子想著怎樣才能跟上世界的步伐。開始培養學生後,他經常創造各種機會讓學生外出交流、參會,想方設法讓學生能接觸到最前沿的技術、與一線「大咖」交流切磋。

鄭緯民在交流中

鄭緯民鼓勵學生「走出去」,也不斷邀請頂尖學者「走進來」。現任清華大學計算機系副系主任武永衛教授初到鄭緯民的項目組時,便參與到「中國教育科研網格」的項目研發中。他清楚記得,項目完成後,鄭緯民特地邀請當時這一領域富有聲譽的美國團隊來校交流,逐一將成果演示給對方看。「鄭老師不僅把項目做出來,還要演示、證明給別人看,這種開放的心態實屬難得。」武永衛說。

漸漸地,清華計算機系憑藉不斷提升的綜合實力和積極開放的交流合作在國際上嶄露頭角,開始真正進入到世界網格存儲和高性能計算的核心圈子。

2007年,鄭緯民第一次在國際高性能計算領域頂級會議FAST(USENIX Conference on File and Storage Technologies)上發表文章,這是中國大陸學者獨立完成的首篇FAST論文。而今,FAST會議每年甄選的二十篇文章中幾乎都有中國學者的身影,鄭緯民團隊也已在FAST會議上發表多篇論文。

清華學生超算團隊獲國際大學生超級計算機競賽(SC19)總冠軍

而在不久前落幕的2019國際大學生超級計算機競賽(SC19)上,由清華大學計算機系組建的清華大學學生超算團隊再次奪得總決賽總冠軍,這是清華大學在三大國際大學生超算競賽中獲得的第12個冠軍。

在高性能計算和網格存儲領域,從「開眼看世界」到國際領先,一條邁向世界一流的道路在鄭緯民的努力下已漸次鋪成。

「做事,就要做有用的事」

「鄭老師常對我們說,在論文摘要里就得把你要研究的問題寫清楚,要點出這個問題的研究意義在哪裡。」清華大學計算機系副教授翟季冬曾是鄭緯民的博士生,翟季冬至今記得,鄭老師在指導他做本科畢業設計時,就一直強調「問題意識」。

武永衛回憶起博士後階段跟著鄭老師做項目的日子時說,他聽的最多的就是「要做有用的事,要想明白對誰有用,能解決什麼問題」。

「做事,就要做有用的事」,鄭緯民團隊的每位成員始終遵循這一要求,寫論文、做項目都以問題為導向,做出來的產品也要切實服務於現實需求。近期,鄭緯民帶領團隊多次赴內蒙古調研,發掘網格存儲和高性能計算在各類現實場景中的應用。

「做對國民經濟有用的事」,鄭緯民用實實在在的技術突破踐行著他的承諾。「現在很多人覺得多發論文最重要,不是說這些沒有價值,而是真正做研究,要能讓理論落地,不能在紙上空比劃。做事,還是得務實一些。」鄭緯民說。

「我最自豪的,是培養出了優秀的年輕人」

每年的院士資格評定都設有材料展示環節,每位候選人要在有限的時間裡闡述自己在該領域的成就。「鄭老師在展示的幻燈片里列出了七八項成就,他專門把講授的國家精品課程《計算機系統結構》列了上去,他一直覺得把課講好是非常重要的事。」武永衛說。

《計算機系統結構》這門課貫穿了鄭緯民的整個教學生涯,直到退休前,鄭緯民都在給學生上這門必修課。課程的課件和教案每年都在更新,講授的內容始終走在領域前沿。截至目前,鄭緯民已編寫和出版計算機系統結構領域的教材近10本。

「鄭老師上課非常有激情,也很幽默,他總能把複雜的知識點講得清楚明白,讓學生都聽得懂、感興趣。」從本科起就跟著鄭緯民做科研的計算機系教授陳文光,至今還記得近二十年前上課時老師打過的比方:「鄭老師將初期的大型向量計算機比作『象群』,將集群計算機中的小晶片群比作『蟻群』,非常形象。」當時慕名來上課的還有許多外系的學生,因為鄭緯民深入淺出的講述,他們對計算機系統產生了強烈的探索興趣。

如今,鄭緯民培養的很多學生也站在了大學的講台上,或幽默或通俗地為同學們講授計算機的基礎理論和前沿知識。「不自覺中,我平時上課也會跟鄭老師一樣,多舉一些通俗易懂的例子,課堂氛圍也相對輕鬆活躍。」陳文光說。

鄭緯民在講解區塊鏈技術原理

「我們給學生講課,至少在課堂上要讓他明白70%,剩下30%有興趣的可以再去學習研究。學生連課都聽不懂,怎麼可能對科研感興趣?」鄭緯民說。鄭緯民至今還在全國各地講課,從計算機系統結構講到並行計算,再到區塊鏈技術,一如既往地深入淺出。但凡開課,一座難求。

鄭緯民向來鼓勵學生做交叉研究。搜狗公司CEO王小川曾是鄭緯民的碩士生,在讀期間他突發奇想,提出想藉助計算機做基因拼接計算。當時整個團隊仍以並行處理的研究為主,這一想法看起來有些格格不入,但鄭緯民卻非常鼓勵,他說:「基因很複雜,如果你要做這個題,你得先去把生物專業的基礎書讀透。」在鄭緯民的鼓勵和指導下,王小川立即做起了自己當時最感興趣的研究。

鄭緯民看人很準,且極為信任學生。高性能計算研究所現任所長薛巍副教授本是清華電機系的學生,常來計算機系實驗室做運算處理。「我看這個小伙子很勤奮,周末都沒日沒夜在做研究,就跟他說可以來我們組做科研,於是他就來了。」鄭緯民說。恰逢計算機系與地學系合作天氣預報研究項目,鄭緯民便督促他「把氣象學本科生教材全部學一遍」。一邊做一邊學,而今的薛巍已然是天氣預報領域的專家了。

當記者問起迄今為止最自豪的成就時,鄭緯民沒有絲毫猶豫,他的答案既不是評上院士,也不是拿下什麼獎項,而是,「我培養的學生們都很優秀。」

為祖國健康工作五十年

鄭緯民在清華讀書時,時任校長蔣南翔先生提出的口號「為祖國健康工作五十年」響徹校園的各個角落,至今仍是清華人對國家的承諾。

鄭緯民始終記得這個承諾。退休後的他仍然卯足幹勁,為祖國的計算機事業奮力工作。在團隊師生的印象里,鄭緯民永遠精力充沛,早上八點就來到實驗室,中午吃完飯接著工作,項目組的進展他了如指掌,時不時還要各地出差、參加會議、主持講座。翟季冬看著鄭老師退休後工作還這麼拼,直言道:「老師比我們還拼,做學生的哪敢不努力!」

鄭緯民總跟學生說:「做計算機系統結構方面的研究,要做好吃苦的準備。」每天工作十幾小時是組裡師生的常態,短期內論文產出也不高,急功近利者幾乎不敢踏入這個領域。鄭緯民一直鼓勵學生沉下心去做研究。「我們要做實事,才能成事業。」鄭緯民說。

鄭緯民還是個熱心腸,計算機系大大小小的事都放在心上。無論是給學生指點科研方向,還是幫年輕教師一起打磨論文,甚至是幫助系裡師生處理家庭瑣事,但凡找他幫忙,他都竭盡所能。可以說,鄭緯民的大半生都與清華計算機繫緊緊相連。中國網格存儲「從零到一,再到無窮大」,鄭緯民是見證者,更是領航者。正如武永衛所言:「計算機系像是他的孩子。」他給予了這個「孩子」充足的養分,又慈愛地陪伴她每一步的成長。

2020年是鄭緯民為祖國健康工作的第五十個年頭,但他還有忙不完的工作。隨著人工智慧、區塊鏈等新技術的興起,作為基礎支撐的高性能計算、並行處理、存儲系統等核心技術愈發重要,以計算機為運算工具的跨學科研究不斷湧現。與此同時,國際競爭進一步加劇,破除技術壁壘任重道遠。「我們要做的還有很多。」鄭緯民說。

每次學生提出新設想、開發新項目的時候,鄭緯民總說的一句話是「我看行」。關於中國高性能計算的未來,他也不假思索地說了句:「我看行!」

關鍵字: