中國科大校友今發Science!蛋白質科學界版ChatGPT來了

科學網 發佈 2024-02-28T19:00:10.720962+00:00

讀博第三年,學校資格考試的巨大壓力如海嘯般傾瀉而來,這項奮戰了兩年但依然沒走通的課題,被他親手按下了停止鍵。事情雖然過去了30年,趙惠民現已是美國伊利諾伊大學香檳分校教授,但那時候的痛苦仍然記憶猶新。

文 | 《中國科學報》記者 張晴丹

凝視著手中的試管,又望向桌上那些依舊在各司其職的大大小小的實驗儀器,趙惠民的一顆心像是被人用力攥著。他明白,已經到了不得不放棄的時候。

讀博第三年,學校資格考試的巨大壓力如海嘯般傾瀉而來,這項奮戰了兩年但依然沒走通的課題,被他親手按下了停止鍵。

事情雖然過去了30年,趙惠民現已是美國伊利諾伊大學香檳分校教授,但那時候的痛苦仍然記憶猶新。他不吝與自己的學生分享科研路上曾有過的至暗經歷,因為科研本就是一條「光榮的荊棘路」,學會接受失敗,是必修課。

「科學探索是無止境的,而且有很多的不可預測性,這就是做科研的魅力所在。」趙惠民並未因一次磕絆而止步,23年間,他帶領的團隊累結碩果,在Nature、Science、Cell發表過7篇論文,在Nature子刊發表過30來篇論文。

北京時間3月31日,趙惠民團隊再次在Science發表研究論文。這回,他們發明了一種新的AI工具,可以根據酶的胺基酸序列預測酶的功能。就像ChatGPT使用文字數據來創建預測文本一樣,他們正在利用蛋白質的語言來預測它們的功能。

30多年後又回到原點

80年代流傳著一句順口溜「窮清華,富北大,不要命的上科大」。趙惠民就是「不要命」的那一個。

1987年,他以優異的成績從浙江嘉興一中考入中國科學技術大學(以下簡稱中國科大)生物系學習。他對科研的興趣從這裡萌發。

「那時候,中國科大的訓練非常嚴格,學風在高校中名列前茅,5年制教學課程任務重,科研氛圍很濃。」趙惠民告訴《中國科學報》記者。前三年他就掌握了數學、物理、化學、生物等學科知識。

後來,趙惠民成了施蘊渝(1997年當選中國科學院院士)的學生。彼時,施蘊渝剛從國外進修回來,率先在國內開展蛋白質結構與功能的計算生物學研究。受老師指引,趙惠民開啟了分子動力學方面的計算模擬研究。

為了開闊眼界、提升自己,本科畢業後,23歲的趙惠民在1992年到美國加州理工學院讀博,第一次接觸到了酶工程。從那以後,他便與酶結下了不解之緣。

酶有多重要呢?它是一種生物催化劑,在生命體系中扮演著關鍵的角色,控制和調節各種代謝途徑,保障它們高效工作。

研究酶的都希望把它的功能改造得更好,實現更高效、更穩定、更優質的催化劑。趙惠民獨闢蹊徑,想去預測酶的功能。如果這個想法能夠實現,將是一次偉大的革新。

8年前,他的實驗室自主建立了一套全集成自動化系統。6年前,他開始涉獵人工智慧領域,想把AI技術與合成生物學、自動化結合起來,以期能更快地改造酶工程或者代謝工程。在中國科大積累的計算模擬知識重新派上了用場。

「沒想到兜兜轉轉30多年,又回到了原點。」趙惠民感慨道,「可見,很多東西你學的時候沒多大用,但說不定將來哪個時候就能發揮價值。」

從搭建儀器到設計流程,為了保證機器能夠穩定可靠地運行,趙惠民煞費苦心,終於在2014年搭建了第一台原型機,在2020年完成了強化版。

一切正式起步。他帶領團隊用了3年時間,研發出被稱為CLEAN的人工智慧工具。論文在線後,通過網絡界面,研究人員只需在搜索框中輸入序列,就像搜尋引擎一樣,可以看到結果。

「我們並非第一個使用人工智慧工具預測酶功能的人,但我們是第一個使用這種稱為對比學習的新深度學習算法來預測酶功能的人。我們發現這種算法比其他研發出的人工智慧工具更準確、更可靠、更靈敏。」趙惠民表示。

無論是生物學、醫學還是工業界,這種工具都將幫助研究人員快速識別合成化學物質和材料所需的最合適的酶。

「投頂刊比較順的一次」

2022年10月8日,一切準備就緒,趙惠民將這項研究成果投給了Science

手握多篇Nature、Science,有著豐富投稿經歷的他,預感這次不會遭遇審稿人「刁難」,他對這項成果有信心。

果不其然,文章很快通過編輯這一關,送入外審。不到兩個月,趙惠民就拿到了審稿人的意見。

審稿人都給出了積極正面的評價,認為這項研究成果里用的人工智慧的算法非常新穎。最關鍵的是,很多做人工智慧的,投出的文章中幾乎都是用數據組去測試這個工具有多好,而趙惠民團隊不僅有計算機的確認論證,還提供了強有力的實驗數據支持。

通過計算和體外實驗驗證發現,該工具不僅可以預測以前未表徵的酶的功能,還可以糾正被領先軟體錯誤標記的酶,並正確識別具有兩種或多種功能的酶。

當然,研究並非盡善盡美,審稿人還是提出了一些小意見。因為預測並非百分百準確,審稿人希望作者做更仔細的研究,回答預測的準確率到底是多少。

趙惠民帶領團隊緊鑼密鼓地進行了2個月補充實驗,重新加入了很多新數據。改進後的文章在2023年1月底再次送審,不到一個月文章就被接收,文章從投稿到發表僅5個月。

「這是我投頂刊比較順的一次。」趙惠民說。

在趙惠民看來,論文在Science上發表只是邁出第一步。他們計劃擴大CLEAN背後的人工智慧,進一步開發機器學習算法,以表徵其他蛋白質,如結合蛋白。

「有很多未被表徵的結合蛋白,如受體和轉錄因子,我們也想預測它們的功能。」趙惠民有一個宏大的願望,他想預測所有蛋白質的功能,這樣就可以對細胞中的所有蛋白質了如指掌,以便更好地研究或設計整個細胞用於生物技術或生物醫學應用。

為了讓這款工具愈發強大,該團隊還在訪問頁面專門設置了一個鍵,用戶可以點進去輸入反饋意見。「希望大家多提意見,我們會根據反饋再增加一些新的功能。」

在美國做科研一點也不容易

閒暇時,趙惠民常跟自己的學生很走心地分享過往經歷,想讓他們明白做科研本就不是那麼一帆風順。

「一個6年時間做出的成果,別人重複一遍可能只需幾個月就能實現。為什麼你花了6年?因為這個階段你一直在試錯,科研就是在不斷試錯中尋找正確的方向。當走不通的時候要學會放手,雖然這的確非常痛苦。」趙惠民說。

30年前,他就曾因為考核壓力,不得不放棄一個兩年都未走通的研究。科研為什麼讓很多人望而卻步,就是因為誰也不知道哪條路能走通,外在的壓力瘋狂地推搡你,每位科研工作者都是在荊棘叢里艱難摸索前進的方向。

「常聽朋友說在國內做科研很『卷』,有些人會以為在美國做科研很輕鬆,從我的親身經歷來說一點也不容易。」趙惠民表示。

他讀博的時候,就有好幾個同年進實驗室的同學,因為頂不住壓力,沒拿到學位就心灰意冷地離開了。好在他跨過黑暗,選擇再度出發,成為了美國加州理工學院教授Frances H. Arnold最有成就的弟子之一。

後來在2018年,Arnold因為「酶定向進化」上的突出成就,獲得了諾貝爾化學獎。在Arnold所獲得的諾貝爾化學獎的科學背景材料中,趙惠民在5篇關鍵論文裡都有署名,其中有4篇還是第一作者。

導師帶給趙惠民的影響除了科研上的飛躍,還有做人做事的改變。Arnold對學生總是直來直往,毫不留情地當面指出缺點。「我們中國人說話都比較委婉,當面批評多少有點讓人下不了台。所以剛去的時候,不太適應,她的嚴厲,有時候連美國學生也吃不消。」

但相處久了,他發現,導師的很多反饋就像酶一樣,催動著他極快成長和進步。後來他帶學生時,也習慣就事論事,不繞彎子,並且鼓勵學生勇於表達自己的意見和idea,最好跟他爭論個面紅耳赤。

時光荏苒,一晃已年過半百,他帶的很多學生逐漸從科研小白成長為一些高校、科研院所的中堅力量。其中,33人在做教授,回國內做教授的就有15人。現在,他的團隊有近50個成員,來自世界多個國家,中國人占了大多數。

他不是那種只會吩咐任務的「一言堂」導師,他喜歡適當「放手」培養學生的獨立性和創造性,同時又會保持與學生的溝通交流。在他的實驗室,一周舉行一次大組會,兩周一次小組會,組會上每個人都可以頭腦風暴、任意發言。即使出差,他也會跟學生開視頻聯繫。

這些年來,趙惠民對國內科研飛速的發展很是感慨,「國內現在的科研環境與我讀本科那時候比不可同日而語,簡直一個天上一個地下。現在各種各樣的基礎設施都齊備,哪像我在國內做科研的時候,買一個酶試劑,都要至少等半年才能拿到,一些實驗用的管子都是反覆用了洗、洗了用。」

一方面,他認為國內青年學者應當珍惜當下科研環境;另一方面,他也指出硬體方面雖好,還更應該在科研評價體系上改進,讓青年科研人員能更好地激發積極性和創造性。

論文連結:https://www.science.org/doi/10.1126/science.adf2465

關鍵字: