大數據的北極「冰雪奇緣」:人工智慧如何應用於油氣勘探?

親愛的數據 發佈 2020-01-07T10:51:30+00:00

人工智慧技術如何應用於油氣勘探?原創:譚婧坐標,美國阿拉斯加,北極圈。一架白色小型飛機穿過湍急的強風,在白皚皚的積雪中穩穩著陸。李成博博士欣賞著窗外熟悉的景色,冰封的世界,像極了他的老家中國東北。雪景怡人,但旅程卻頗為周折,為了到達目的地,他需要頂風冒雪轉飛機四次。

原創:譚婧

坐標,美國阿拉斯加,北極圈。

一架白色小型飛機穿過湍急的強風,在白皚皚的積雪中穩穩著陸。李成博博士欣賞著窗外熟悉的景色,冰封的世界,像極了他的老家中國東北。雪景怡人,但旅程卻頗為周折,為了到達目的地,他需要頂風冒雪轉飛機四次。最後一程還是小型螺旋槳飛機,因為它能在冰上直接降落。安全降落後,他才發現,著陸地點是在一個冰湖上。

這樣的到訪已經三次,每次的任務都和收集數據有關,而又不僅僅是收集數據。一位數據科學家為什麼要到這極寒之地?這和「壓縮感知地震採集技術(CSI)」有著莫大的關係。


CSI技術是地震數據獲取技術上的一個突破,它使人類可以在短時間內收集海量地震數據,並數據質量較高,為下一步機器學習提供基礎。更進一步地說,這一技術的出現,很好地解決了油氣行業三維地震數據採集成本高、耗時長的難題。CSI能夠在同等成本的條件下,成倍提高數據採集的效率和質量,為下一步大數據與人工智慧提供基礎,目前是美國康菲石油公司(ConocoPhillips)所有的專利技術。最終目的是提取地下有效信息。有了有效信息,就好比有了地下情況說明書。而需要強調的是,這裡的地震是人為的,人為產生震動,再用「聽診器」獲得地下的健康狀況。


作為CSI技術的核心研發人員,李成博博士向《親愛的數據》主編譚婧介紹了自己的求學與研究經歷。2011年他從美國萊斯大學畢業,獲得了計算和應用數學博士。畢業當年,他加入美國康菲石油公司,擔任總部高級地球物理學家。他說,選擇加入美國康菲石油,也是和開發壓縮感知地震採集技術技術有關。


近幾年,他的工作聚焦在地球物理應用的壓縮感知技術,包括地震數據採集最優化設計和成像。數據既來自陸地,也來自海洋。現在,他負責開發用於地震處理的機器學習解決方案。他與研究夥伴合作發明了——壓縮感知地震採集技術。2016年,他獲「創新精神獎」。2018年,獲「科技優勝者獎」、「亞洲OTC新技術聚焦獎」。 2017年,他和合作者的論文《Operational deployment of compressive sensing systems for seismic data acquisition》被選為國際知名雜誌《the Leading Edge》的當年最佳論文。2019年,他獲得了「傑出科研技術人員精神成就獎」。雖然榮譽滿滿,但是這位優秀的青年科學家身上低調、嚴謹的特質非常突出。


地球物理數據採集環境往往是非常特殊的自然環境,除了愛好冒險和嚮往極致自然景觀的探險者,普通人很難有這份兒體驗。

「不允許留下任何人為的痕跡。車輛如果滲油,那麼就得連同冰與雪一起回收起來。對任何表面有植被的地方,決不允許人員與車輛進入。」他說,「做地震數據採集的項目面臨的挑戰實質上有兩個,一個是極端惡劣環境,一個是環境保護的良心。」


「夏天的時候不能有任何活動,只有在冬季的時候,整個地表全部都凍起來,形成凍層之後,才會被允許進行地質勘探活動。」 由於辦公場地的特殊性,李博士的工作時間比普通人更加受限。


北極圈附近的氣候異常極端,人們會誤解該地區很難遭到人為的環保破壞。然而,該地區的生態環境卻非常的脆弱。作為到訪北極圈的科研工作者,他對「環境保護」理解非常深刻。既要考慮科研目的,也確保人類的任何活動都要保護當地環境。從一開始,環保就是擺在科研優先性前面的原則。


「可以被允許工作的時間段,不超過四個月。」李成博博士第一次踏上北極圈的雪地是在2015年的2月份。



眾所周知,在北極圈工作,將面臨嚴酷的工作環境。作為一個東北小伙,李成博對「抗凍」很有信心,然而,極端環境還是超乎他的想像。「採集數據時的溫度,也就零下三十多度吧,起風後,零下三十五度左右。女生(體重)輕一點站都站不穩。」天氣冷,時間短,任務重,是三個難點,但是有趣的一點是,他們在聖誕老人家附近「上班」。


一、CSI技術的核心是什麼?

可能連聖誕老人也不知道,數據科學家們正在進行著一項無比精細、複雜而宏大工程。這是一種模擬地震波傳播的方法,採用可控震源。通過震源持續震動,向下傳播的波遇到地下不同的岩層反射回地面接收信號的方式來進行勘探。由於可控震源振幅擾動較小,對生態環境非常友好。


值得讓人興奮的是,開發新的地震數據採集技術是一項前沿性挑戰。也就是說,接收到的信號,經過數據中心的數字處理和地質解釋,其成果成為判斷地下情況的重要依據。


李博士介紹,「簡單來說方法是,在地表放置檢波器和震源。通過某點激發一個震源,向地下傳波。遇到某一個比較強的反射層的時候,能量會通過強反射,反射回地表。這樣在地表就得到了一個響應的效果,接受到信號。通過一組震源和一組檢波器,就可以採集到一個數據體。在數據採集的時候,有上萬個檢波器同時工作。就形成了一個所謂的五維的數據體,進行地下情況的刻畫。說到底,這些接收到的信號,經過數據處理和地質解釋,其結果會成為判斷海底地質結構的重要依據。CSI技術的核心就是,如何最優的放置這些檢波器點和震源點,在最小的代價下,最大化獲得地下信息。」


因為這項技術對自然環境的影響較小,所以得到了州政府的支持,否則,在聖誕老人的家門口人為的搞「小型地震」,他老人家未必願意。

二、數據越來越受重視,數據獲取技術也在進步

經過幾年艱苦的研發,陸地上的第一次大規模實施,就是在阿拉斯加。所以,2015年的2月,即是李成博的第一次,也是該項技術落地實施的第一次。


李博士說,「作為主要的技術研發人員,到作業現場做調整是必須的。」新技術實施後,他收到了雙份的驚喜。

第一個是地震數據收集效率得到很大的提高,五到十倍的增長。第二個驚喜則是這項採集工作進一步減少了採集工作對自然環境的影響,尤其是減少了對極地環境的人類腳印。對於這兩項成績,康菲公司內部非常的振奮。


美國康菲石油公司除了與中國油氣行業的合作發展已經超過三十七年,是中國油氣上游領域的重要外國投資商和生產商之外,非常有意思的一點是,康菲石油首席技術官Gregory P. Leveille在《中國能源報》的採訪中公開表示,「就大數據應用方面,康菲石油主張讓專家和員工都進行實際操作,以提高工作效率。目前,康菲石油1.1萬名員工中有4000名都可以接觸,並使用資料庫以及相關數據分析工具。」


他強調,「一方面,不斷追求高端人工智慧技術的研發,同時鼓勵和敦促員工學習和應用機器自動化;另一方面,將大數據技術適用於整條產業鏈,從鑽井到運營再到倉庫管理等所有領域。」

不得不說,數據驅動型文化正在全球領先的石油公司根植。


三、地球物理中,獲取數據有何「不易」?


李博士說,油氣勘探的技術正在不斷進化,行業的數據採集工作有兩個特點,第一個是採集到的數據量巨大,第二個是數據採集成本非常高昂。


他對「數據量的飛漲」進行了專門地強調。在採集地震數據的時候,數據量大概有多大呢?在一次數據採集周期,兩到三個月可以在陸地上可以採到Petabytes單位的數據量。數據已成為石氣勘探的重要資產,數據在驅動油氣勘探技術創新。


李博士強調,「採集地震數據量是巨大的,海量的,無論你用什麼方法,必須要在海量的數據上有一個魯棒的表現。」


因為昂貴,所以省錢非常重要。


地震數據採集項目是非常花錢的工作,基本都是上億元人民幣起步。但是,如此巨資投入的情況下,數據的狀況還未必理想。一方面,利用地表的數據,來刻畫地下的信息,並不是直接獲得數據的方式。另一方面,採集數據的時候,地表的情況也不容樂觀。以阿拉斯加北極圈內的採集項目為例,地表經常有非常嚴重的風噪音。因為採集到的數據的情況差,必須用一些技術手段把弱信號還原,包括機器學習的方法。



李博士說,「壓縮感知地震採集技術,對解決採集成本高的難題有很大的幫助,可以通過一些不規則的采點方式收集地震數據,在降低採集成本,及不受特定限制區域影響的同時,大大提高採集效率和成像解析度。」


四、機器學習應用的「難點」


「如何通過機器學習的方法把弱信號恢復過來?」 對於這個問題,李博士這樣回答,「在一個弱信號、強噪音的情況下,處理這個問題的方法並不是技術發展到今天才出現的。過去幾十年,整個勘探地震學已經想出了很多解決辦法,比如通過建立模型把信號提取出來。」

「這種方法在大多數的情況下(效果)還可以。如果只強調把比較強的信號提取出來的話,困難並不大。難度在於,如何能夠把最後的20%的非常弱的信號提取出來,這是地震處理中比較大的問題。在地震行業,是沒有標註的數據。地震數據處理中,沒有辦法對海量的數據進行監督學習技術處理,所以要用無監督學習的方法來進行工作。


有一點很重要,在處理這些數據的時候,有很多經典的、模型驅動的方法。應該充分利用這些樣本,不是說有了機器學習技術,其他的就不需要了。所以,第一步,我們需要在一個樣本中選取一個方法,建立一個合適的模型。比如說這個信號大致長什麼樣子,可以把它估計出來。」


「利用一些傳統的方法把信號大致估計出來之後,雖然並不能做到百分之百,但是百分之五十非常迅速地可以做到。然後,通過深度學習的方法,確認這個地震信號到底在哪裡?這個信號到底長什麼樣?通過已有樣本,反演弱信號,高噪音情況下的反應。一部分是信號,一部分是噪音,噪音是什麼呢?噪音在我們看來也是信號。所以在工作的過程中,我們發現把噪音當成信號來處理,對於『去噪』效果非常,把噪音和信號進行同步處理。說到底,機器學習在這個過程中起到了一個橋樑作用,將基於物理,數學的傳統方法和人工智慧聯繫起來」


同樣的觀點,也來自於全球領先的信息數據分析公司,愛思唯爾(Elsevier)的高級數據科學家沈澄,久居倫敦工作的他在英國天然氣勘探公司有著豐富的項目經驗。他這樣告訴《親愛的數據》,打一個比喻,挑西瓜的時候,人們通過拍打西瓜聽聲音,推測西瓜是否成熟。在石油天然氣勘探領域,人們在地底下安裝很多震動的信號器,然後收集反射回來的聲波、頻率等信號。就好比能收集到很多很多個敲打西瓜的聲音。傳感器收集到的信息,作為深度學習輸入的數據,從而得到石油儲量信息。



深度學習技術對於地球物理領域,有一個比較正面的影響,或者說,就是說一個比較大的作用就是,其實噪音裡面包含了很多信息,以前沒有辦法從「噪聲」里找到的信息,這是我們沒有辦法,用好這個信息。現在這項技術能夠從「噪聲」中「榨取」更多有用的信息。

在地球物理領域,還有另一個難點。採樣率是比較低的。在使用機器學習技術分析圖像時,用低解析度的照片來進行機器學習和高解析度的照片進行機器學習,這是有很大很大的區別的。現在大家可以輕鬆地獲得高解析度,比如,兩千像素乘兩千像素。在地球物理領域,幾十米的解析度已經很高了。畢竟是從地底下上萬米採集來的數據。


這種基於無監督學習和反演強噪聲殘留地震信號恢複方法,可以應用於不同領域和不同階段,以提高地震處理的質量和效率。實測數據表明,該方法能夠較好地恢復40分貝以下噪聲里的微弱信號,或者從複雜的數據(儲集層、岩石)中提取特徵。將機器學習與傳統方法相結合,成為解決地下問題提供了強有力的手段。


李博士強調,「人工智慧在油氣勘探領域已經開始陸續應用,曾經需要幾十個人處理幾個月的數據,用神經網絡和人工智慧的訓練算法去處理,效率和有效性兩方面都有很大提高。」


最後,李博士補充道,在油氣領域,大數據與人工智慧技術還可以用在很多環節。比如鑽井活動,可以通過大數據對老齡化油氣田進行分析和評估,儘可能延長其壽命。同時,還將其應用於新井鑽探和開發。每一年,全球大型石油公司都會打很多井,大數據技術不僅有助於提高效率、減少支出,還能夠減少生產活動的作業面積,即有益於生態環境,又提高了工作的安全和可持續性。


歡脫的雪橇犬在雪地里留下一排小腳印,棕熊與駝鹿在樹林裡捉迷藏,星星在深藍色的天空里眨眼,極光閃耀空中,北極大地平靜而廣袤,環境與未來在連接,新技術與古老能源在融合,人類探索自然與科技發展永不止步。

(完)

《親愛的數據》致謝:本文部分內容來自「首屆人工智慧中的數學理論研討會」(2019年12月15日至16日),該會議由中國科學院數學與系統科學研究院華羅庚數學中心主辦,計算數學與科學工程計算研究所、科學與工程計算國家重點實驗室、中國科學院青年創新促進會、中國科學院數學與系統科學研究院-香港理工大學聯合實驗室、國家自然科學基金委、電子科技大學數學科學學院協辦。




關鍵字: