應用機器學習方法,預測高鐵列車晚點

電氣技術 發佈 2020-01-16T20:20:24+00:00

軌道交通控制與安全國家重點實驗室、北京交通大學交通運輸學院、中國鐵路瀋陽局集團有限公司的研究人員張朴、孟令雲、李寶旭,在2019年《電氣技術》增刊1上撰文,採用機器學習的理論與方法,建立了基於支持向量機的區間單車次高鐵列車晚點預測模型,在此基礎上進一步建立了區間全車次高鐵列車晚點

軌道交通控制與安全國家重點實驗室(北京交通大學)、北京交通大學交通運輸學院、中國鐵路瀋陽局集團有限公司的研究人員張朴、孟令雲、李寶旭,在2019年《電氣技術》增刊1上撰文(論文標題為「基於支持向量機的高速鐵路列車晚點演化預測」),採用機器學習的理論與方法,建立了基於支持向量機的區間單車次高鐵列車晚點預測模型,在此基礎上進一步建立了區間全車次高鐵列車晚點預測模型,並以京滬高鐵線路為背景,選取2017年10—12月蚌埠南—津滬線路區間的列車運行實績數據對模型的有效性進行實例驗證。

本文對原始數據進行了標準化、過採樣的預處理,對晚點時長進行離散化處理,構造了「晚點混淆矩陣」對預測模型進行評價,結果表明,晚點預測模型對高鐵列車的晚點範圍有理想的預測效果。本文是機器學習理論在高速鐵路列車晚點演化研究領域中的一次嘗試,表明機器學習方法在高鐵列車晚點預測上具有一定的可行性。

鐵路列車在其運行的全過程中,不可避免地受到來自鐵路系統內部與外部的一些擾動,這些擾動可能源於設備故障、交通事故、極端天氣等,也可能源於非預期車流或考慮不周的調度指揮。擾動對列車運行造成的影響是一個不斷累積的過程,鋪畫合理的運行圖是在一些區間、站點設有一定的冗餘時間,以吸收和緩解擾動對列車運行造成的影響。而無法通過冗餘時間吸收的擾動將持續累加,最終導致列車無法按圖準時行車,因此,列車晚點現象產生。

列車在發生晚點後繼續行駛,部分晚點現象可以通過區間趕點、壓縮停站時間等方式得到改善甚至是消除;另一些沒能得到緩解的晚點可能會一直持續,甚至因後續的擾動影響而進一步惡化;還有一些晚點是在列車之間的相互影響作用下於路網中傳播。

晚點演化就是在列車運行過程中,晚點產生、傳播、持續、惡化、恢復的全過程。高速鐵路列車具有旅速高、開行頻次多、開行密度大的特點,這意味著晚點一旦發生,就會產生複雜而劇烈的演化,故傳統的理論方法難以對其進行有效的研究。

既有的高速鐵路列車晚點研究主要圍繞晚點分布、晚點仿真生成、晚點傳播鏈構建、晚點恢復等方面展開。

在晚點分布方面,劉岩等分析了列車實際區間運行時分、列車區間運行時分、停站時分與列車晚點之間的關係。Briggs等基於英國鐵路列車運行數據進行了晚點分布的統計,建立了全部晚點的q指數分布模型。劉健等以京滬高速鐵路實績數據為基礎進行列車運行仿真,得到了突發事件的發生機率。Yuan等構建了列車晚點傳播模型,通過理論推導預測列車在車站的到達時間分布。Xu等基於列車運行實績數據,繪製了高速列車晚點的分布曲線,但其研究並未建立起致因—初始晚點時長的相關模型。莊河等基於廣鐵集團高速列車運行實績,研究不同致因情況下初始晚點時長的分布模型。

有關晚點傳播過程、列車延誤模型、列車晚點恢複方面的研究尚且沒有一套完整的理論體系,孟令雲等提出一種基於列車運行實績數據挖掘的列車晚點傳播過程構建方法。姜雯、李曉娟等將高速鐵路列車運行過程作為離散事件系統,並採用極大代數的方法建立列車延誤仿真模型。黃平等提出基於列車運行實績的列車晚點恢復模型,分析高速列車初始晚點恢復的影響因素,建立了初始晚點恢復的隨機森林模型。

從已有研究分析來看,基於列車運行實績進行高速鐵路晚點演化相關問題的研究尚不成熟,雖然這些研究均指出基於高速鐵路列車運行實績數據對於運輸組織優化問題具有重要的作用,但少有對晚點演化過程全面整體的認知,關於高速鐵路晚點演化預測、規律的研究暫時處於起步階段。


近幾十年來,隨著計算機性能飛躍般地提升,人類收集、存儲、傳輸、處理數據的能力也取得了里程碑式的突破,對數據進行深層挖掘、分析利用的機器學習算法也受到了前所未有的廣泛關注與應用。機器學習算法通過對大數據進行預處理、降維、特徵提取與關聯,可以揭示深藏於數據之中的機理與規律,從而完成對現實具體問題的指導。

隨著鐵路信息化發展,列車運行實績數據的收集工作日益完善。高速鐵路有著更加先進、健全的信息管理系統,列車運行信息的收集也更加精細化與標準化。龐大的列車運行實績數據成為了分析列車運行狀況、線路基礎設施運用狀況的寶貴資源,高鐵列車晚點演化的過程及其深層次的演化機理也蘊藏其中。

為此,本文嘗試構建基於機器學習的晚點演化預測模型,通過對高鐵列車運行實績數據的特徵提取與處理,結合表現效果好的支持向量機算法,達到對晚點演化進行預測的目標。

結論

本文藉助機器學習的理論與方法,對京滬高鐵列車運行實績數據進行了樣本提取、特徵標準化、過採樣、晚點標籤離散化等處理;結合晚點分類構建了混淆矩陣,並給出一些評價指標;建立了基於支持向量機的單車次列車晚點預測模型和區間全車次列車晚點預測模型並編程實現。通過構造評價指標評估了模型的有效性,結果表明,模型對高鐵列車的晚點範圍有理想的預測結果。

本文是機器學習理論遷移至高速鐵路列車晚點研究領域的一次嘗試,實例證明了機器學習方法具有一定的可行性。

關鍵字: