SEER資料庫挖掘上新啦,臨床預測模型構建,突破內卷!

雲生信學生物信息學 發佈 2023-12-17T17:23:40.252876+00:00

爾雲間 一個專門做科研的團隊歡迎點讚+收藏+關注[給你小心心]還在感嘆生信不好發文?想找新出路的朋友看過來,小雲要祭出大招啦!跳出內卷,第一招——回到科研源頭,從臨床出發。小雲目前最推薦的途徑就是臨床公共資料庫挖掘!

爾雲間 一個專門做科研的團隊

歡迎點讚+收藏+關注[給你小心心]

還在感嘆生信不好發文?

想找新出路的朋友看過來,小雲要祭出大招啦!

跳出內卷,第一招——回到科研源頭,從臨床出發。

小雲目前最推薦的途徑就是臨床公共資料庫挖掘!比如最常用的、發文量比較多的SEER、NHANES資料庫,分析不難,還比較容易發高分,這種高性價比的發文途徑可不能錯過,紅利期很短,還在觀望的小夥伴抓緊上車啦!

這兩個資料庫挖掘的文章小雲都給朋友們分享過(ps:還沒看到的小夥伴可點擊文末連結觀看哦)

今天再分享一個5.5分+SEER資料庫挖掘和臨床預測模型構建的文章,分析過程相當簡單,只有模型建立和驗證(基本上占常規生信的一小部分工作量)就能發到5分+,還不用做驗證實驗,這麼高性價比的思路豈不是很適合臨床研究者呀!感興趣的朋友快來抄作業啦!


文章題目:預測老年上皮性卵巢癌患者總生存率和癌症特異性生存率的列線圖

發表雜誌:J Ovarian Res.

影響因子:IF=5.506

發表時間:2023年4月


研究背景

上皮性卵巢癌是老年患者中最致命的婦科惡性腫瘤之一,與年輕的EOC患者不同,由於身體和心理條件更差,老年患者的治療方案選擇一直較為保守,通常依賴於臨床醫生的經驗。到目前為止,對於患有卵巢上皮性癌的老年患者的治療方案還沒有明確的建議。因此,為了臨床醫生做出更好的臨床決策和準確評估生存率,並使老年EOC患者受益,有必要定義生存因素並構建生存預測模型。



研究思路

使用SEER資料庫,收集選擇2000年至2019年間患有EOC的老年患者數據,以2:1的比例將登記的患者隨機分為訓練組和驗證組。OS和CSS被認為是終點時間。利用多變量分析篩選得到的獨立預後因素建立預測老年EOC患者OS和CSS的列線圖。通過一致性指數(C指數)、ROC曲線、校準曲線、決策曲線(DCA)、淨重新分類改善指數(NRI)和綜合區分改善指數(IDI)來評估預測能力和臨床益處。根據列線圖總得分進行分層,KM曲線分析低、中、高風險組的預後差異,並分析手術和化療在低、中、高風險組的治療效果。



主要結果

1. 患者基線特徵

根據納入和排除標準,共有5588名老年EOC患者最終納入本研究,根據2:1的比例隨機分配到訓練集(n= 3724)和驗證集(n= 1864),患者選擇流程圖見圖1,患者基線特徵見表1。從SEER資料庫中提取了總共22個EOC患者的臨床病理變量。總生存期(OS)和癌症特異性生存期(CSS)被視為終點時間。

圖1患者選擇流程圖

表1 患者基線特徵


2. 列線圖的開發和驗證

在訓練集中進行單變量和多變量Cox回歸分析確定與OS和CSS相關的獨立預後因素,發現12個變量(年齡、種族、等級、組織學、橫向、AJCC分期、淋巴結檢查、淋巴結陽性、T分期、手術、化療和骨轉移)是OS的獨立預後指標,13個變量(年齡、種族、等級、組織學、橫向性、AJCC分期、SEER分期、淋巴結檢查、淋巴結陽性、T分期、手術、化療和骨轉移)為CSS的獨立預後指標。根據確定的獨立預後因素,作者構建了老年EOC患者的列線圖,以預測3年、5年和10年OS以及CSS(圖2A, B)。

利用NRI、IDI和C指數評估列線圖的預測性能和應用價值,並與與AJCC分期系統的臨床價值進行比較(表2),結果顯示與AJCC階段系統相比,列線圖具有更好的預測能力。隨後又利用校準曲線評估預測一致性,ROC曲線評估其區分能力,DCA曲線評估臨床獲益,校準曲線顯示了實際觀察到的存活率與列線圖預測的存活率之間的高度一致性(圖3A),ROC曲線表明列線圖具有良好的區分能力(圖3B),決策曲線(DCA)顯示了良好的正淨效益(圖3C),綜合證實了列線圖的卓越預測性能。

圖2 列線圖

表2 列線圖的NRI、IDI和C指數以及與AJCC分期系統的對比

圖3 利用校準曲線、ROC曲線和DCA曲線進行模型評價


3. 基於列線圖總分的分層分析

根據列線圖計算總分,EOC的老年患者被分為三個預測OS的風險組,包括低風險組(總分≤ 140.91)、中風險組(140.94 ≤總分≤ 177.33)和高風險組(總分≥ 177.35),進行Kaplan-Meier生存分析。結果顯示,三個亞組的OS和DSS預後都具有統計學上的差異(圖4A, B)。由於手術和化療都是老年卵巢癌患者的獨立預後因素,所以作者又通過log-rank檢驗和Kaplan-Meier曲線來分析包括手術和化療在內的治療在上述三個危險分層亞組中的療效,結果顯示接受局部腫瘤切除術的老年上皮性卵巢癌患者的生存率高於腫瘤減滅術和盆腔清除術(圖5A, C, E)。接受化療的老年卵巢癌患者在高危組中預後較好,但對於中危組和低危組,化療不能改善預後(圖1B, D, F)。

最後基於該模型,作者構建了兩個基於網絡的動態計算器(https://xxlchxjh.shinyapps.io/DynNomapp/ 、https://xxlchxjh.shinyapps.io/DynNomappCSS/),以簡化這些列線圖的應用。

圖4 低、中、高風險組間的OS和DSS生存分析

圖5 手術和化療在三個危險分層亞組中KM分析



文章小結

這篇文章基於SEER資料庫構建臨床預測列線圖並進行詳細模型評價,最後還生成了2個動態計算器,直接跟臨床掛鈎。數據分析方法比較簡單,同時臨床意義又高,5分+的文章輕鬆到手,性價比之很贊啦!如果你也收集樣本困難,但又需要發高分文章,不妨試試這個思路吧!


小雲持續為大家帶來最新生信思路,更多創新分析思路請點擊連結。需要復現或了解更多分析思路的朋友歡迎call小雲,風裡雨里小雲等你!



  • 什麼?只做公共資料庫分析就能發到10分+ 1區Top文章?SEER資料庫就能做到!發文周期相當快,抓緊上車!
  • 臨床公共數據挖掘熱潮又起!「NHANES」資料庫挑起大梁,發高分SCI 簡直不要太簡單!再不上車就晚了喲
  • 17分+Nature子刊帶來臨床+基礎研究新思路——臨床試驗+多組學聯合生信分析篩選標誌物,創新性極高,等你來探索!
  • 超高性價比的「孟德爾隨機化」來啦!公共數據挖掘,簡單4張圖搞定6分+,1個月就接收!走過路過千萬不要錯過
  • 3張圖發到12分+文章你敢信?大隊列病理分析聯合公共數據做生信驗證就能辦到!超簡單的免疫檢查點預後模型構建,速度沖!
關鍵字: