在線繪製RNA-seq,microarray基因表達譜聚類熱圖heatmap

微生信 發佈 2022-09-24T22:45:44.795929+00:00

聚類熱圖是生物醫學論文中最常見的一類圖。一般情況下我們認為cluster(聚類)、 heatmap(熱圖)兩個詞表達的是同一個意思,往往相互替代。然而這兩個詞還是有區別的,cluster是數據處理,heatmap是數據展示。

聚類熱圖是生物醫學論文中最常見的一類圖。一般情況下我們認為cluster(聚類)、 heatmap(熱圖)兩個詞表達的是同一個意思,往往相互替代。然而這兩個詞還是有區別的,cluster是數據處理,heatmap是數據展示。其過程是:用我們拿到的表達矩陣根據不同的聚類方法和不同的距離算法算出另外一個矩陣,然後對這個矩陣進行上色,以heatmap的形式展示出來,類似excel中的色階功能。

該圖由樹,顏色塊矩陣,名字,colorbar和組說明5種元素構成。

1,打開繪圖頁面

首先,使用瀏覽器(推薦chrome或者edge)打開聚類熱圖繪製頁面。左側為常見作圖導航,中間為數據輸入框和可選參數,右側為描述和結果示例。也可以在主頁搜索框中搜索heatmap,找到繪圖頁面。

微生信-免費在線繪製聚類圖(cluster),熱圖(heatmap)

2,示例數據

點擊右側「示例數據」連結下載excel格式的示例數據。

示例數據(僅供參考)為矩陣形式,行是基因,列是樣品,其中:

第一行是樣品分組,分組名可重複

第二行是樣品名,樣品名不可重複

第3+行是基因

行和列交叉的cell是每個基因在每個樣品中的表達值或者其他值,例如質譜信號等,一般需要使用標準化後的值。對於fpkm,tpm等可以每個值加1,然後取log2;對於質譜等信號非常高的數據可以先取log10,再標準化。

注意:需要參考示例數據,將自己的數據在excel中整理成示例數據的樣式,每個cell都需要有,表達值不能為空或者NA。

3,粘貼示例數據

直接複製示例數據中的A-G列數據,然後粘貼到輸入框。

注意:不是拷貝excel文件,是拷貝excel文件裡邊的數據。另外粘貼到輸入框後,格式亂了沒關係,只要在excel中是整齊的就行。並且數據矩陣中不能有空的單元格,中文字符等。對於較大的數據,我們提供了上傳txt文件的按鈕。

4,修改參數,並提交

我們設置了圖片尺寸、文字大小、顏色、聚類方法、字體等參數,基本能滿足日常繪圖使用。如需更高級的定製,請聯繫我們。

5,提交出圖

粘貼好輸入數據,調整好參數(或者全部默認)後,點擊提交按鈕,幾秒鐘後,會在頁面右側出現預覽圖。我們提供了4種圖片格式供下載使用,兩種矢量圖(pdf,svg)和兩種標量圖(600 dpi tiff和300 dpi png)。

熱圖說明:

1)由於pheatmap參數眾多,這裡僅設置了一些常用的參數

2)顏色默認是紅白藍,可以根據喜好設置成紅黑綠等顏色

3)參數「要顯示的名字」可以控制是否顯示基因名或者樣品名。一般來說,當基因數少於50個時可以顯示基因名;當樣品數小於20個時,可以顯示樣品名。否則圖的文字會重疊,不美觀。

4)默認在所有樣品中值一樣的整行會刪掉,這些行一般沒意義。

5)默認當兩個基因名字一樣時,取其均值作為表達值。

6)函數中設置了回調函數(callback),默認組的順序跟輸入一致。若出圖後,組的順序變化,可以使用不同的距離方法和聚類算法進行調整,以達到固定組的順序的目的。

7)由於聚類,所以會存在有些樣品分組亂套的情況,這一方面跟數據本身有關,另一方面跟使用的算法有關,可以通過調整距離方法和聚類算法達到「分開」的目的。

8)當僅有兩個樣品時,請勿使用scale按鈕

9)如果要完全保持基因或者樣品的順序,可以選擇「不聚類」按鈕。沒有預覽就沒有出圖,這時請參考示例數據,檢查自己輸入數據的格式。
遇到文字截斷,需要修改字體、調整字體大小等,請參考科研作圖實操:用inkscape編輯svg矢量圖


微生信助力發文章,谷歌引用640+,知網引用480+

關鍵字: