數據可視化有一個分類學問題

聞數起舞 發佈 2022-04-17T12:33:20.425090+00:00

學習數據可視化、教授數據可視化和評估數據可視化工具有一個共同點:長長的不同種類的圖表清單。根據你所處的模式,這些圖表清單定義了你還不知道什麼,你的學生需要知道什麼,或者你的利益相關者可以實現什麼。

探討分類學思維的隱藏成本

瑪麗-安托萬網絡和其他藝術 Hajra Meeks.

學習數據可視化、教授數據可視化和評估數據可視化工具有一個共同點:長長的不同種類的圖表清單。根據你所處的模式,這些圖表清單定義了你還不知道什麼,你的學生需要知道什麼,或者你的利益相關者可以實現什麼。數據可視化,儘管最近發展迅速,但仍在確定如何評估其方法的有效性和適當性的過程中。因此,我們沒有明確的指標可用來客觀地比較競爭性的數據可視化方法,這反映在這些列表的呈現方式上的顯著差異。

這些清單有很多形式,但最突出的是圖形分類法。我們大多數人都在生物課上接觸過這種形式,當時我們學習進化論,看到樹狀圖,說明物種之間如何以不同的複雜程度相互關聯。

這些樹是用不同的方法建立的,如形態學或遺傳學的物種如何相關。對於圖表分類法,通常情況下,組織與圖形標記關係不大,而與創作者的目標關係較大。因此,有時條形圖分散在其他種類的圖表中,因為有些類型的條形圖在一種情況下有用,而其他類型的條形圖在另一種情況下有用。如果你想閱讀更多關於數據可視化分類方法的內容,這是在數據可視化討論中主持的話題之一。

你可能會想,這只是那些深度參與設計或部署數據可視化的人所關心的問題,但它甚至會影響到最隨意的用戶。分類法也可能隱含在導航數據可視化產品的UI中(當創建者沒有簡單地放棄並將所有的圖表選項放在一個巨大的菜單中時)。例如,你可能會看到各種條形圖都可以在一個菜單中找到。同樣,線狀圖也有自己的菜單或欄目,等等。如果你在Excel中製作圖表,圖表選項的設計和顯示方式在很大程度上依賴於如何看待這些圖表之間的關係。

在微軟Excel圖表選擇器用戶界面中看到的明確的層次結構,將柱狀圖與條狀圖、線狀圖與區域圖分開(以及其他決定),突出了將圖表組織在一起的有意性質。

分類法問題 "不在於分類法本身。分類法對於理解人群很有幫助,並且吸引了我們從混亂中創造秩序的意識。但是,分類法也可以偷換意義,並假定用戶的意圖。換句話說,分類法的問題是,很難將可能有多個位置的視覺形式放在一個分成語義部分的層次結構中,因此很難負責任地使用。如果你不小心,你就會接受他們隱含的論點,並縮短了數據的潛在意義。雖然作為組織的第一步很有用,但分類法通過任意地限制其用戶,不由自主地對意義的產生起作用。為了定義分類法,創建者根據圖表的模式--如探索性數據分析或解釋性圖形--為圖表類型分配了意義,它們最適合於了解數據可視化的不同模式。用戶根據創建者對其效用的看法,限制了他們對每個圖表意義的概念,偏重於這些模式中的一種。

分類法在組織圖表方面很受歡迎,但它們並不是現實的反映。相反,它們是對一個特定觀點的論證。看一看競爭性的分類方法。什麼是圖表家族,是由組織規則的創造者決定的。所有的分類都是如此。我們是在美麗乾淨的樹狀圖中長大的,這些樹狀圖是物種之間的後裔,但實際上這些樹狀圖都有一些點,在這些點上你需要打破規則,畫上橫線或豎線才能真正準確。

分類法的隱藏成本

數量與質量

分類法的第一個隱含的要求來自於它在營銷數據可視化產品中的使用,在那裡它強化了更多就是更好的信念。ChartDo XTreme可以渲染37種不同的圖表。掌握圖表第四部分將教你如何製作45種圖表。Froggle公司高級數據視覺師的技術面試將希望你能證明你能創建至少63個圖表。更多的圖表並不意味著更好的圖表。一些最強大和引人注目的數據可視化使用非常簡單的圖表,如表格、柱狀圖和線狀圖。圖表的數量也不隨單個圖表的風格和裝飾的控制水平而變化,一個允許你製作一個真正偉大的線圖的工具,比一個讓你製作一打看起來像從通用模板上複製的圖表的工具要好。

改造你的食譜

但在分類法中還隱藏著一個更危險的方面。圖表是數據可視化的一個糟糕的測量單位。如果我們把圖表看作是數據可視化的物種,我們就會使用錯誤的比喻。堆疊的條形圖並不是從條形圖進化而來的物種。相反,堆疊條形圖是數字和分層可視化成分的混合。讓我們把比喻從物種換成食物菜餚。沒有人認為胡蘿蔔蛋糕是從巧克力蛋糕進化而來的,它們只是甜點類別中的兩種不同產品。

再往前走一步,把圖表看作是各種成分或因素的混合物,也是更有用的。讓我們面對它吧。吃蛋糕遠比一個一個地吃原料更令人滿意。一杯蛋糕粉,接著是一根黃油和一堆糖,並不能成為一個好的甜點。就像巧克力蛋糕或胡蘿蔔蛋糕有許多相互競爭的食譜一樣,圖表不應該被當作菜單上的固定項目。通過強調成分(圖表元素)和這些成分如何結合的重要性,你可以創造出標誌性的菜餚和令人驚嘆的可視化效果。然後,這些菜譜可以被無休止地調整和修改。最有價值的圖表超越了基本的類型,提供了豐富的注釋和量身定做的定製。一個圖表,就像一道美味的菜餚,是為觀眾創造的。

乍一看,這只是一個線圖。然而,這是我在Netflix擔任高級數據可視化工程師期間最值得驕傲的數據可視化作品。為什麼呢?它不需要一些新的、瘋狂的圖表技術。它依靠注釋和對雙重編碼的深思熟慮地使用,將一個複雜的觀點傳達給一個複雜的、有鑑別力的觀眾。在這個案例中,它是不同的處理方法如何在A/B測試的有效期內顯示出統計學意義上的積極和消極影響,並指導產品經理對新功能的接受標準。

限制靈活性

一個查看圖表的視圖和一個查看圖表 "食譜 "的視圖怎麼會有如此重要的區別呢?巨大的圖表列表意味著用戶需要為工作選擇合適的圖表,這是處理數據可視化的錯誤方式。不同的數據可視化模式適合於不同的數據類型和領域。選擇一個圖表並不能保證它考慮到利益相關者的偏好,也不能保證它使用必要的信息設計來使圖表有效。

從 "選擇正確的圖表 "的角度出發,你將自己鎖定在不必要的干擾中。僅僅因為你有調查數據,並不意味著你應該使用傳統上與調查數據相關的數據可視化,如果你的聽眾對這些數據不熟悉。同樣地,雖然時間序列數據通常在折線圖中是最好的,而表格通常是可視化數據的最佳方法,但在某些情況下,另一種選擇即使不優越也同樣有用。

分類法限制靈活性的最後一種方式是,工具通常直接將數據格式與圖表類型掛鈎。無論是圖形工具還是數據可視化庫,你都可以看到這樣的期望:一種類型的圖表的數據與另一種類型的圖表的數據採取非常不同的形式。但是,數據轉換是數據可視化不可或缺的,大多數形式的數據都可以以這樣或那樣的方式顯示在大多數形式的數據可視化中。這種靈活性不僅對探索很有價值,因為利益相關者可能希望以許多不同的形式看到他們的數據,這對數據掃盲和發現關係也是至關重要的。

如何突破分類學思維的束縛

少考慮正在使用的圖形標記,多考慮可視化的目的,並依靠分類法來實現這一目的。當你為你的組織制定數據素養計劃或編寫風格指南,定義你的組織的數據可視化的最佳方法時,確保你的重點是在目的,而不是手段。

想一想組織圖表的不同方法。當我開發Semiotic時,我設想了三個基本框架。

  • 用於比較笛卡爾空間中的數據的XY框架(散點圖,但也包括線圖、堆積區域圖和網格)。
  • 用於比較分類數據的序數框架(條形圖,但也包括餅圖、小提琴圖和boxplots)。
  • 網絡框架不僅適用於傳統的網絡可視化(力導向的網絡),而且還適用於桑基圖、弦圖和圓包,這些都是網絡的可視化表示。

這並不是組織圖表的 "正確 "方法,這只是另一種方法。思考其他方式有助於你增長知識,更好地定位你的專業和設計方法。

的分類法(在API中可以看到)將圖表分為三大類。 Semiotic的分類法將圖表組織成三個非常廣泛的類別,其依據是它們是在笛卡爾空間中比較數值,還是在不同類別中比較數值,或是關注拓撲關係。這對庫的能力有真正的影響,允許它在根本上相關的分層圖表之間輕鬆轉換。

而且,也許是一個更宏大的例子,它顯示了柱狀圖與漏斗圖、折線圖和平行坐標圖的關係。

避免基於圖表類型的隨意批評。多看看整頓飯,而不是個別的菜。我們總是被告知餅狀圖是可怕的,但也許它們在小倍數的情況下是有用的,是對其他圖表的補充,或者因為它們是你的受眾對某些信息所期望的圖表。

無論你在哪裡考慮圖表--無論是在評估產品還是增長你的數據可視化技能--都要謹慎對待完全買入分類法的問題。在這條道路上,你可能會告訴你的利益相關者 "讓他們吃蛋糕",因為這是你所知道的一切。

相反,努力學習偉大的數據可視化的常見成分和久經考驗的配方(甚至開始改編一些自己的配方)。擁抱創造偉大的數據可視化所固有的模糊性和個性化。它比簡單的分類法更難表達,也更難瀏覽,但它更準確,並會帶來更好的技能、工具和圖表。

我們關心分類法的隱性成本,因為我們關心如何在我們的產品中製作數據可視化,如果你對一個如此關心數據可視化的產品感興趣,或者如果你對在一個如此關心信息設計的公司工作感興趣,那麼請聯繫我們。

關鍵字: