你常常被數據欺騙,卻還深信不疑 | 長江讀書405期

長江商學院 發佈 2023-12-21T11:17:27.585046+00:00

數據,往往會被等同於理性。在資訊時代,我們越來越依賴數據量化和衡量一切。工作學習是否高效,企業運轉是否良好,一個國家是否比另一個國家發展更好……然而,數據都能像傳統認知的那樣客觀、公平?

數據,往往會被等同於理性。


在資訊時代,我們越來越依賴數據量化和衡量一切。工作學習是否高效,企業運轉是否良好,一個國家是否比另一個國家發展更好……然而,數據都能像傳統認知的那樣客觀、公平?


本期長江讀書為你帶來《為什麼數據會說謊》,作者在書中提醒,忽視重要的指標設定,由不合理指標產生的數據陷阱比比皆是。


正如書中推薦語所說,在一個動態的、各類機制交互關聯的、非線性發展的系統中,卻以靜態的、相互獨立的、線性的定量指標去理解世界,當然會出問題。


今天就為你帶來書中的觀點選讀。


《為什麼數據會說謊》

作 者:彼得·施萊弗斯

出版社:中信出版集團

出版年:2023年6月

以下內容摘自《為什麼數據會說謊》,中信出版集團授權長江商學院轉載,僅代表作者獨立觀點,不代表學院觀點。


01 人們衡量所做的一切


從生活到工作,從醫療到教育,從交通狀況到企業利潤,人們通過先觀察再行動,來理解我們的世界。於是,我們衡量所做的幾乎一切。


孩子在學校學習了嗎?對他們進行測試。


我們的工作效率高嗎?統計工作時間。


一家企業是否成功?對收入、利潤、增長等數據進行細分,直到你確定為止。


這些措施、評價和業績指標就是我們的衡量指標。它們不僅是我們用來量化了解生活的工具,也是量化了解世界的工具。


衡量指標有助於我們決定哪些事情值得重視且優先於其他事情,衡量指標塑造了我們對世界的理解。


我們花費大量時間和資源來選擇、搜集和分析構成這些衡量指標的數據。


與簡單的測量不同,衡量指標是一種進行賦值的測量。也就是說,衡量指標是帶有目標的測量。例如,考試得A比得D好,公司利潤增長是件好事。


衡量指標可以告訴我們,情況是在改善還是在惡化。當我們選擇衡量某個事物時,往往是在選擇追求它。


在資訊時代,我們被淹沒在數據之中。數字革命在世界上掀起了一股數據浪潮,只要接入網際網路,任何人都可以毫不費力地獲得各種信息。


我們不再受限於單調乏味的記錄,我們擁有的數據多到不知該如何處理。網際網路擴大了信息量,並從根本上提高了信息交換的便捷性。


政府、企業、組織和個人搜集、利用這些新信息來制定政策、開發更好的產品和營銷策略、提高生產力、解決社會問題,以及滿足個人利益。


數據的爆炸式增長導致我們對衡量指標的使用激增。有了更多的信息,我們就可以跟蹤更多的措施,實現更多的目標,進行更多的評估。


毫無疑問,在數據領域發生的革命給我們的世界帶來了無數益處。更多更好的信息意味著我們的醫療系統能拯救更多的生命,企業能提供更好的產品和服務,人們對自己的健康、財富和幸福能做出更好的選擇。


然而,數字革命創造了一種信息狂妄。聚光燈越集中在這個世界可測量的部分上,我們就越相信我們無法測量的部分不再存在。


有了新信息,我們就忘記了所有我們不知道或難以知道的事情。我們太過專注於那些在燈光下看到的事物,以至於忘記了成功的關鍵可能在黑暗中。


企業如果發現了有關其供應鏈、生產過程和市場運輸的大量新信息,就不應該忽視市場適銷性、創新、員工激勵,以及市場中未知和不可預測的變化等更難獲得的信息。


信息如此豐富也有不利的一面。就像螞蟻會被信息素引入歧途一樣,我們也會被我們認為對自己有幫助的衡量指標引入歧途。


我們不僅要對信息的真實性和完整性持批判態度,還必須理解數據的含義,為什麼它們很重要,以及它們如何影響我們的行為。


02 無處不在的數據陷阱


這裡我們引入「癌症發病率」這個典型的數據陷阱。


為什麼癌症發病率上升竟可能是件好事?你一定想不到。


2018年,60多萬個美國人死於癌症,這簡直駭人聽聞。


據估計,在那一年還有超過170萬人被診斷出患有癌症,預計每4個美國人中就有一人死於癌症。


但情況並非一直如此,1970年,死於癌症的人數只占美國死亡人數的16%,1958年這一數字是15%,1900年這一數字是4%。


癌症診斷率急劇上升的原因是什麼?是我們攝入體內的化學物質嗎?是我們的生活方式?又或許是手機、微波爐、電腦和收音機等的使用增多?


其實,這些都不是,頭號原因會讓你大吃一驚。


雖然在過去的幾十年裡,有多種原因導致癌症死亡率上升,但最大的原因是我們很少有人猜到的:心臟病。


心臟病導致癌症發病率上升的原因則更為奇特。這並不是因為得心臟病的人越來越多,而是因為得心臟病的人越來越少。


事實上,心臟病是美國人的頭號殺手。


2015年,心臟病導致的死亡人數多於癌症,有60多萬人。但在過去的幾十年裡,心臟病的發病率和死亡率都大幅下降。2001-2011年,心臟病死亡人數下降了近39%。


心臟病的減少是過去幾十年來公共衛生領域最偉大的成就之一。此外,結核病、腹瀉、腸炎、傷寒、白喉和麻疹等傳染病的死亡率也大幅下降。


不幸的是,每個人最終都會死。由於死於心臟病和各種傳染病的人越來越少,而且心臟病和各種傳染病是死亡的主要原因,因此,本應死於心臟病或傳染病的人現在活得更長了。他們中的許多人壽命長到最終患上了癌症。


簡言之,並不是死於癌症的人越來越多,而是死於其他疾病的人越來越少。


正如丹·加德納(Dan Gardner)所言,如果平均預期壽命上升到100歲,癌症發病率將會飆升。由於很少有其他原因導致死亡,幾乎每個人都會在某個時候患上癌症。


慶祝癌症發病率上升的奇葩案例引發了一個重要的問題:為什麼這一點如此反常?死亡率上升怎麼可能是積極的呢?


想像一下,有兩種疾病每年造成的死亡人數相當,你會把更多的精力放在消除哪一種疾病上?在沒有更多信息的情況下,我們很難做出決定。


現在再想像一下,死於第一種疾病的人的平均年齡是70歲,而死於第二種疾病的人的平均年齡是11歲。此時你會集中精力消滅哪一種疾病呢?答案顯而易見。


基於每百萬人死亡人數的直觀評估會告訴我們,這兩者之間沒有區別。我們都知道這是不對的。然而,我們對疾病和其他死因的了解,很大程度上來自每年死於此病的原始人數。


當在公共話語中討論公共健康時,人們往往把焦點放在「頭號死因」上,或前三名,或前十名,或其他什麼。


直到20世紀90年代,即使在公共衛生領域,大多數關於疾病的評估也集中在這些因素上:死亡率、發病率和流行率。但這些衡量方法是有誤導性的。它們忽略了這些死亡的性質及其對受害者的影響。


衡量指標往往無法區分品質差異很大的測量單位。當我們純粹以數量來衡量事物,而不考慮它們的不同品質時,我們就會讓自己陷入各種各樣的適得其反、效率低下或不理想的境地。


03 說謊的從來不是數據本身


通過這個癌症發病率的案例,我們可以深刻感知到,那些看似理性的數據,卻是會「說謊」的,在不知不覺中就欺騙了你。


衡量指標能為我們的決策提供洞察力、清晰度和有價值的信息。但是,它們也可以瞞天過海,混淆視聽。


為什麼人們總是測量錯誤的數據,而忽視重要的指標設定?


在許多系統中,關於什麼是有價值的、什麼是重要的,存在著許多不同的觀點。如果我們僅僅依靠個人觀點來判斷好壞,那麼我們將永遠無法解決這類問題。


衡量指標提供了一個客觀、冷靜且一致的標準,我們可以用這個標準比較和評估業績,衡量指標能夠讓我們擺脫關於「什麼是重要的,以及為什麼重要」這個問題混亂的、各執一詞的和情緒化的討論。


在一個理想的世界裡,我們選擇最好的衡量指標,並遵循它們建議的成功之路。然而,這些衡量指標卻可能讓我們誤入歧途。


當衡量指標的目的存在缺點時,就有可能會誤導、歪曲實際發生的事,並破壞衡量指標的初衷。


衡量指標可能導致我們採取適得其反的行動,將我們的注意力吸引到最終並不重要的事情上,由於選擇了錯誤的衡量指標,我們在無效的活動上花費了過多的時間和資源。


衡量指標可能扭曲我們對世界的看法。我們甚至可能成為衡量指標的奴隸,過於關注自己在測量中的得分,而忘記了自己真正要實現的目標。


可見,說謊的從來不是數據本身,而是被不科學的衡量指標支配的人。


04 衡量指標很容易被操縱


我們再舉一例——職場中的績效管理。


績效考核作為一種衡量指標,將工作中的產出量化為數據,以此來評估一個人的工作表現。


然而,你可能沒有意識到,錯誤的衡量指標往往會誤導和歪曲現實,並破壞衡量指標的初衷。


不合理指標會帶來一系列危害性後果,不僅挫傷員工的積極性,甚至會成為企業的致命傷。


比如,有的企業說得極為直白:

「我們只看結果,不問努力。」


一味追求那些易于衡量的數據作為考核項目,便會忽略一件極為重要的事——成功的關鍵可能隱藏在黑暗中。


戴維·帕門特(David Parmenter)是一位20多年來一直致力於開發和實施績效指標的專家,他發現衡量指標已經被嚴重濫用,於是寫了一篇文章質問:「我們應該放棄績效指標嗎?」


他看到,衡量指標會被玩弄於股掌之間,會鼓勵團隊執行與組織戰略方向相悖的任務,會占用員工和管理層寶貴的時間。而由諮詢顧問得出的衡量指標通常只會是一份厚得像磚頭的報告,除此之外,一無是處。


當我們純粹以數量來衡量事物,而不考慮它們的不同品質時,就會陷入各種各樣適得其反、效率低下或不理想的境地。


忽視衡量指標的品質會導致低質量但容易計算的衡量指標膨脹。


我們來看一個有趣的例子:


中國的古生物學家付錢給農民以購買恐龍骨骼化石碎片。古生物學家沒有考慮到的是,不同大小的化石碎片價值不同。一具完整的骨架比一小塊大腿骨更有價值。


但是,正是因為沒有考慮到這一點,無論骨頭碎片是大是小都要付錢,這就無意中激勵了農民最大限度地增加他們發現的碎片數量。


農民很快就發現了一種獲得更多骨骼化石的絕妙方法——把骨骼化石打碎成好幾塊!


衡量指標膨脹的現象隨處可見。


在人力資源部門,如果以招聘人數來衡量,而不考慮質量,那麼公司很快就會發現隊伍中充斥著素質低下的員工。


在IT領域,如果根據程式設計師編寫代碼的行數給予他們獎勵,他們就會寫出大量無用的代碼。


心外科醫生的例子中也出現了這種現象,衡量這些醫生的指標是他們的手術成功率,但這一指標沒有考慮到手術的難易程度不同。


因此,醫生們的回應是拒絕為病情複雜的病人做手術,因為這會影響他們得到的評價。他們沒有動機去做複雜的手術,因為複雜的手術更可能失敗,從而使醫生獲得較差的評價。


那些鼓勵員工完成質量各異的任務但考核時只統計數量的組織很快就會發現,員工將不願承擔複雜的、具有挑戰性的任務,而更願意承擔簡單的、容易完成的任務來「提高統計數據」。


這就是「撇奶油現象」。那些被評估的人通過只計算好的東西,即「奶油」,避免、忽略或不完全計算其他的東西,以此操縱測量。


如何防止「撇奶油」或因沒有區分不同品質而產生的誤解?


組織可能採用的一種策略是設定一個最低標準,任何項目在被「計算」之前都必須達到這個標準。但最低標準同樣也會導致不利的後果。


第一個不利後果是,一旦達到標準,人們會覺得沒有理由超過這個標準。


第二個不利後果常發生在項目沒有很好的機會達到標準的時候,在這種情況下,人們往往會不再努力改善現狀。因此,最低標準實際上反而會降低平均績效。


可見,衡量指標是很容易被操縱的。不合理的衡量指標會掩蓋其所衡量內容的真實價值,造成破壞性後果。


05 不要做數據的奴隸


對那些提倡評估方法的人來說,一種常見的論據是:「數字說明了一切」或「這不是我的決定,我只是在報告我們的測量結果」。然而,在現實世界中追求客觀性可能會產生可怕的後果。


堅持使用客觀衡量指標的第一個問題是,它忽視了一切本質上是主觀的東西。在所有領域中,人們都希望採用客觀的衡量指標,結果忽視了不容易客觀衡量的東西。


客觀性的另一個問題是客觀性本身的表象。測量就是測量,數字就是數字。個人的觀點、偏頗的判斷都被去除,只剩下客觀的數字。


但客觀性是一種假象。許多人沒有認識到的是,選擇測量什麼本身就是一種主觀選擇。即使選擇一個純粹「客觀」的衡量指標,比如一個員工每天工作多少小時,或者寫多少行代碼,選擇衡量指標本身也是主觀行為。


主觀性是不可避免的。我們對任何評估方法的選擇(或不選擇測量某樣東西),最終都是對我們所重視的東西的選擇。


雖然測量方法本身看起來是客觀的,即數據是定量的、統計學上是合理的、是以中立的方式搜集的,但衡量指標的選擇是主觀的。


例如,決定用工作小時數來衡量員工的生產力是一種認為「工作小時數很重要」的主觀決定。


我們不能簡單地測量某樣東西,然後聲稱它是客觀的,並通過指出測量的「客觀性」來駁斥任何相反的意見。


選擇任何測量方法都是一個主觀的決定。我們必須認真思考我們所選擇的衡量指標,並為我們使用這些指標的原因進行辯白。只說「但數據就是這麼說的」是不夠的。然而,這種情況經常發生。我們必須證明為什麼我們一開始就選擇使用這些數字。


我們不僅相信那些可以測量的東西才是真實的,而且不再相信那些無法測量的東西是重要的,甚至認為它們不存在。我們越傾向於通過衡量指標來量化和管理,我們就越遠離那些不容易測量的品質。


這種情況在職場中很常見,尤其是在大型組織中,組織很難直接觀察到員工的貢獻。由於很難直接觀察和衡量員工的動機、合作能力、創造力、對客戶的關注度和敬業精神,組織往往依靠硬性數字指標來評估員工——他們工作的小時數、他們的生產力、他們完成的流程數量。


但這些衡量指標可能會適得其反。由於忽視了員工的軟貢獻,削弱他們的其他貢獻,從而損害組織的利益。


正如丹·艾瑞里所說:「你測量什麼,你就得到什麼。「


當組織只專注於它們可以直接計算的東西時,它們最終會失去那些為了更遠大的目標而留在組織中的人。


文中圖片來自圖蟲創意,轉載需獲授權。

關鍵字: