川普沒連任,為啥大數據預測不準了?

東方財經雜誌 發佈 2021-08-12T02:20:20.048271+00:00

文:石岩美國總統競選前,一些國外的大數據預測公司預測川普將連任,但是最終拜登當選了,現實打了臉。有些人疑問,大數據預測難道和算命術一樣不准嗎?什麼是大數據預測?一般解釋,大數據是指海量的數據集。

文:石岩

美國總統競選前,一些國外的大數據預測公司預測川普將連任,但是最終拜登當選了,現實打了臉。有些人疑問,大數據預測難道和算命術一樣不准嗎?


什麼是大數據預測?

一般解釋,大數據是指海量的數據集。如今,萬物互聯,尤其是移動網際網路的普及,工作和生活都已經離不開信息設備,使用過程中無疑會產生大量的數據,大數據時代早就來臨。

我國網民數量全球第一,各種上網活動都會產生數據,這其中包括網購,每天千萬次以上級別的交易量。網頁搜索,同樣產生巨量的數據。即使我們不使用網絡,城市裡各種各樣持續運行的監控以及傳感器,銀行、醫院、地鐵等單位處理業務的應用系統,都在產生大數據。大數據無處不在。

大數據預測則是大數據的核心應用,埃里克•西格爾在關於大數據預測的書中曾指出,大數據預測是通過學習和分析數據,來預測未來的一種科學技術,可以幫助執行人更好地決策。


大數據預測失效

這次美國大選,川普和拜登分屬的共和黨、民主黨都有自己固定的票倉,在這些州大數據預測也比較准。但是,往往決定總統競選結果的是那些搖擺州,搖擺州的民意調查也經常不精準,如何建立有效的預測模型,成了預測結果是否準確的關鍵。

一家預測川普連任的大數據公司,他們建立的模型是,分析網民搜索川普和拜登醜聞的比例。數據顯示搜索拜登醜聞的網民遠多於川普,通過醜聞搜索來預測競選結果,前幾次大選都顯示了這種模型的準確性。


但是,此次川普團隊對美國疫情的控制不力成為他最大的醜聞,網民查看新冠疫情,或者通過其他途徑知曉新冠疫情,其實也是在查看川普的醜聞。如果該公司考慮到新冠疫情的搜索情況,重新建立模型,大數據預測就將變為拜登勝選。

所以,不是大數據預測不準,是設計大數據模型的人沒有充分考慮到新冠疫情,也沒有把它納入預測模型中。另外數據源不準確,也會影響預測結果。例如有些人在做民意調查時,隱藏自己真正內心想法,這些都會變成錯誤的數據源。

國內一家大數據預測機構宣布,他們充分考慮了各種因素,建立了正確的預測模型,預測結果拜登勝選,說明大數據預測還是可信的。大數據預測模型的建立非常難,結果沒出來前,我們都沒法知道誰的模型正確,所以大數據預測有優點也有不足,企業決策需要全面均衡考慮。


應用領域多

數據每時每刻都在產生和被記錄,大數據預測也正在成為各個領域的關鍵技術,在我們社會中發揮重要作用。



1.天氣預報

大數據預測應用的典型案例是天氣預報,在信息技術日趨發達的今天,在雲計算和人工智慧的幫助下,用先進的大數據技術處理和融合數據,氣象預測會越來越準確。

氣象數據,主要來源於氣象衛星、氣象雷達、氣象站,以及各個專業機構的數據。天氣預報即在海量的「大數據」基礎下進行預測。

中國氣象局高級工程師唐千紅指出,不久的將來,地理信息和社會大數據均會為氣象服務,我們可以精準了解任何時間和空間的氣象信息。

2.軍事預測

「知己知彼,百戰不殆」。在軍事領域,大數據結合雲計算和人工智慧技術發揮著重要作用,可以提高軍事預測準確度,為戰略和戰術提供科學依據。

現代武器的信息化程度越來越高,智能化裝備也在增加,這些軍事裝備可以源源不斷採集各種戰場數據。例如,軍事衛星和雷達等系統會監測到各種數據;各種用電設備會產生電磁輻射,這也是戰場數據的一種來源,將各種數據匯集,利用大數據技術,可以對敵我雙方情況掌握更清楚,對戰爭狀況進行有效預測,並制定更加有效的作戰計劃。

「兵馬未動,糧草先行」,後勤補給在戰爭中非常重要,基於大數據的預測模型,可以採集作戰對象和作戰環境等數據,然後更科學預測出彈藥補給、傷亡情況等,以便最大程度地提供後勤保障。

3.交通預測

在城市修路,大數據可以分析出最佳路線,建設單位也可以利用大數據預測,得出未來的車流量,就知道該建幾條車道等,交通管理部門也可通過大數據預測,掌握各個時間段和區域的車流量,實施智能化的車輛調度。

我們經常使用的導航軟體,後台也開啟了大數據系統,可預測出最佳路線,隨著技術的完善,預測的路線已經越來越精準。

4.疫情預測

2009年,一家網際網路科技巨頭利用美國人在網際網路的搜索數據,與歷史上流感傳播期的數據進行對比,並用預測模型進行分析,成功預測了2009年的美國流感,並把位置精細到州和地區,比官方數據更精準,時間更早。

此次新冠疫情,也有大數據預測公司根據某些國家的行政政策、人文環境、衛生習慣、醫療條件和隔離措施等數據,預測出哪些國家疫情會比較嚴重些。

5.其他應用

賽果預測,有些網際網路公司利用大數據平台,預測體育賽事,也有些和博彩相關的公司,正在用大數據預測彩票的結果。

金融市場預測,有些金融公司希望借大數據預測知曉金融市場走向,有個別公司獲得了一定成功。

物價指數預測,大數據預測可以更加精準預測物價趨勢,能提前發現通貨膨脹或經濟危機的蛛絲馬跡。

用戶需求預測,通過收集消費者的上網行為數據,大數據可以分析和洞察消費者的需求,相關的公司可以利用這些分析數據,推出和優化商品。

自然災害預測,在物聯網時代,傳感器、攝像頭和無線通訊遍布全球,利用各種監測設備採集的大數據,可以更加有效地預測將要發生的洪澇、高溫等自然災害,有利於我們提前做好預防措施。

除了上面列舉的多個領域之外,在環境變化預測、污染排放預測、未來健康預測、行業發展預測、風險評估等領域,大數據預測正在發揮著重要作用,雖然大數據預測也未必百分百準確,但是這是預測領域最好的方法。


處理好隱私,發展更廣

中研普華研究報告指出,44.1%的受訪企業表示,隱私保護成為制約大數據發展的第一障礙,既要保護好隱私,又要利用這些數據做預測,是大數據預測公司必須面對並解決好的難題。

中國科學院院士王小雲教授指出,在資訊時代,大數據面臨嚴峻的安全問題,個人隱私如何更好的保護面臨挑戰。舉例說,我們在超市和網上都會留下購物信息,在手機里存儲個人秘密,在醫院裡有就診記錄。智慧城市系統有很多傳感器記錄,我們的指紋、臉部識別照片經常被其他機構獲取。而這些信息如果被泄露,可能會為黑色產業鏈提供財富。

大數據預測公司使用這些數據時,需要格外小心,既要做到不侵犯他人隱私,也要有足夠的措施保護好數據。

王小雲教授強調,保護個人隱私,法律保障是基礎。在我國,已有了三部法律,分別是電子簽名法、網絡安全法和電子商務法,另外,個人信息保護法有望出台,通過這些法律可為大數據保駕護航。

大數據預測公司,應在符合法律的基礎上,開展更多的預測應用。在未來,大數據預測的市場會越來越大。

關鍵字: