還在傻傻用excel呢?教你三秒完成海量數據去重工作!

九數雲 發佈 2024-01-11T06:22:54.063471+00:00

數據清洗作為數據分析全過程的必要步驟,會占據分析過程的50%—80%的時間,其結果質量會直接影響模型效果和最終結論,而刪除重複數據往往是數據清洗的第一步。

數據清洗作為數據分析全過程的必要步驟,會占據分析過程的50%—80%的時間,其結果質量會直接影響模型效果和最終結論,而刪除重複數據往往是數據清洗的第一步

提到刪除重複數據,一般都會想到利用Excel來處理,常見的處理的方式大概有三種:公式、刪除重複項、高級篩選。然而,在使用Excel時很容易出現很多變數

刪除重複數據時「如何迅速匯總海量表格,將步驟化繁為簡」成為人心所向,九數雲功能之一就此應運而生。

下面小九就很多人在使用Excel刪除重複項時經常出現的問題,談談如何用九數雲輕鬆解決。

Excel刪除重複數據

很多用戶在使用Excel時會遇見一些問題:

1.匯總龐大的數據,只能一一複製粘貼眾多表格,還沒進行到刪除重複項的步驟,電腦早已嚴重卡頓

2.某些數據有多個不同的值,無法選擇第一項或者最後一項

3.設置刪除重複項的比較列時少選擇了幾列,導致誤刪數據。一步錯步步錯,發現篩選結果出錯後只能從頭再來

4.版本低的Excel有時候用刪除重複項和高級篩選功能達不到目的,只能利用公式:

  • 用COUNTIF函數得出結果時,再篩選提取次數為1的數據實在太麻煩。
  • 想用UNIQUE函數優雅地刪除數據,發現自己版本不支持
  • 零基礎小白想學習用普通數組函數提取,卻只能看著複雜公式緩緩打出一個問號

九數雲刪除重複數據

跳過由海量數據導致卡頓的「環節」,在九數雲依次上傳需要的表格後,就可以正式開始絲滑刪除重複數據了。

01刪除整行重複數據

1點擊示例表「重複數據>分析表」,選擇「確定」創建分析表。

2選擇全部欄位,然後點擊「+」。

在「更多」中添加「刪除重複數據」分析步驟,就可實現效果。

3刪除完重複數據後會自動進入預覽界面,可以看到數據從40條變成了27條。

02部分欄位去重計數

在使用Excel批量刪除重複項功能的時候,往往只會保留第一條不重複數據。但倘若我們需要的是最後一條不重複數據,就南轅北轍了。

舉個例子,公司名稱存在重複記錄,需求是保留有公司全稱的數據,這時用Excel篩選就不太方便了,因為不能自由選擇項

九數雲可以去重保留第一項或最後一項。

在正常刪除重複數據後,將需要的欄位從「分類」拖拽到「匯總」,再選擇你要的項,就可達到部分去重計數的結果。

03更新源數據自動完成數據清洗

後續不想進行重複的步驟,可以點擊「更新Excel」,上傳新的表格後九數雲將會自動復用上次的操作

總結

在刪除重複數據時,九數雲可以絲滑地分析百萬數據,簡化Excel的去重步驟,解決了使用Excel清洗數據會出現的問題。

相較於Excel的一次性分析模式,九數雲能解放用戶的雙手,提供一種一勞永逸、事半功倍的數據分析模式:當用戶的表格更新,只需要上傳更新後的數據,然後等待九數雲自動清洗數據即可。

關鍵字: