每個初學者都應該知道的10個數據分析術語

聞數起舞 發佈 2020-05-09T06:09:05+00:00

如果您剛開始使用數據分析並且不熟悉某些基本術語,請不用擔心。在Cangler,我們為您提供了十個基本數據分析術語,這些是本領域每個人都應該知道的。


如果您剛開始使用數據分析並且不熟悉某些基本術語,請不用擔心。 在Cangler,我們為您提供了十個基本數據分析術語,這些是本領域每個人都應該知道的。 從不同類型的數據分析到數據分析和機器學習之間的交叉,本文將作為必要的介紹,介紹當今該領域使用的一些簡單但基本的概念和過程。

本文將介紹以下數據分析術語:

· 數據分析

· 描述性分析

· 診斷分析

· 預測分析

· 規範分析

· 數據挖掘

· 雲/基於雲

· 機器學習

· 數據集

· 大數據/大數據分析

什麼是數據分析?

數據分析只是收集,表示和評估數據以幫助做出決策。 這項分析的複雜程度可能不盡相同,從分析天氣模式到評估Twitter帖子以預測股市波動。

數據分析根據分析任務的最終目標分為不同類型或過程。

什麼是描述性分析?

簡而言之,描述性分析是以一種清晰易懂的方式為目標受眾提供數據的方式。 通過描述性分析,您的數據通常可以以圖形,圖表和其他信息圖表的形式轉換為視覺效果。

數據分析的其他部門處理如何分析數據並從中得出結論的同時,描述性分析的目標只是簡單地以最有效的方式顯示數據。

在處理歷史業務數據(例如銷售數量隨時間的上升和下降)時,這尤其重要。

描述性分析的職責還在於在上下文中準確顯示數據。 如果與去年相比,僅顯示您公司今年銷售額的增長,可能還不夠。

什麼是診斷分析?

描述性分析力圖簡單地呈現數據,而診斷性分析力圖深入研究您的數據,以找到發生某事的答案。 例如,為什麼您的銷售數字在四月份猛增? 為什麼今年4月的銷售量比去年低?

診斷分析可以洞悉數據點為何保持靜態或向某個方向移動。 使用診斷分析時,有時您必須查看數據本身,並從內部和外部使用其他數據源來提出可能的相關性。

什麼是預測分析?

顧名思義,預測分析專注於使用統計數據來查找模式並預測數據的移動。 在實踐中,預測分析可用於嘗試在問題發生之前進行預測或預測諸如銷售增長和其他業務指標之類的事物。

從簡化維護計劃到分析營銷活動,預測分析可以使各個行業受益。

您可能熟悉的預測分析的一個很好的例子是Netflix和其他流媒體網站上的推薦系統。

通過使用諸如觀看歷史記錄,搜索歷史記錄和收視率之類的數據,Netflix的系統使用一種算法來預測您喜歡其目錄中的哪些節目和電影。 亞馬遜使用類似的系統來推薦商品,谷歌使用類似的系統來選擇向您展示的廣告。

什麼是規範分析?

說明性分析將預測性分析向前推進了一步,它試圖利用數據提供的可行見解。

預測分析為您提供原始數據預測,而規定性分析則根據數據為您提供各種行動計劃。

與每個計劃相關的預計結果和風險也將包括在內,以便可以對它們進行比較和採取行動。

什麼是數據挖掘?

顧名思義,數據挖掘是從各種形式的非結構化數據中提取有用信息的過程。 這些數據可以是文本,圖像,音頻等形式。

非結構化數據的主要區別是尚未對其進行處理,標記或格式化以用於數據分析或機器學習算法。

數據挖掘的一個現代示例是對社交媒體帖子的情感分析,以確定品牌知名度。 這是通過抓取諸如Twitter之類的社交媒體平台並收集大量帖子來完成的。 然後檢查這些帖子,以了解您公司或品牌的公眾意見。

雲或基於雲的含義是什麼?

並非機器學習專有的術語,"雲"是指在線存在的數字空間。

因此,當您聽到諸如基於雲的數據存儲之類的術語時,它指的是您的數據託管在遠程伺服器上而不存儲在本地的存儲系統。

這意味著數據不會直接保存在計算機的硬碟驅動器中,而是保存在您通過Internet訪問的伺服器上。

什麼是機器學習(ML)?

機器學習是一個研究領域,它使用算法來處理和學習類似於人類的數據。

藉助機器學習,我們擁有了無與倫比的技術,例如無人駕駛汽車和語音助手。 隨著機器學習行業的發展,越來越多的人正在使用基於ML的算法進行數據分析。

什麼是數據集?

數據集只是一組數據,通常組織成行和列。 在訓練機器學習或數據分析算法時,數據集分為訓練和測試部分。

訓練數據集用於開發模型,測試數據集用於評估模型的準確性。

什麼是大數據或大數據分析?

從網際網路流量到用戶行為,無數大小型公司都可以訪問令人難以置信的大型,通常是非結構化的數據集。 大數據是指用於處理大型數據集的數據分析方法,這些數據集通常包含數十萬(甚至數百萬)行數據。

這些只是您今天在數據分析中會聽到的一些最常見的術語。 希望這些術語將幫助您理解整個過程中有關數據分析的更複雜的文章。 有關更多數據分析指南和資源,請查看以下文章:

最初發布在https://blog.getcangler.com。

(本文翻譯自Limarc Ambalina的文章《10 Data Analytics Terms Every Beginner Should Know》,參考:https://medium.com/datadriveninvestor/10-data-analytics-terms-every-beginner-should-know-73e590ecb1b9)

關鍵字: