數(shù)據(jù)分析的流程:
1、目標(biāo)確定
2、數(shù)據(jù)獲取
3、數(shù)據(jù)清洗
4、數(shù)據(jù)整理
5、描述分析
6、洞察結(jié)論
7、撰寫報(bào)告
目標(biāo)確定
我們需要探究數(shù)據(jù)分析的目的是什么?是為了解決什么問題?達(dá)到什么目標(biāo)?
一般分析目的分為兩種:
1、針對(duì)現(xiàn)有情況 - 描述性分析
2、基于現(xiàn)狀,預(yù)測(cè)未來情況 - 預(yù)測(cè)性分析
例如:
對(duì)于一只股票,分析它的走勢(shì),漲跌。這是描述性分析
針對(duì)這些漲跌,回測(cè)應(yīng)該在什么時(shí)間點(diǎn)買入什么時(shí)間點(diǎn)賣出。這是預(yù)測(cè)性分析
數(shù)據(jù)獲取
針對(duì)目標(biāo),就要想要獲取哪些數(shù)據(jù),數(shù)據(jù)獲取分為兩個(gè)部分
1、字段設(shè)計(jì)
2、數(shù)據(jù)提取
例如:
需要分析某銷售團(tuán)隊(duì)的銷售數(shù)據(jù),基礎(chǔ)指標(biāo)有平均銷售額,銷售總額,增減幅度等,但是這些指標(biāo)在數(shù)據(jù)庫中都沒有,那么就需要從數(shù)據(jù)庫中提取現(xiàn)有的字段加以處理得到上面的基礎(chǔ)指標(biāo) - 這是字段設(shè)計(jì)
從銷售軟件中導(dǎo)入導(dǎo)出數(shù)據(jù),用 SQL 從數(shù)據(jù)庫中導(dǎo)入導(dǎo)出 - 這是數(shù)據(jù)提取
數(shù)據(jù)清洗
從數(shù)據(jù)獲取的步驟過來后我們就獲取到需要的數(shù)據(jù)了,但是這樣的數(shù)據(jù)我們還沒辦法直接使用,需要做進(jìn)一步的處理,這就是數(shù)據(jù)清洗
數(shù)據(jù)清洗主要是針對(duì)空白值、無效值、重復(fù)值等異常值。
針對(duì)異常值的判斷識(shí)別和處理在之前的數(shù)據(jù)指標(biāo)的文章中已經(jīng)講過了,沒有看過的可以往回看看
數(shù)據(jù)整理
做過清洗過的數(shù)據(jù)還是沒有辦法直接使用的,這里需要進(jìn)行數(shù)據(jù)整理這一步驟,這一步驟主要是針對(duì)數(shù)據(jù)的格式化。
例如:
日期的處理,將數(shù)據(jù)中的日期處理為統(tǒng)一格式
行列的格式化
基礎(chǔ)的計(jì)算,如平均值、總額、眾數(shù)等的歌
描述分析
做完上面的數(shù)據(jù)操作之后就可以開始描述分析了
描述分析分為兩個(gè)部分
1、數(shù)據(jù)描述:描述數(shù)據(jù)的基本情況,比如數(shù)據(jù)的總數(shù)、時(shí)間跨度、數(shù)據(jù)來源等
2、指標(biāo)統(tǒng)計(jì):結(jié)合實(shí)際業(yè)務(wù)分析實(shí)際情況的數(shù)據(jù)指標(biāo),比如要分析網(wǎng)站流量,網(wǎng)站的 PV 、IP 、留存、跳轉(zhuǎn)率、轉(zhuǎn)化率等等
針對(duì)指標(biāo)統(tǒng)計(jì)有四類的主要描述場(chǎng)景
1)變化:隨著時(shí)間的變動(dòng)的增減變化
2)分布:不同層次上的表現(xiàn),例如地域分布、男女分布、人群分布
3)對(duì)比:數(shù)據(jù)項(xiàng)之間的比較
4)預(yù)測(cè):根據(jù)現(xiàn)有的增減幅度,預(yù)測(cè)未來的變化
洞察結(jié)論
這個(gè)部分是結(jié)合你自己數(shù)據(jù)分析的功底,結(jié)合你對(duì)于手上所負(fù)責(zé)的業(yè)務(wù)的了解程度,這部分是數(shù)據(jù)報(bào)告的核心,也同樣體現(xiàn)了你的數(shù)據(jù)分析能力
撰寫報(bào)告
經(jīng)過一通分析,你需要將你得出來的內(nèi)容匯總成數(shù)據(jù)分析報(bào)告
數(shù)據(jù)報(bào)告主要包含下面的內(nèi)容
1、報(bào)告背景:主要描述你要解決的業(yè)務(wù)現(xiàn)狀
2、報(bào)告目的:主要描述你要解決什么問題
3、數(shù)據(jù)基本情況:主要體現(xiàn)數(shù)據(jù)的可信度,你的數(shù)據(jù)來源是否可靠,數(shù)據(jù)維度、數(shù)據(jù)完整性等等
4、可視化圖表:數(shù)據(jù)的可理解程度,增強(qiáng)看報(bào)表的人的理解
5、策略選擇:提出解決方案,闡述你的結(jié)論,提供解決策略等
以上就是數(shù)據(jù)分析的全流程了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.