文/旗標科技
人工智慧(Artificial Intelligence)、機器學習(Machine Learning)各種驚人應用紛紛出現,同時新冠肺炎(COVID-19)疫情大流行的影響之下,促使企業開始思考數位轉型(Digital Transformation)急迫性以及必要性。然而,當大數據(Big Data)的技術充斥於生活之中,企業家更是需要抓住資料科學(Data Science)的本質:為什麼要做資料分析、該如何進行資料分析、哪些事能用資料分析。
為什麼要做資料分析
假設發生「業務部門營業額降低」,此時經常會有人認為「想必是沒有開發新客戶來增加訂單」。真的是這樣嗎?此外,如果真的是因為沒開發新客戶而導致營業額降低,那是降低多少?像這種不進行任何分析、探究,就對「營業額減少」進行決策,即為「未經資料分析的決策」。沒有經過資料分析就毫無根據地要求員工執行某個任務,不僅無法提升團隊士氣,最後也很難達成目標。
其實「業務部門營業額降低」是最終呈現的結果,面對這樣的問題,我們應該要先思考「為什麼會發生這件事情」、「可能的原因是什麼」,也就是要對這個結果假設其發生的原因。當這個假設的內容越明確,就越有機會使用資料分析來驗證假設是否成立。最後,根據分析結果採取對應的策略。像這樣有根據的執行方針,才能解決公司營運上的問題,並且帶來更多獲利,即為使用資料分析的目標。
該如何進行資料分析
資料分析的步驟,其實就是不斷重複以下三個步驟。
- 步驟一:設定分析結果需要有的資訊。
- 步驟二:蒐集資料、分析資料。
- 步驟三:繪製圖表、發表結論。
看似簡單的三個步驟,其實內含很多資料分析的觀念,本文點出以下幾個重要的思維。
● 資料分析不見得一次就會成功
依循著分析結果,我們可以修改假設、重新定義想釐清的問題,並透過再次分析一步步探究到問題的核心,這樣的過程正是資料分析的精髓所在。
● 設定好目標再進行分析
資料分析時容易陷入「直接分析看看有什麼結果再說」。然而,如果分析之前沒有設定明確的終點,有可能無論想要分析多久、多遠,都有辦法一直做下去。很可惜通常時間是有限,為了要在一定時間內得到想要的分析成果,就必須要先設定最終想要解決的問題,才開始設計資料分析流程。
● 視覺化資訊有助於理解分析結果
資料分析技術通常都有繁複的程式、數學,因此分析得到的結果,要如何讓其他部門的同仁理解,則需要有視覺化的方式,讓分析成果可以用比較平易近人的方式呈現出來。
哪些事能用資料分析
舉凡公司的產品策略、內部的作業流程等等需要做決定的時候,都是可以考慮使用資料分析,來佐證政策的正確性。舉例來說,想要了解員工對公司的滿意程度時,我們可以先設計問卷請員工回答。接著使用假設檢定(Hypothesis Testing)的方法,來得知不同部門或是不同性別之間,對於公司的滿意度是否相同。最後,我們就可以根據統計顯著(Statistical Significance)的部分(圖2的範例顯示不同部門對於公司滿意度有統計顯著),進行更深一層的調查。
相較於毫無根據就直接安排如員工聚餐、公司旅遊,透過上述的資料分析,能夠更清楚了解員工的需求到底是什麼。其實要進行資料分析並不會很困難,常見的 Excel 其實就已經具備各種資料分析的功能。像是迴歸分析(Regression Analysis)、數學最佳化(Mathematical Optimization)等技術,都已經有對應的Excel增益集可以使用。而上述的假設檢定,在Excel當中也只需要六個步驟即可完成。打通資料分析的觀念、善用手邊Excel工具,你也可以進行資料分析,為公司帶來更亮麗的業績。