第14屆CIO價值學院第三堂課 會後報導
東吳大學巨量資料管理學院副教授胡筱薇說到,從 Google Trends 觀察這幾年熱門辭彙的起落態勢,就不難理解AI為何走紅。從2004年開始,Big Data 逐漸受到關注,甚至從2011年開始就維持不低的搜尋量。緊接著下一波由物聯網(IoT)接棒成為寵兒,而她在校園的感受也相當深刻,只因當時許多出版商積極致贈IoT有關書籍、Arduino Starter Kit 給老師,期望在學校開設相關課程。
隨著 Big Data 技術崛起,也出現越來越多的IoT應用場景,使得機器學習的聲量日益提高,此乃因為資料量夠、場景也有了,大家就希望能夠運用一些更智慧的方式,解決他們可能遭遇到的問題,連帶使得機器學習成為熱門技術。
「我們就很好奇,Machine Learning 走紅後,下一個焦點是否為AI?」胡筱薇說,事實上多年AI來一直都受到高度關注,早期就曾經出現過一波熱潮,惟礙於時空背景的限制,未能持續發酵。沈寂了一陣子,直至最近5年再次翻紅,且受到大眾關注的程度持續走高。
藉由上述的趨勢脈絡,你會發現,這些技術、知識、應用真的就是一波一波接著來,仍然在持續的發展和演化,導致我們無法再沿用過去的學習方式,好像把幾本Bible讀完就安心了;因為我們正處於一個充滿不確定性的年代,未來還會出現什麼大的變化,真的無從預料。如何降低這個不確定性?別無他法,需要獲得更多的資訊,此時資料科學就顯得格外重要。
[ 推薦閱讀: 製造業Jabil提升員工技能培育資料科學家 ]
所謂資料科學,能夠幫助我們在各種不確定的場景下,試著用一種比較有系統的方法,找到具有決策價值的資訊,讓個人、公司甚或整個產業做出正確決定。而資料科學有它的程序在,包含資料怎麼取得、處理、儲存、分析、建模、洞察,以及最後的自動化程序跟反饋機制等等,最終會產生AI產品,可以最佳化用戶體驗。
企業想要做好資料科學與人工智慧,關鍵的第一步,須設法與用戶建立持續互動的關係,因而需要打造好的介面、創造反饋閉環,累積更豐富的 Big Data,然後發展各種演算法與建立模型,藉此最佳化決策,做出好的產品,與用戶產生更緊密的連結。
不可諱言,當企業成功建立反饋閉環,勢必有越來越多資料湧進,複雜度也越來越高,可能使得處理成本越來越高,此時如何有效產生資料價值、持續落實資料驅動?胡筱薇認為,此時就考驗企業的資料治理功力,即是統一的資料管理規則來確保資料品質,確保企業資料處理流程裡頭的每個環節,皆有一致標準。
良好的治理體系 才能讓資料真正產生價值
「資料治理不是IT問題,而是業務問題,」胡筱薇說,IT的技術能力再如何高超,都無法定義業務,所以只有實際在第一線工作的業務人員,才能訂定資料標準。因此企業欲做好資料治理,切記每一類資料都要有對應的業務部門來承擔管理責任,而各個業務部門需要產生資料Owner,負責管理資料的品質,確保其資料能被識別、分類和定義。
更重要的,企業需要有建立一個管理框架、一致的管理標準,確保只要在公司範圍內,任何一筆資料的定義都是唯一的。以華為這家公司為例,其做法就是在每個部門設立一個資料管理單位,旨在協助每個部門的業務主管,能夠根據業務的角度,妥善地規範及定義資料;而在各業務部門的資料管理單位之上,另外設置更高位階的主責單位,負責管理眾多資料管理單位。
[ 下載 2020-21 CIO大調查報告,掌握資料治理趨勢 ]
由此看來,資料治理是一個體系,不是一個專案,因為想要打通全公司的資料,肯定會橫跨各個單位,所以必須有企業級的資料綜合治理體系,才足以確保關鍵資料資產有較為清晰的管理責任,從而讓IT有穩定的原則與依據進行建設,而作業人員也才有明確的流程指引,確保資料輸入是有品質的,有助於降低日後 Data Cleaning 成本。
胡筱薇指出,因此要想衡量一間企業資料治理水準的高或低,第一個關鍵的觀察點,即是該企業有無設立公司級的資料治理政策;其次觀察在這個政策之下,有沒有完整的組織體系加以保障;第三個須觀察相關流程運行的品質如何,檢視同是否知道歸知道、做的是另一套,抑或真的切實執行。
[ 加入 CIO Taiwan 官方 LINE 與 FB ,與全球CIO同步獲取精華見解 ]
當企業有資料治理的Owner、體系,可是面對廣大資料時,究竟該怎麼做才算正確?胡筱薇坦言這個是一個大題目,不易出現明確答案,但至少,企業可留意什麼事情千萬不能做,主要包含「資料不分類」、「專注在苦工」與「搶快搶績效」等三大陷阱。
有關資料不分類,意指企業不太可能只靠單一流程來管控所有資料,因為諸如內部資料、社群媒體資料、廣告或競業資料等不同來源的數據、對於資料處理的精確度要求不同,治理的成本及方法也不同,需要將它們分類,採用不同的管理架構。
至於專注在苦工,指的是從頭到尾開始慢慢做,不太考慮效益,也是不健康的;應該先盤點企業的痛點何在,哪裡的痛點最大、就先進行哪裡,讓其他同仁看到資料治理的效益,才容易形成良性循環。
談到搶快搶績效,意指企業若還沒有成熟的制度,尤其是業務的流程定義尚未清晰的時候,絕對不要為了求快,而冒然採取什麼行動;不妨將腳步放緩一點,想清楚了再行動,效果會更好。(文/明雲青)
( 本文授權非營利轉載,請註明出處:CIO Taiwan )