管理顧問如何做商業數據分析,策略數據思維與分析方法

Photo by Christina @ wocintechchat.com on Unsplash

文/戴士翔 | Dennis Dai

一直以來都有非常多朋友問我該怎麼做數據分析,MBB等策略顧問,或者如beBit 重視大量消費者量化研究等公司裡面又是怎麼做數據分析的,所以這篇要來談談管理顧問公司經常用的幾個數據分析方法。結合我的個人經驗,以及以一個資料人的觀點怎麼看待數據分析在商業分析中的用途,並不一定代表特定顧問公司,畢竟不同人都有自己習慣的方法。另外雖然說是管顧,但也同樣適用於商業分析、商業人士使用數據的方法。

通常在管理顧問公司的量化分析訓練中,會教導各種資料視覺化的圖表,分析並不是我們的目的,更多時候圖表是作為每頁簡報的Action title (標題、故事線的一部分)的支撐證據,因此主要用途就是可以讓人快速吸收資訊,那麼清楚的圖就更顯重要,畢竟字不如表、表不如圖,這也是為何漸漸越來越多公司成立商業智慧部門取代傳統業務人員提供報表的工作。這篇文章的重點並不是視覺化,而是分析的思維。今天我們先不講策略分析時也經常做的產業分析,而是針對客戶的營運數據分析上(怎麼透過數據驅動的方法辨認、改善營運問題),更著重問題解決本身,主要概念有三:

  1. 重點不是數字與圖表,而是邏輯框架(Framework)
  2. 關聯指標 (Metric)
  3. 對標(Benchmark)

重點不是數字與圖表,而是邏輯框架

圖表也只是輔助工具,但不是分析

首先,有一個很大的迷思是管顧的數據分析是數字分析(Numeric analysis),這裡指的數字分析是針對數字大量加減乘除、得到一個估計或者預測式子。其實並不是的,重點不是這些運算或者做大量視覺化來「試著發現一些什麼」,我們會先建立一個假說,並且圍繞這個問題本身去思考什麼數據可以支撐這件事情,如果為真有哪些Asumption 需要處理與聲明,以及失敗的可能性大不大,如果為否的話也不意味這個答案的反面就是正確的,跟統計檢定的概念相同,我們還是需要去確認另外一個答案的可信度。

畢竟一個決策問題的答案正確與否,更多是資訊輔助的信心程度,並不是說數據大就能夠代表這件事情更正確,而是支持我們比較不容易犯錯。

因此在這裡面,我們的重點就是「思維框架」,通常在分析一個問題時我們會先打開一張Excel 表,我自己是用Evernote 的bullet point來分解問題。舉例來說,我們想知道第三方物流公司目前的主要成長因子是什麼?這可以分為驅動收入成長 x 驅動利潤提升,而驅動收入成長又可以拆分成客戶數量成長與客單價提升,這時候的我們是不會碰到任何「數字與Google查詢的」,我們要先想清楚這些不同分支的佐證數據是什麼,把問題想清楚一些。比方剛剛提到的利潤率,利潤率的定義是什麼呢?客戶數量增長,客戶是否可以依照不同重量包裹或者B2C/C2C等不同類別來更細化?

在這裡你可以注意到即使第一層的拆解很直覺(驅動收入成長 x 驅動利潤提升),但是接下來的拆解是需要一些產業、商業知識的,也因此就需要暫停一下去了解相關知識,或者跟別人討論該怎麼分解這一塊 ,可能是花一下午的時間在研讀產業報告與掌握知識體系,也可能是安排一個小會議理清相關問題。

模組範例:分析思路搭建

當想清楚這些之後,我們會開始拉不同的模組,比如打開一張Excel 然後新增不同分頁,每個分頁都是一個分支,並且想一下哪裡可以得到這些數據,數據來源包含網路上搜索、PTA、資料庫、報告、專家訪談,不同數據的取得難度不一,所以如果很難取得的話就要考慮能不能用別種拆法。

靈活拆解框架,以台大是否設立分校為例

舉個例子,我們想要評估台灣大學要不要到德國設立分校,那就變成思考這件事情的效益是什麼?能否超過這件事情的代價?一個子問題是開設分校的收入來源估計就是學生學費,回答這個問題之前要先估計從學生得來的預期收入,如果我們從top-down的角度來拆解(學生收入 = 德國大學生人口數 x 該人口中會來讀台大學生比例 x 學費 ),就有幾個問題。

首先就是大學生中會來讀台大學生比例是很陌生的,即使做了市場調查也可能很不準,再來就是我們還沒決定學費,學費肯定會影響到就讀意願,那麼我們也許需要做更多測試。如果回到前面說的Assumption,這個模型的Assumption第一點就是「只有德國人會來讀德國分校」,但說不定會有其他國際學生,如果從人口來分析就會漏掉這些,另一個Assumption就是「想來讀的人我們就收,因為我們只考慮就讀轉化率」,但我們知道教育不同於商業,我們還會想要審核申請者的素質以及面試表現來確定入學,而「申請者的素質、面試表現」都是比較難量化的,這邊的數據就不好取得了。

思考其他可用數據的腦袋靈活性可能更重要

雖然這裡是一個學校設立的虛擬問題,但我們可以發現很多公司在考慮市場擴張的時候,總是用人口、地區收入等來分析,但不一定適用所有情況,你必須綜合考慮自己的商業模式來收集最適合的數據。

在管顧數據分析其實不是有額外的資料庫、聯絡得到專家就更精準,而是問問題的方式決定了這個答案的穩健程度。

也因此問出好的問題來拆解原先議題,並依循框架填入數字就是一個很重要的能力與思維。

所以我們在這邊小總結一下流程:

  1. 拆解問題 + 思考前提條件 + 降低數字不確定性 (比如台灣多少人的確定程度會比台灣人多少人每天吃雞排還要更可靠,前者是人口,後者經常需要依賴市調資料)
  2. 確認數據來源:列下可能的數據來源與數據取得成本、數據取得所需時間(寫一個爬蟲要多久?跟公司溝通整理CRM的數據要經過幾個工作天?)
  3. 填入數據
  4. 「分析」

通常管顧操作數據的工具是一份好幾個版本的 Excel (也被稱作model,金融界也常常會建立這樣的模型 ),裡面有許多數據,可能有從BI system、ERP抓下來的、上網爬取(比如我在顧問公司時曾經協助爬下某產業的五年內網上銷售數據以供分析)、財報、營運報表、問卷得到的數據等等…….. 放在不同的Tab,接著就可以依照前方的思路來組織與「分析」。可以發現這裡的分析,看圖表、報表數字通常都是「咻一下」就過去了XDD

Thinkcell 一款好用的PPT extension

這其實不難想像,比如我想要看什麼產品銷售表現最好呢?直接柱狀圖排個序就能得到了。我想要看會員成長主要是誰貢獻的,疊個會員類別就能一目瞭然。顧問都是Excel hightlight -> 篩選起來複製 -> 雙螢幕另一邊直接用PPT 來視覺化(搭配Thinkcell真的會很快),分析得非常迅速也很高效,因為真正困難的工作在前面思考完就結束了,我們不需要去在意數據的小波動與隨機性,而是關注趨勢與主要變化,因為真正清楚的訊息都會顯示在這些主要變化中,20/80的概念就是如此,即使不是所有數據都滿足20/80,基本上也不會相差太遠,所以總能找到一個關鍵點,這就是下一個分析的思考支點。

而這些圖表的解讀在下一步就會是重點工作的銜接,比如為什麼某個廠商的零件價格那麼高?那我們是否該考慮替換該零件的廠商?

就需要寫下分析數據的下一步工作與要問的問題,可能是列出訪談大綱,也可能是安排不同會議需要問跟討論的議題。需要跟不同產業專家討論這個現象的原因,再依靠顧問的邏輯把產業知識與現象串起來去思考對目標、問題解答的意義。

因為如果沒有領域知識擅自解釋就不是分析,而只是主觀的數字猜測而已

這是非常重要的觀念,很多人以為我只要拿出數據做完視覺化就完成了分析工作,但你的解讀是否正確、變化是否真的為這個原因就需要其他額外資訊來佐證與穩健的解釋,並不是說你拿出數據給主觀解釋就是「分析」或者「量化」,你要用其他數據與事實來佐證原先數據得出的論點才是好的分析。

至於站在資料人的觀點上,如果以資料科學的觀點來輔助決策也是非常有意思的,在資料科學的工具上可以使用相關性,並且用邏輯確認數據關係,即使我們知道相關不意味因果,但是商業邏輯可以幫助我們將相關性確立為因果。 當然,我們也可以選擇用因果推論的方法來做,而傳統商業分析師、顧問則會透過大量專家訪談來梳理出確實的證據與原因。

這是非常重要的觀念,很多人以為我只要拿出數據做完視覺化就完成了分析工作,但你的解讀是否正確、變化是否真的為這個原因就需要其他額外資訊來佐證與穩健的解釋,並不是說你拿出數據給主觀解釋就是「分析」或者「量化」,你要用其他數據與事實來佐證原先數據得出的論點才是好的分析。

至於站在資料人的觀點上,如果以資料科學的觀點來輔助決策也是非常有意思的,在資料科學的工具上可以使用相關性,並且用邏輯確認數據關係,即使我們知道相關不意味因果,但是商業邏輯可以幫助我們將相關性確立為因果。 當然,我們也可以選擇用因果推論的方法來做,而傳統商業分析師、顧問則會透過大量專家訪談來梳理出確實的證據與原因。

管顧公司現在也了解數據解釋的重要性,各家的資料科學家也會協助用數據來解決問題,Mckinsey 就開源了一個貝式網路的Python套件來協助因果推論,BCG 也有開源的GAMMA Facet Python套件來辨別數據間的關聯性以找到真正對目標重要的驅動因子。也因此我還蠻享受在用數據結合管顧的思考去分析問題,你會有充足的信心以及足夠靈活的頭腦/工具來解決這些看似很困難的問題,並且很有趣。

關聯指標

第二個數據分析的方法就是關聯,尤其是與商業指標(營收、獲益等)的關聯,因為我們認為分析是行動導向的,影響營收本身的方法百百種,但哪一種最有效率呢?依靠關聯就可以回答這個問題。

並不是套用理論就可以獲得數字上的正確結果,因為商業指標通常是大量情境式歸納而已

比如說我該提升的是新顧客的比例還是老顧客的回頭率? 商業雜誌中經常會說兩者都很重要,也有人會告訴你老顧客的維護成本比起新顧客低很多很多,所以應該主要維繫老客戶。這也是數據分析的迷思,很多人尤其是商學院理論派的,認為知識裡面只要有數字就是數據分析、有量化就會比較穩固,並不是這樣,我們不會固守怎麼做一定會成功、專家怎麼說就怎麼做,經驗在現在的時代或者特定產業的保質期都很短,你必須去分析不同情境,以及真正去衡量對我的組織來說:什麼樣的做法比較有效益?

數據就在那邊,真正去測量才能知道怎麼做比較好。

我想這也是顧問價值的一部分吧,我們確實有很多分析工具可以幫助客戶將商業指標關聯到行動中,這就是「管理」的一部分,透過數據來讓行動變得有跡可循,這很重要,因為有了量化之後你可以去思考幾個問題:

  • 我做A跟B,誰的成效比較好? -> 比較量化指標
  • 為什麼是做A ? -> 用類別、連續變數等拆解原因
  • 如果是因為C,那麼C的可複製性在哪裡?

這樣可以持續去優化與吸收經驗,其實很多組織的營運模式都是打地鼠,看到問題就專注在問題上,但沒有試圖累積經驗,看一個打一個,沒有去想地鼠會從哪邊冒出來的可能性比較大?我該用哪隻手打?休息是不是反而可以更高分?諸如此類,這樣才可以把遊戲玩得更好而「不會浪費經驗」,尤其是現在跨界是很容易的,科技公司可以做金融、消費品公司可以做零售,把經驗與管理能力累積起來才可以變成公司的資產,經營的船更不容易被突如其來的變化或者跨界打翻。

資料科學在這裡面的角色

一次觀察大量數據與應用統計來發展假說

還有一點這塊大量指標間的分析的確是我認為掌握資料科學技術非常吃香的一點,透過迴歸很容易了解到不同指標之間的關聯,也可以更好分析類別變數對於營運指標的影響。

舉例來說,處理得當迴歸模型係數可以直接量化行動的成效,好比分析促銷活動對銷售的實際影響為多少,這麼做是否超過成本?不同零件的價格波動性會對供應鏈造成什麼衝擊?是否可以將CAPM的思考方式放到這裡面找到更有效益的供應商?

諸如此類,以我來說,我的資料背景在面對問題時,有非常非常多資料科學應用到商業分析的直覺都是信手捻來,可以加速我們分析指標間關聯的效率,儘早找到關鍵行動以提升管理績效。可以看到這一塊的分析重點也不是數字跟Excel,更多是去想到一個個因子,然後想辦法把這些因子量化與找到數據,舉個例子,Google 搜索的Vlookup搜尋成長率可以衡量不同區域疫情復工的程度。

對標(Benchmark)

我只關注高於對標、低於對標的

最後一塊是對標,不可否認數據有時候會很多,但是看一張圖該看的點到底是什麼呢?其實就是參考對標,比方我想要分析誰在這個產業做得最好,我可以去找到產業的玩家畫出他們的淨利率來量化,找到排名第一的玩家去深入研究為什麼他做得最好。

對標是一個很深的議題,管顧經常使用的Best practice 就是找到最好的參考對象實踐來分析,怎麼分析通常可以回到商學院的管銷人發財,用行銷活動去解釋(比如因為他有舉辦某個活動因此銷售特別好)、用財務活動去解釋(他的資金成本很低),這些解釋可以提供我們思考策略來改善指標。而對標就是一把尺,我們可以拿這把尺去回答誰表現比較好。

對標可以幫助我們找到真正要關注的數據點

看任何圖表都是拿著對標去看,柱狀圖如果拉出對標可能只看前三名,散點圖拿出對標可能就只會看到幾個離群值,對標可以讓我們去看到數據裡面該關注的對象,並透過專家訪談、深入報告研究、用其他數據分析來解釋原因,掌握原因之後解決問題就是產業知識與邏輯的激盪。

比如供應鏈效率不佳原因是大量慢性消耗庫存堆在門口影響人員進出,就更改貨品排序位置、毛利低原因是現在的銷售制度會促使業務以低價換取訂單,因子更改薪酬制度等等…….

所以這項分析的重點就是「確定好Scope以及我的對標」,Scope 的意思是我要納入多少數據、什麼數據來比較,比如說我想要看可口可樂的競品,我可能就不只看百事可樂與碳酸汽水品牌,還要看茶飲料、咖啡等潛在競品,這些都會影響到我的對標。對標經常是這批數據的平均數,偶爾我也會用迴歸線來劃分二維座標,針對不同區域提出策略與分析。

其實在管理顧問中很多模型都是基於對標思維開發出來的,經典的如BCG矩陣、麥肯錫GE九宮格等,你可以發現都是找出幾條線(benchmark)去劃分數據,並給予商業意義解釋,掌握Benchmark的分析思維,你也可以開發出非常多的工具來協助自己分析數據與解決問題。

那麼以上,就是這次對於管顧商業數據分析的基礎思維,我們了解到開發框架與邏輯的重要性,以及資料科學怎麼應用到管理顧問的專案上,並可以搭配其他分析、研究來解讀數據分析。

歡迎想學習Python資料科學、商業分析、金融知識的人一起交流!本部落格的內容全部都是基於「分享」的實作、理論兼顧文章,希望能夠幫助到所有對資料科學領域有興趣的人們,長期關注可按左手邊的Follow!若喜歡我在 Medium 的內容,可以拍個手(Claps)這邊想做個實驗,好讓我知道你/妳喜不喜歡這篇文章:
拍 10 下:簽個到,表示支持(謝謝鼓勵!)
拍 20 下:想要我多寫「商管相關」
拍 30 下:想要我多寫「資科相關」
拍 50 下:我有你這讀者寫這篇也心滿意足了!

敬請期待下一篇!或是您也可以逛逛我的其他資料科學文章,到我的主頁置頂文章獲得良好的目錄體驗。

Python資料科學系列:

如果想跟著我實作資料科學,開始寫程式必知必會基礎系列:

本文由 戴士翔 | Dennis Dai 授權轉載,原文連結

瀏覽 1,388 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button