淺談資料科學家的 4 種類型與在企業中所扮演的角色

圖片來源:freepik

文/Adam

這篇想跟大家分享的是一個我自己在早期也困惑很久的問題。

『很多公司都有資料科學家 / 商業分析師 …的職務,到底這些職務有什麼差異?』

這個問題不論是在我還沒踏入這個領域時、剛踏入這個領域時、踏入這個領域一段時間時,都一直很困惑的問題。

一直到在這個領域工作更長一段時間後,隨著接觸到同領域的人越來越多之後,才慢慢地稍微搞懂了這個問題。

資料科學家是一個非常複合型技能的一種職務角色,主要是整合商業、資訊科技、統計三個領域的經驗與技術知識的角色。

根據不同產業 / 企業發展 / 組織文化…等需求,對這個角色的定位與發展方向十分不一樣,根據我自己的經驗,會把資料科學家大致上分成四種類型:商業型、輔助型、工程型、研發型。

1) 這四個類型會依照企業期待與技能需求有所不同

分成這四個類型的原因主要依據兩個因素:

  • 這個角色在企業內屬於哪個單位?企業對這個單位的期待是什麼?
  • 企業對資料科學家不同的期待,有不同的技能需求

這裡先談談第一個因素,企業的組織規劃與角色期待。

在不同的企業裡面,企業會對各個單位有不一樣的發展定位,這是什麼意思呢?

比方說資訊單位裡面,要為公司做的服務內容,就是提供資訊系統的服務;

如果是在行銷分析單位裡面,需要的是提供公司行銷的洞見與策略;

如果是在公司的策略單位裡面,負責的內容就是提供公司,在企業發展上的建議與規劃;

如果你是在研發單位,你承擔的角色就是所有技術上的創新與挑戰;

如果你是在營運單位,你可能需要幫公司改善目前營運的流程、降低成本、解決未被處理的營運痛點…

隨著你在公司內的不同單位,企業對相同職務的預期產出,是截然不同的。

再來聊聊第二個因素:技能需求。

因為在公司所屬的單位不一樣,需要交付的產出物不一樣,你會需要的技能截然不同。

舉個例子來說,如果你今天是在營運單位裡面擔任資料科學家,你每天面對的問題都可能是公司企業營運相關的內容。

比方像是你怎麼處理倉庫的庫存量?
目前銷售的方式對應企業的獲利與資金周轉狀況如何?
目前公司產品的策略是否有市場競爭力或潛在的風險?
目前現行的作業流程是否有可以改善的地方?…等等

需要針對各式各樣企業內部的日常運作與成長方面的問題,進行需求訪談、問題研究、資料搜集、數據分析、提供改善策略等等。

這些問題會涉及到的技能可能是:人際溝通、專案管理、統計分析、對特定產業的業務理解…等等。

如果今天的角色是定位在資訊單位呢?每天可能處理的都是系統方面的問題。

例如說每天都是面對格式不一樣的資料,要把他轉成相同的資料,像是性別有人就寫男、女、F、M、male、female、可能還有錯字…,每天寫程式將它轉成正確的格式。

又或者是每天在維護資料的排程作業、資料庫維護、模型開發、大量數據的存放與管理、配合業務單位進行儀表板的開發等等。

這類型問題涉及到的是對資料處理的理解、數據分析的技能、資訊系統的知識…等等。

同樣是資料科學家,若在不同企業內的不同單位,需要的技能完全不一樣!

2) 商業型、輔助型、工程型、研發型的資料科學家

實務上不一樣類型的資料科學家,在不同領域的技能需求與工作內容都或多或少有部分重疊,但其需要的技能深度,與實際在不同工作裡面的時間佔比截然不同。

這裡跟大家聊聊這四種類型的一些日常工作內容、技能需求、與面對的挑戰:

商業型

作為側重商業邏輯的商業型資料科學家,每天需要處理的議題會更佳側重在解釋公司目前的現有數據,從數據中發現問題與機會。

這類型的資料科學家會需要對產業經驗與知識有深度的理解,你的時間通常都會花費在分析各式各樣的產業資訊,分析什麼內容跟現有業務有關,這些資訊又會對業務產生什麼影響?我們該如何面對這樣的資訊,並規劃相對應的策略和行動。

在技能方面,這類型的分析人員會更加著重在對於特定產業專業知識的理解,同時對統計與程式有些基本的概念,以商業的角度去發展公司內部各式各樣的專案。

輔助型

這類型的資料科學家,對業務內容有一定程度的理解,同時也對分析技巧、工程技術有一定程度的熟悉,站在一個業務端與資訊單位中間者的角色,協助企業內的業務單位進行數據分析,同時與其他工程師們協作,開發出數據分析相關的功能或產品。

輔助型的資料科學家,在業務邏輯方面可能沒有第一線的人員熟悉,在工程面或許也會略輸專業的軟體工程師,但卻很適合在這兩者之間擔任協調者的角色,平衡這兩個面向的需求與限制。

在技能方面,需要對商業知識、統計分析、程式開發等面向都有些基礎的理解,通常對於統計分析的知識和技巧會更熟悉,以多元化的角度提供不同單位分析數據的建議。

工程型

工程型資料科學家,顧名思義就是在技能與日常工作方面,都以資訊科技與工程方面為主,但除了工程方面,亦對統計分析有基本的認識。

這類型的資料科學家通常扮演著模型開發、部署、大數據處理、資料庫管理、分析系統架構設計等等的角色。

日常工作上所面臨的挑戰會更加著重在如何開發穩定的系統或模型,提升各項分析系統的效能等等,在分析方面協助公司落地相關的分析功能,與對相關資訊系統進行維運和管理。

研發型

最後這一類的資料科學家,需要對各種統計理論有高度的認識,同時要有透過程式去實踐這些統計理論的能力。

這類型的工程師承擔著公司技術發展的重責大任,通常具有碩士或博士的學歷,熟捻做研究的方式,幫助公司透過各種理論知識,協助公司設計或改良模型相關的演算法。

3) 依照你的興趣,選擇相對應類型的公司與工作

或許你會說,這麼多類型的資料科學家,到底哪個類型的角色會比較適合我?

如果你有這樣的問題,我會建議你從自身的興趣出發。

你喜歡寫程式多餘看數字、解釋數字多一點嗎?那你可能偏向工程型多一點。

如果你喜歡探索各種數字與商業之間的關係,那商業型的分析人員可能更佳適合你。

倘若你是喜歡做理論研究,推導各項數學式子,研發型的角色或許才是你的天命。

若你喜歡擔任工程與商業整合者的角色,輔助型的資料科學家應該很適合你。

你可能會想說,難道就不能成為全能型的嗎?

當然可以!只是要熟悉各式各樣的技術與知識,是要比別人花上更多的心力,在做各項領域的投入與研究。

實務上更多的是覆蓋到四種類型中的兩種,同時面對多種不同類型的挑戰,但在各類事務上的投入時間佔比與技能深度會有所區別。

透過瞭解公司把資料科學家放在哪一個內部單位上,你可能就可以清楚地知道,公司今天對這份職務的期待是什麼?並進一步的知道這間公司的這個職務,是否會很適合你。

最後

會有這篇文章其實是因為自己也困惑了這個問題一段時間,希望可以透過這篇文章的分享與描述,讓更多想加入這個領域的朋友們,能對這個角色有更深一層的認識,並進而成為自己更有興趣的分析人員類型。

本文由 Adam 授權轉載,原文連結

瀏覽 1,789 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button