資料科學的基石知識 – 統計學|專家論點【維元】

圖片來源:freepik

隨著雲端與大數據的技術逐漸成熟,數據科學已然成為數位時代下不得不具備的技能。但資料科學的概念其實並不是一個全新的技術,其中最核心的基礎「統計學」,就是一個從過去持續發展至今,且已融入各行各業的重要解法。
統計學(Statistics)是由數學系發展而來的學科,作為資料分析的基礎。目標從一組數據中經由研究測定、收集、整理、歸納和分析反映數據資料,找出資料背後的訊息。統計學藉由科學的方法,在不確定的情況下由樣本資料所獲得的結果來推論母體的性質與事實,從而做出適切決策的一門學科。

統計學(Statistics)作為數據科學中的基石,能夠「從資料中萃取出資訊」用以幫助決策,學好統計學是建立對數據科學思維的第一步。統計是由數學系發展而來的學科,可以分為類型「敘述統計」和「推論統計」兩種類型,依其性質可再分為:理論統計學或應用統計學。
不過對於許多人來說,統計學總是存在一道無形的門檻,統計學中的數學公式往往令人卻步。你是否也曾經擔心自己數學不好,而無法學好統計或是資料科學呢?但如果我們跳出為了考試目的的學習,試著從生活案例中解釋統計學,你會發現其實並沒有想像中的可怕與困難。

統計學中的五個層次思考

統計學其實就是大量生活中的日常經驗,從觀察到思考都能夠看出統計學的影子。而所謂的「數據思維」,也可以說是一種從「我覺得」到「看數據說話」的解決問題策略,簡單來說就是當你面對一堆數據與圖表時,你該如何進行思考與推論進而決策呢?如果我們始終仰賴於經驗與主觀的判斷,會很難實現系統性的成長。
統計學是基於歸納法所發展而來的,能夠從累積的資料中觀察趨勢,讓我們從資料中「鑑往知來」而不再只是主觀的判定。從探索過去、了解現在到預測未來可以分層五個層次的統計思考脈絡。更重要的是能夠從統計學建構的敏感度,更精準的資料解讀避免我們陷入資料的盲點與誤區。而作為來自數學習中成熟的方法,統計學也是最早期的資料科學方法,並且廣泛的應用於各行各業中。


嗨,我是維元,目前是一名資料科學與網頁開發的雙棲工程師。近期也擔任科技島社群的駐站專家,持續分享發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤資料科學家的工作日常 Facebook 粉專 或 Instagram 帳號,也會不定時的舉辦分享活動,一起來玩玩吧!

瀏覽 1,900 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button