【學長姊帶路】台達電、英業達、富邦人壽等多間 NLP工程師 面試分享
原標《2022Q4 New Grad Data缺求職紀錄 》
文/hwork
以此文章紀錄2022畢業新鮮人求職紀錄,主要著重在不同公司的面試流程、紀錄,準備過程、內容等會在另一篇詳細介紹,因為是新鮮人所以也沒辦法跟之前的經驗比較找工作的難度、容不容易拿到的工作機會,但比起朋友在2021年中畢業找工作確實相對比較難找,看到底收了多少無聲卡就知道有多凍,當然也可能是學經歷的問題,所以參考看看就好,個人背景的部分,為私大資料科學系直升資科所讀五年碩,主要做 NLP 相關的研究,由於投稿的關係多延一學期到2022年初畢業,約四月入伍到十月退伍,因此從5月到11月都陸陸續續有在面試。
1. 面試結果
主動邀約:
Offer Get:Yourator、鴻海、富邦人壽、喬美國際
面完被拒:台達電、ASUS、捷智商訊
主動投遞:
Offer Get:AICS、Shoalter
面完被拒:文境資科
中止面試:Inventec
無聲:Synopsys、ikala、Gogolook、Qualcomm 、Tomofun、Cinnamon AI、Trend Micro、TSMC、MTK、Dcard、Line、Micron、Migo、KLA、ASUS、Acer、Pinkoi、BridegeWell、Merkle、Gamania、Wemo、MoBagel、OneLab、Next Fortune、aiello、浪Live、類神經、台達電子、雅婷、洞見外來、國泰DDT、萬達AI
2. 整體時間線:
2022/05 開始面試(主動邀約)
2022/07 開始刷題,準備面試
2022/09 主動投遞履歷
2022/12 結束面試
3. 求職目標:
研究所是做 NLP 相關,因此求職偏好以 NLP 為主、再來是 ML、最後是 DS/DA/DE 等等資料相關職缺
4.求職紀錄:
(1) 喬美國際
職稱:數據工程師
面試邀請:主動邀約
D0 收到邀請
D+7 面試
D+14 Offer Get
面試內容:現場面試,一般正常的流程自我介紹、問一些有些在履歷上的過去的經驗,現場面試官沒有問特別多技術問題,感覺只是對有寫的經歷確認是不是亂寫的,接著是現場開了一個說是產學合作的教授之類的做線上面試(去現場然後開線上面試我滿臉疑惑),這個就問比較多技術問題,例如為什麼 CNN 用 Convolution 不用 PCA 來做特徵抽取,問題算蠻活的,大部分都是問這類比較活的問題,要理解為什麼在特定情況要用某些 model 等等,有什麼優勢這樣。面試結束大概說一下工作內容會碰到影像、NLP 的 model,也有可能碰到爬蟲要從網路上蒐集 training 需要的 data,可能團隊還不夠大所以工作內容包山包海。
(2) Shoalter
職稱:NLP Engineer
面試邀請:主動投遞
D0 投遞
D+10 面試
D+19 Offer Get
面試內容:線上面試,面試官不確定懂不懂技術,主要都是問過去經驗而已,並沒有提出一些follow up的問題,然後主要負責內容是購物網站的推薦系統,團隊好像也剛在台灣建立而已,母公司是港商,也有提到有可能之後會跟英國之類的合作(? 雖然工作內容蠻符合我所學,但詢問了一下團隊目前規模小,只有一個做 NLP 的 Senior Engineer,這也是我考量的點之一,雖然最後有 Offer Get 但這個面試經驗比較差的是HR標準話術要學技術可以來、薪資不是絕對、新人比較沒本錢談薪資之類的來壓低薪資,感覺實在是沒有非常好。
(3) 捷智商訊
職缺:NLP Engineer
面試邀請:主動邀約
D0 收到邀請
D+8 一面
面試內容:現場面試,一去就拿了一張手寫題說面試前要先測驗,結果題目全部跟 NLP 無關,都是 SQL、系統等等,當下其實我覺得超浪費時間,如果是做這些內容我也不會來,所以就跟 HR 確認職缺內容有沒有搞錯,HR 詢問主管之後表示沒錯,後來就我寫個15分鐘後就請主管來面試,基本上也是針對過去經驗問問題而已,主管也說現在不確定要做 NLP 的 topic 是什麼,可能要自己想(??? 有問預期薪資開80結果聽HR說這樣太高,最後沒開 offe r出來無聲卡。
(4) 富邦人壽
職缺:NLP Engineer
面試邀請:主動邀約
D0 收到邀請
D+7 一面
D+16 二面
D+21 Offer Get
面試內容:現場面試,一去也是先考試,考題貌似是另一位Junior Engineer出的,可以open book,考題難到不行,而且範圍涵蓋到蠻多不同的 Model,GAN、Seq2Seq、Meta Learning 等等都有問到,沒有深入到數學方面的問題多數是一些觀念題,像是多選問哪個觀念是正確的之類,面試完後就是主管加上出題的 Engineer 來面試,介紹工作內容主要在做一些內部 tool 的開發,與 NLP 相關,面試流程蠻舒服的,後續也跟更上層的主管線上談過一輪後 offer get,只是銀行業IT薪資還是跟期待會有點差距,最後拒絕 offer。
(5) 文境資科
職稱:NLP Engineer
面試邀請:主動投遞
D0 投遞
D+20 現場一面
D+38 電話談薪
面試內容:現場面試,面試問得非常細,大概跟3位面試官聊了大概2.5小時左右, 根據過去在 NLP 的經驗來問,也有問模型的細節、為什麽沒做什麼嘗試等等,另外也會針對論文問問題,面試過程感覺蠻不錯的,跟面試官有一種技術交流的感覺,也可以感受到在 NLP 這塊還有蠻多學習的空間,之前有參與一個競賽剛好面試官也有參加,所以也多一些技術討論可以交流,面試詢問的題目印象比較深的是對於推薦系統開發的知識,還有在給定的資料格式的狀況下遇到冷啟動的問題該如何解,,另外也聊了對於工作的要求,除了訓練模型以外,還要會從一台空 server 安裝 Linux、設定網路、搭建到 K8s、等等完整流程,因為要到客戶端內網架設服務所以這些全部都要會,我是覺得挺有挑戰性的,雖然不難但還真的幾乎沒有這樣從頭到尾搞過一輪,第二輪因為沒有 HR 所以是直接跟老闆談薪水,老闆是說雖然有面試但還是只能很膚淺的看學歷給薪水(考不出程度好像也不是我的問題啊?),我們這邊有很多台清交學歷的也是很有競爭力,多學習證明自己能力才比較有本錢談薪水,所以我開85有點太高了,後來就沒下文。
(6) 台達電子
職稱:NLP Engineer
面試邀請:主動邀請
D0 收到邀請
D+9 一面
D+24 感謝信
面試內容:線上面試,部門是我以前實習待過的部門,主要在做一些研究跟內部 support 的 tool,我自己當時實習是蠻喜歡部門的氛圍跟工作環境,面試就是標準的自我介紹再來是問一些對於實際工作的問題有什麼看法或是會怎麼做,主要也是在我搜尋+推薦的算法優化等等,情境上可能是某些文章、新聞關鍵字搜尋,給出解答後面試官也還會根據你的回答再問更深入以及提出問題點,我自己覺得面試表現還算不錯的,有給出合理的解釋為什麼用樹狀搜尋等等,可惜因為那時候還在當兵,那個職缺當時是蠻需要馬上有人可以接手因此後續無結果。
(7) Yourator
職稱:Data Scientist
面試邀請:主動邀請
D0 收到邀請
D+7 一面
D+13 二面
D+14 Offer Get
面試內容:線上面試,這整個面試下來最舒服的一家公司,非常推薦有興趣的可以試看看,因為本身也是做獵頭的行業,給出來的薪資水準當時確實是非常心動,可惜最後沒能有合作機會,面試流程相當專業,先由 HR 聊過約15分鐘後,說明這個職缺的內容是對一些履歷、人員推薦的演算法開發,確認後約第一次面試,是與兩位 Engineer 面試,Engineer 也有表明對於 Data 的領域並不是專長,因此是以一個技術交流的角度來面試,並且中間也有大概問一下我如果遇到這樣的task會以什麼角度作切入,而由於團隊中目前還沒有這類型專長的人,所以也需要涵蓋 Data Engineering 的部分,而產品的 deploy 等等團隊則有專業的 DevOps 來協助,在面試完之後還有與 HR 聊一下期望待遇等等,整個流程明確也不會讓人緊張,因此我是相當推薦的,可以感受出是一間尊重工程師的公司。
(8) 英業達
職稱:AI Engineer/Data Scientist
面試邀請:主動投遞
D0 投遞
D+22 一面
D+40 二面
D+51 停止面試
面試內容:線上面試,第一次面試應該是 AI Enginneer 的缺,後來被轉到 Data Scientist,第一次面試的面試官是一位非常專業的 AI Engineer 來面試,面試考非常數學的內容,也有考計算偏微分等等,開白板直接寫,也有問到為什麼有些函式不可微,以數學的角度來解釋,另外也問到一些模型在做 back propagation 的算法、為什麼需要從最後的輸出開始傳遞到最前面的 neural、chain-rule 的優勢等等,我給自己的評分大概60~70分,因為不是沒有回答出來,只是有些問題需要面試官提示後才能解答,也有可能是因為在數學的基礎不夠扎實的情況下被轉到 Data Scientist 的面試,第二關則是先聊一聊在一些topic的經驗、會怎麼選擇模型、呈現數據等等,而後則是給一個像是 kaggle 的 dataset 馬上分析這個題目的切入點以及從直接數據看不出來的 insight,過程中全程開 IDE coding,過程中面試官也會看對 dataframe、numpy 等操作的熟悉度問一些問題,而在第三面之前就已經拿到其他 offer 因此主動結束面試。
(9) AICS
職稱:Software Engineer — Data
面試邀請:主動投遞
D0 投遞
D+12 Online Coding
D+22 Phone Interview
D+49 Full Loop
– Project Zoom in + Coding
– Problem Solving + Coding
– BQ + Coding
D+51 Offer Get
面試內容:
1. Online Coding
第一關我準備到了 Deadline 的前一天才上去寫題目,我投遞的職缺比較偏向演算法,準備也都是偏向 Leetcode 的題型,但打開題目之後讓我小傻眼,三題 coding 題目都是跟 data processing 比較有關係,而且還夾了一題 SQL,沒準備這題直接0分,我想這關應該是低空飛過,就是兩題 python 部分都有解出來。
2. Phone Interview
寫完 Online Coding 其實我覺得已經涼了,畢竟三題有一題0分,結果還是順利收到 Phone Interview,短暫準備差不多一週後才開始這輪面試,這關對經歷做了一些 Reference Check 然後考 coding,這是我刷題以來第一次解題給別人聽,有讓面試官提示才大概知道error在哪裡,而且用 DFS 的方法解題 Time Complexity 應該也不是最佳解,可是前面 debug 搞到時間不夠,連可以用 DP 解都沒有提出來,所以是有點抖。
3. Full Loop
說真的我完全沒想過會進到 Full loop 的環節,所以收到面試邀請之後才開始規劃要怎麼準備面對一堆技術問題、BQ、還有更多的刷題準備,幾乎是閉關在家裡每天除了吃飯睡覺就只做這三件事,直到面試前這20天內 Leetcode 應該已經比 Phone Interview 的時候又多刷了大概150題,所以基礎加進階題型都準備的差不多的情況下,我其實心情算是蠻平靜的,已經沒有那種準備不足的感覺。
3.1 Project Zoom in + Coding
一上來的面試官就開始考一堆五花八門、永遠不會思考原因的問題,都是針對 Data Engineering 的問題,有沒有用過那個、這個有用過嗎、在哪用過、為什麼要用、優勢在哪、缺點在哪、那用另一個不好嗎,八九不離十都是這種問題,其實看的除了技術實力到哪裡以外,我覺得也是考能不能在這樣的情況下用你的技術底子推測合理的解答,後半小時就是coding時間了,考的題目很活,這個時候我連周賽都沒有刷過,基本上對於活題比較沒有那麼容易有想法,最後先給出了一個 O(nlog n)的解,討論後給出不完整的 O(n)解,最佳解這邊也是主管後來才說的,我自己覺得這個解應該沒多少人能半小時內想到。
3.2 Problem Solving + Coding
面試官一上線說,這關主要就考 Algorithm 了,所以預計會考兩題,第一題考 linked list,考類似 Floyd Cycle detection 的題目,用 two pointer 第一次嘗試就有做出來,雖然複雜度還是有 O(n),面試官也有詢問是否能用 O(log n)解,我回答不行後面試官也說的確這個 two pointer 做法應該是最佳解,Binary Search 只能做到 O(nlog n),算是鬆一口氣;第二題我也蠻快的給了一個 DFS,時間複雜度 O(n²)的Recursive解,跟面試官討論後沒問題,面試官詢問有沒有更快的,我提出能用 DP 來解,等跟面試官討論想法後開始改 code,中間也是有卡一些地方,但最後是有給出很醜的 O(n)解。
3.3 BQ + Coding
本來這關表定是HR面的,所以面試完前兩關我就準備休息了,結果上線是另一個 NLP team 的主管,大概到這邊我就知道被加關了,這個 loop 能不能通過也決定在這關,結果就陸陸續續問了半小時的 BQ,還有順便宣傳一下 AICS,這時主管又說
「既然還有半小時,那不然我們再來考個 coding 怎麼樣」
我OS:「我可以拒絕嗎哈哈哈」
於是考了矩陣處理然後配上不同的限制例如要用inplace、不要額外allocate記憶體、不要用build-in function等等。主管最後也說我的表現跟debug、coding style蠻符合他們要的,相信我如果有機會加入可以fit的很好。
結語
這次面試了15間左右的公司,而且在一個蠻凍的時間點,蠻多時候都有在拿到offer就想乾脆就先答應的念頭,還好最後有撐下去,才能拿到更好的offer,刷題這種東西真的就是 go big or go home,沒刷過努力就都白費了,祝福所有求職者在這一兩年景氣寒冬都能找到理想的工作,我的分享有幫助的話,也幫我按個拍拍手,謝謝各位耐心收看
文由 hwork 授權轉載,原文: 《 2022Q4 New Grad Data缺求職紀錄 》
___________
你也有經驗想分享嗎?快來投稿賺稿費吧!
瀏覽 2,033 次