[閒聊 #資料職涯新人 找工作可以注意的 3 個面向]
最近蠻多人來諮詢選擇工作的建議,趁機會一次來彙整給大家🙌
-
ㄧ、找 #有數據 的公司
既然已經是資料職涯新人(不論是剛出社會還是轉職過來),就更需要有適合磨練數據分析技術的環境,所以會建議先弄清楚目標公司有沒 #數據資產 和 #數據題目。這需要靠面試多問一下,了解目標公司都做什麼數據專案、公司存放的數據多寡與大致的類型,多問多評估才能愈接近正確的環境。
-
二、確認產業有興趣
選到沒興趣的產業真的會失去洞察數據的動能,所以一定要三思,有興趣加持才能幫助自己看到更多數據創造的商業價值。舉例來說,我喜歡旅遊和買東西,那我看旅遊電商平台數據就會很有感覺😏,我也會更能內化平台需求與自己內心的需求。
-
三、確認公司類型是現階段想要的
雖然說到爛了,但還是要再說一次:甲方、乙方、甲方新創、乙方新創公司型態不同都會大大影響工作的內容。多運用公司類型的特色來勾勒職涯的發展方向是很重要的,還不知道怎麼區分的人可以參考我過去的貼文「你可以選擇的公司型態:甲方、乙方還是新創公司?」
-
-
又來分享我的 #辦公室穿搭 (因為沒生活照了,我都沒空出門遊玩啦😭)
這是 #低調復古風,杏色絲質襯衫+黑色異質拼接窄裙+無印良品小白鞋+在 #hsusdaughter 做的藍白相間手工肩背包。
-
#職涯規劃 #職涯發展 #資料科學家 #資料職涯 #職涯諮詢 #職涯探索
同時也有3部Youtube影片,追蹤數超過7萬的網紅在地上滾的工程師 Nic,也在其Youtube影片中提到,## 影片觀看說明 由於問題較多,大家的問題也可能是你的問題,建議可以先閱讀下方的「問題總匯」區,找到時間碼 Time code 之後跳轉到自己想聽的部分,會比較有效率哦 本影片 Q&A 留言是抓取 【2020 年度回顧! 成為 Team leader? 業外收入增加? 技術能力成長? (第一...
「資料科學家面試」的推薦目錄:
- 關於資料科學家面試 在 Irene 與資料職涯大小事 Facebook 的精選貼文
- 關於資料科學家面試 在 Facebook 的最佳貼文
- 關於資料科學家面試 在 Irene 與資料職涯大小事 Facebook 的精選貼文
- 關於資料科學家面試 在 在地上滾的工程師 Nic Youtube 的最佳貼文
- 關於資料科學家面試 在 健身科學家 - 胡力威教授- 香港人體天然無藥物科研健身健心研究院 Youtube 的最讚貼文
- 關於資料科學家面試 在 POPA Channel Youtube 的最讚貼文
- 關於資料科學家面試 在 Re: [心得] 2021 外商資料科學求職心得- 看板Soft_Job 的評價
- 關於資料科學家面試 在 面試經驗-3 面試前準備(應徵: 數據分析&資料科學家) - YouTube 的評價
- 關於資料科學家面試 在 面試經驗-1 資方在想啥? (應徵: 數據分析&資料科學家) - YouTube 的評價
- 關於資料科學家面試 在 面試經驗-2 薪水行情(應徵: 數據分析&資料科學家) - YouTube 的評價
- 關於資料科學家面試 在 資料科學家薪水2023-在Facebook/IG/Youtube上的焦點新聞和 ... 的評價
- 關於資料科學家面試 在 資料科學家薪水2023-在Facebook/IG/Youtube上的焦點新聞和 ... 的評價
- 關於資料科學家面試 在 大公司資料科學家#面試考試題庫- 工作板 - Dcard 的評價
- 關於資料科學家面試 在 ALPHA Camp - 【資料科學團隊如何分工 資料工程師面試重點 ... 的評價
- 關於資料科學家面試 在 [心得] 2021 外商資料科學求職心得 - PTT 熱門文章Hito 的評價
資料科學家面試 在 Facebook 的最佳貼文
遠距兼職幫谷歌做案子或到矽谷實習+累積管理經驗當導師或收實習生+ 我的第一個 #駭客松
填問卷👉 https://bit.ly/3i9HaFt
報名👉 https://internly.xyz/
我雖然當過不少科技類比賽的評審,但其實還真沒參加過那種48小時從零到一做出軟體產品的駭客松,只有去幫參加的屬下加油,還有在韓劇Startup裡面看過(歪樓~我其實比較喜歡男配角治平,不過創業家的影集,創業家追妹還是要贏創投的啦,合理!😝)
剛剛直播大家有看到嗎?我有認真講外商科技公司的履歷面試喔。直播後有個粉絲問我說要怎麼不斷進步,其實就是遇到不會就學習!
像我最近得到了 #亞洲矽谷 的獎學金,到矽谷有名的創業學校 Draper University 參加兩週的創業課程,課程的一部分是要做駭客松,所以我就開始了我的第一個駭客松!
你是不是想找某工作,但就缺某些經驗的?硬體產品經理想轉軟體、但軟體經驗不足,專案經理想轉產品經理、但像樣的產品經理經驗不多,或是行銷想轉數據科學家、但沒有分析經驗,想帶大團隊,但過去管理經驗不夠多?
我們的概念就是,如果你想去谷歌當數據科學家,最快的方法就是幫你在谷歌或類似公司的數據科學團隊,找個兼職或正職「實習」,以微薄的薪水當個約聘僱數據科學家,因為你一旦進去,你就有「谷歌約聘僱數據科學家」的職稱了,履歷就漂亮了、人脈就廣了,不管你幾歲,都可以做。
另一方面,收你的導師可藉此有實習生幫忙做事,還可以累積自己的管理經驗,順便幫助學弟妹或類似背景的人。像是電影 #實習大叔 和 #高年級實習生 一樣。
有興趣的人報名吧!雖然是駭客松,但不要擔心,活動後我們會把你的資料轉給一個類似的新創Pedestal,他可以幫忙你找到適合的導師或導生。
不管你有沒有興趣,都幫我填個問卷吧~剛剛直播有人問我怎麼累積人脈,人脈就是能幫忙的時候幫忙,像存錢一樣,需要的時候領出來囉!謝謝你!❤️
填問卷👉 https://bit.ly/3i9HaFt
報名👉 https://internly.xyz/
#駭客松好累但很有成就感 #倒數12小時 #終生學習 #還是看韓劇比較輕鬆
資料科學家面試 在 Irene 與資料職涯大小事 Facebook 的精選貼文
✍️【我不是本科生,也可以當資料分析師嗎?】
-
我發現滿多人對於自己不是本科生這件事情會感到迷惘,不論是粉專的私訊詢問、以及我即將要參與一個資料科學領航者活動,也有參加者也會詢問類似的問題,像是:
🧒:「Irene,想詢問若非資工/資管背景,但有在學 python、機器學習、甚至也會用 Kaggle 資料練習,未來能當資料科學家嗎?」
👱♂️:「聽到不少人說資料科學工作領域比較缺有經驗的人,若無相關經驗的轉職者很難跟資工、統計等背景的人競爭,請問如果離職努力自學,為了轉職可行嗎?」
-
我必須說:「有何不可?關鍵在於證明自己有無相關實力」
-
雖然我不能保證所有企業都不看本科生的標籤,但我能確定的是,如果我們都能 #理解本科生的優勢在哪裡,並好好補足那些優勢,那我們絕對有機會脫穎而出。
-
這篇僅以 #資料分析師/ #資料科學家 的角色為例,因為我認為相較之下,這兩個職能因為更需要人文社會思考的面相,所以跨領域轉過來的機會較高,非本科生也能帶有屬於自己的特色轉進來,分享給大家 🙌。
-
#職涯建議 #職涯規劃 #職涯探索 #面試經驗 #面試 #職涯分享 #面試技巧 #資料科學
資料科學家面試 在 在地上滾的工程師 Nic Youtube 的最佳貼文
## 影片觀看說明
由於問題較多,大家的問題也可能是你的問題,建議可以先閱讀下方的「問題總匯」區,找到時間碼 Time code 之後跳轉到自己想聽的部分,會比較有效率哦
本影片 Q&A 留言是抓取
【2020 年度回顧! 成為 Team leader? 業外收入增加? 技術能力成長? (第一次蒐集 Q&A)】https://youtu.be/BGaDN9wxbKE
## 影片中提到的專案
簡單用 React 撰寫的留言爬取篩選功能,可以自己抓去玩
https://github.com/niclin/youtube-comment-filter
## 問題總匯
00:00 開場
01:26 QA-1 - 林天寸
一直很喜歡妳的頻道,不單單是因為工程師,當然也有部分原因是自己也是走工程師這條路的。
前一年2020年開始,其實是我剛轉職工程師的第一年,在滿多地方都遇到不小的問題,在troubleshooting上面也是有許多瓶頸的。
後來除了白天上班,下班看書跟休息,偶然間看到你的影片[工程師如何自我進修],才開始慢慢用計畫的方式取代橫衝猛幹。
不得不說,規劃時間真的是比起技術性的功力還更有成效。因為它讓你適時的放鬆跟加強,然後在工作上面才更有長進,雖然很幹話,但我2020的下半年是這樣做的。
目前在準備考取網路管理的證照CCNA,計畫是走network這一塊,還有很多要磨練的。希望也能多看你產出跟network的影片,這是私心話啦,哈哈。
02:57 QA-2 - 仔仔
1.學程式會建議從前端或是後端哪個開始學會比較好?
2.一開始投履歷如何判斷一家公司是可以成長的,而不是進去3,5年後還是那個跟剛進去程度相差不遠的自己差不多
3.跟程式相關的產業有很多(像是製造業到博弈),可以請Nic分析一下各產業的狀況嗎?以及進去各產業前須要具備哪些程式語言或能力?
4.投履歷時看到一些公司列出所需程式語言和工具一大堆,是不是代表你沒完全具備就不要投履歷了,還是可以請Nic給個意見哪些部分還是可以投看看
5.都說工程師又宅又不會說話,為什麼Nic可以交到女朋友?
10:40 QA-3 - ANDREW NG KAR EARN
如果当写编程语言遇到瓶颈,有什么方法可以有效地避免自己陷入钻牛角尖的情况?
11:46 QA-4 - JS Lin
如果NIC現在選擇能馬上精通一項語言會是哪個?會想用來做什麼PJ?
13:13 QA-5 - Rick0
成為 team leader 後無法直接在技術上有更深入的研究和突破,這樣的變化是否值得?
是否會擔心這樣在技術上跟不上其他人,甚至被下屬看輕呢?
14:39 QA-6 - Henry蔡
因為最近是寒假期間,
我開始考慮下學期的修課,
想請教nic大大,
應該在有什麼樣的基礎上,
開始學design patterns?
我目前是碩士生,
大學非資工本科,
學過Python,
也跟過一些網路影片實作過Flask+PostgreSQL,
大學學過資料結構演算法,
但不到得心應手的程度...
16:07 QA-7 - 黃柏瑋
如何同時Handle好好幾件事
我怎麼覺得上班,然後下班假日寫寫side project後就沒啥時間了🤔🤔🤔
17:24 QA-8 - 乾太
我想問一下這年頭轉行斜槓 VTuber 還有沒有搞頭A?
18:10 QA-9 - uuu06222
之前開始關注你有知道你有面試過人的經驗, 想問一下站在面試官的角度...
面試官會不會比較注重作品需要呈現那些東西, 或是有沒有什麼禁忌是不能碰的嗎?
20:07 QA-10 - Joery Lin
想請教您對於對於給你很多成長和照顧的公司,倘若您有一個更好的機會,無論薪水或未知挑戰都大於現在公司。
您將如何做選擇,或許現在公司會給你加薪留下你。
因為自己曾放棄了許多機會
21:37 QA-11 - YangTing Zheng
Q1: 想問通常一個產品開發的週期都多長呢?負責維運和開發的工作內容是否會差很多?
Q2: 想請您簡單介紹一下資工系學生的出路/工作內容?(如PM.SA.DBA.PG.RD.MIS…或是還有其他的?)
24:16 QA-12 - RTB
Hello World
24:18 QA-13 - Barry
目前是公司MIS 很想轉職成後端工程師,但在面試上面都都時常失敗
常常在問技術關卡時就被問倒了,總覺得 要準備的東西非常的龐大
毫無準備的頭緒,總覺得一直寫side project也不是辦法
26:49 QA-14 - 因地制夷
想請教Nic 有在做投資嗎? ex 股票 想聽一些投資心得
27:13 QA-15 - 比歐
想請教 Nic 大,
在之後的工程師生涯中之後有甚麼規劃或想法嗎?
例如:開發產品創業,或是開班授課、轉做顧問之類的。
28:14 QA-16 - yongming jia
请问新手如何学编程,学完去做什么?怎么自己创业?谢谢🙏
29:33 QA-17 - Minghao Chang
是否能請您推薦用來開發的筆電?(正好最近要汰換電腦),想從今年開始養成寫side project的習慣,謝謝。
30:31 QA-18 - Guan Jun Chen
想知道像Nic這麼厲害的工程師,年薪大概落在哪裡
30:46 QA-19 - Sheng Jiang
想請問Nic,如果非資工背景但是對寫程式有熱情,想轉職當軟體工程師,會建議如何起步?
補充:像是什麼樣的人適合自學,什麼樣的人適合去補習,或者補習跟自學的情況各有哪些優劣?
謝謝Nic
## 結尾
31:49 感想
喜歡影片的話!可以幫忙點個喜歡以及分享、訂閱唷!😘
━━━━━━━━━━━━━━━━
🎬 觀看我的生活廢片頻道: https://bit.ly/2Ldfp1B
⭐ instagram (生活日常): https://www.instagram.com/niclin_tw/
⭐ Facebook (資訊分享): https://www.facebook.com/niclin.dev
⭐ Blog (技術筆記): https://blog.niclin.tw
⭐ Linkedin (個人履歷): https://www.linkedin.com/in/nic-lin
⭐ 蝦皮賣場: https://shopee.tw/bboyceo
⭐ Github: https://github.com/niclin
⭐ Podcast: https://anchor.fm/niclin
━━━━━━━━━━━━━━━━
✉️ 合作邀約信箱: niclin0226@gmail.com
#QA #工程師 #在地上滾的工程師 #前端 #後端 #轉職
資料科學家面試 在 健身科學家 - 胡力威教授- 香港人體天然無藥物科研健身健心研究院 Youtube 的最讚貼文
甦谷社會服務連同健身界(一代宗師)胡力威合辦的健身健心復元計劃,由參加者亞井親身講述健身和戒毒復元成功經歷和感受,請大家支持啦!
健身. 健心. 復元計劃 - 先鋒組由Soul Good 社會服務和力威健身學院合辦
服務對象:
1. 戒毒復康人士
2. 有意戒毒人士
目標:
1. 協助參加者建立強健體魄及健康生活模式
2. 以師徒制(健身師傅及學員),發揮生命影響生命,傳授人生處世的堅韌和正向信念
3. 配合社工輔導,提升/延續戒毒動機
計劃內容:
1. 健身師父和學員商討為期2個月的健身計劃 或以
2. 健身體驗活動形式
(視乎學員意向及教練和社工的評估)
申請辦法:
如有興趣者,請至電健身‧健心‧復元計劃
查詢熱線 電話/ Whatsapp:5211-1711
或 填妥以下簡單報名表google form
https://goo.gl/3B29RN
本計劃現時以試行模式運作, 費用全免, 名額有限。
參加者將由Soul Good社工進行評估, 面試, 及接受相關輔導服務.
如有興趣者, 請即whatsapp計劃熱線5211-1711!
或以電郵查詢計劃:enquiry@soulgood.hk
Soul Good 及力威將保留最終決定權.
想認識更多Soul Good可到Facebook (Like and Share)
https://www.facebook.com/Soul-Good-1534159879936273/
------------------------------------------------------------------------------
【香港人體天然無藥物科研健身健心研究院】(前身為力威健身學院及香港健身研究院),為(健身科學家)秉承胡力威教授在38年來不斷地研究和研發出純天然無藥物健身.更在人體健身學首創健身健心(平衡心態和慈善愛心)及其養生之道,健身健心養生之道覆蓋範疇非常廣寬,其中一環之精,氣,神非常重要.因為精,氣,神是我們身體生活必需的元素,但健身學怎樣令精,氣,神能夠提升!?達致健身長壽呢!?生活能夠平衡身心呢!?大家要密切留意新片及舊片啦!!
雖然互聯網世界只流行了10多年,未能盡錄(健身科學家)胡力威教授之前更多資料,訪問和研究.但來年(健身科學家)胡力威教授將會拍更多的片,心得和所研究的精髓發放出來!!希望我們亞洲人能夠知道健身是非常深奧的一種人體學問~並非單單只是外表體型大隻和減脂與否!!
希望大家繼續欣賞和參詳.
不論你係唔係健身愛好者,都應該及時接觸真正健身!!另外仲會有更多不同種類影片!!敬請大家密切留意!!
無論你係健身初學者,定係玩左一段時間進入樽頸位的你,都可以因應你既情況去訓練到理想的身形!!
又或者身體上健康出現既問題抑或是你身體某些部位需要復康和強化,什至你從家庭和工作上我到的壓力,令你精神上難以負荷,這一一的難題,健身健心養生之道都可以全面照顧到你!!
(健身科學家)胡力威教授研究出更加能夠適合香港市民這樣忙碌而緊張急速生活節奏的健身學!!
尤其現在人多與密集之間,病毒和細菌非常容易傳播感染!!
(健身科學家)胡力威教授絕對認為一定要有強健的體魄,提升身體的狀態,增強免疫力.無論在任何環境之下都是比較優勝!!
如果你想更加了解健身,健心養生之道
歡迎你登入【香港人體天然無藥物科研健身健心研究院】的專頁了解更加不同學員背景的個案
了解更多健身,健心,養生之道之元素
LIKE and SUBSCRIBE
YOUTUBE : https://www.youtube.com/user/TheFrancosgym
Te l: 2394 4779 / 2395 6928
WhatsApp : 5500 6507
地址:旺角上海街599號安美大廈2樓CD室 (朗豪坊對面,朗豪酒店側面、港鐵旺角站C4出口直行)
Unit C-D, 2/F, On May Mansion, No. 595-599, Shanghai Street, Mong Kok, Kowloon, HK
瀏覽更多真實事例及了解更多詳情請登入【香港人體天然無藥物科研健身健心研究院】粉絲專頁
Facebook : https://www.facebook.com/ProfessorMr.Wu
資料科學家面試 在 POPA Channel Youtube 的最讚貼文
在香港,有很多家長經常跟子女講英文,甚至由孩子一出世開始,便已急不及待的只講英文,一句廣東話也不說。務求令英語成為小朋友的母語,增強他們入學面試的勝算,令他們在競爭激烈的求學生涯裡,可以贏在起跑線。
但語言不單止是用來溝通,更是發展認知能力,學習邏輯思考、社交和情緒管理的重要工具,如果家長只用外語跟子女溝通,放棄自己的母語,對小朋友會有甚麼影響?
美國堪薩斯大學兩位專攻兒童語言發展的科學家,於80年代做了一個實驗,研究0至3歲的語言環境,對幼兒將來的智力發展以及學習能力會有甚麼影響。
參考資料
Hart, B., & Risley, T. (1995). Meaningful differences in the everyday experience of young American children. Baltimore: P.H. Brookes.
資料科學家面試 在 Re: [心得] 2021 外商資料科學求職心得- 看板Soft_Job 的必吃
之前在本板分享過我在 2021 年的數據分析求職經歷
我當時也找了機器學習演算法應用相關的工作
由於準備方法與數據分析領域大不相同,所以另外寫了這篇文章與大家分享經驗
尤其有很多資源是我在 Soft_Job 板找到的,也希望給這裡一點回饋
以下文章為了 PTT 排版有稍微精簡內容
部落格完整好讀版在此:
https://haosquare.com/machine-learning-2021-job-interview/
這篇文章是寫給跟我一樣「不是」資工或統計系背景的人,我將分享我從商管學士跨領域
,應徵機器學習工作投了 10 家公司的履歷、經歷了 6 場面試、最終拿到 1 家錄取的歷
程,我也寫下我遇到的機器學習面試題、以及準備方法與學習資源,希望為同樣跨領域挑
戰的讀者增加信心:非本科系是有機會拿到機器學習工作錄取的!
本文分享的工作類型,將以機器學習演算法應用為主,不包含資料分析師(Data Analyst
)、軟體工程師(Software Engineer)、或者機器學習工程師(Machine Learning
Engineer)。
---
## 求職背景與結果
我在此用條列的方式簡介自己 2021 年求職時的背景:
- 商管學院學士學歷,在校修過一些資工相關的課但是成績不佳,有修過機器學習相關專
題課
- 在手機遊戲公司擔任資料科學家兩年半,工作中機器學習的專案不多
- 曾在中研院擔任一年的研究助理,負責金融業的深度學習與推薦系統產學合作專案,沒
發過 Paper
- 會打機器學習競賽,都是國內賽事、沒有 Kaggle 成績
機器學習領域我投了海內外共 10 間公司的履歷,其中日本的 Mercari (實習)、新加坡的
騰訊、台灣的 Garena 三間公司有進入面試,最後拿到 Garena 的 Data Scientist 錄取
,以下文章都是基於這幾間的 9 場面試經驗所撰寫。
---
## 面試經驗與建議
### 程式能力
既然是機器學習工作,寫程式的能力當然是必考的,不只考程式語言特性、也考資料結構
與演算法。但是跨領域求職者也不用太擔心,有個幾乎所有工程師都知道的練習秘訣:
LeetCode!到這個網站拼命練習題目就對了。
在我的面試經驗中,機器學習工作對演算法程式題的難度要求,比軟體工程師稍微低一點
點,以 LeetCode 的難度標準來說,我面試只有遇過 Easy 跟 Medium 難度的題目,Hard
等級的考題從沒有遇到過。
對於程式題練習,我想分享最重要的技巧是:分類。演算法跟資料結構的題型,可以有很
多種分類法,包括 Linked List、Graph、Dynamic Programming 等等,練習的時候,如果
沒有分類、只是隨機選題來練,可能會變成每個分類只練習一、兩題,結果上了戰場遇到
某分類的變化題,實力卻不足以應對,練習不就白費了嗎?
因此,我的策略是在各個分類都挑出數題重要題目、有條理地練習。具體來說,我參考了
SoftJob 板友 AH Tech 在 YouTube 影片中分享的 LeetCode 分類方法與表格,在每個分
類中,我會把 Easy 到 Medium 難度而且免費的題目全部練習過,Hard 的題目則是最多只
寫一題。並且,我會幫自己設定日曆、在隔一週後複習剛練過的那個分類,因為,只要是
不熟悉的題型,即使練習過一遍,下次看到一模一樣的題目,還是有可能寫不出來!所以
請別忘了安排複習行程,如果面試題(好運地)出現看過的題目,務必要追求 100% 拿分
!
AH Tech 的分享:
https://www.youtube.com/watch?v=ucTL2ZdcyOs
我使用這些練習方法,總共只練習了約 100 題,相對於軟體工程師、的確題目數量算是少
的,我主觀認為夠用了。我通過的四場 Python 程式面試、總共近 20 題的題目中,至少
一半題目是我在這 100 題中看過的,我可以穩妥地拿分;另外一半則是用這 100 題練習
過的技巧稍微變形就能過關。我猜想,或許大家不會拿聘用資深軟體工程師的難度標準來
刁難資料科學家應徵者吧。
除了 AH Tech 的分享,我也推薦以下兩個 YouTube 頻道:
花花醬的 LeetCode 解題:
https://www.youtube.com/channel/UC5xDNEcvb1vgw3lE21Ack2Q
安妮在本板的解題技巧分享:
https://www.youtube.com/watch?v=fyf-GRH1Ceo
---
### 機器學習技術問題
機器學習領域的專業知識問題,範圍超級廣,從 20 世紀就提出的模型、到前兩個月剛發
表的新論文,都有可能是面試會問到的。為了更有效率地準備,我蒐集了許多人的面試經
驗、也整理自己的面試經歷後,總結出最重要的準備要點是:"Why A, not B?"
資料科學家會用到機器學習模型的時機,是針對一個定義好的商業問題,選擇一個適合的
模型。因此,面試中會考驗應徵者,是否了解模型的特性、以及不同模型選擇可能造成的
差異。
舉例來說,常見的面試題像是:
- L1 與 L2 Regularization 有什麼不同?
- DenseNet 與 VGGNet 有什麼差別?
- 為何你在履歷中的專案經驗使用 Random Forest 而不用 XGBoost?
- Trasformer 在近年幾乎是顯學,它在任何場景都比 RNN 好用嗎?
- 深度學習的 Optimizer 怎麼選擇?你為什麼用 Adam?
- 遇到不平衡資料該怎麼處理,不同的處理策略之間有什麼優劣差異?
回答或介紹某個模型時,如果你把每個模型的每個元件都詳細地介紹一遍,想必要花不少
時間、面試官大概會聽到打呵欠,因此筆者認為專注回答模型的「特色」、並提出為何你
會為某場景使用 A 模型而不用 B 模型,會是其中一種有效的面試策略。
例如,當我被問到「DenseNet 與 VGGNet 的區別」,我會為每個模型只挑出幾個重要特性
來講、而不是鉅細靡遺地描述:
- VGGNet 的特色
- VGGNet 的架構與 AlexNet 相似,但是用到更少參數、且引入更多卷積層來增加非
線性關係
- 例如一層 7 乘 7 的卷積用三層 3 乘 3 卷積取代,卷積層涵蓋的圖片大小相同,
但是參數量從 49 減少到 27
- 也引入 1 乘 1 的卷積,用來增強模型對特徵非線性關係的表述
- DenseNet 的特色
- 準確度近似於 ResNet 但是參數量更少、計算效率較高
- DenseBlock 設計讓深層網路也可以看到所有淺層網路所看到的內容,在原始特徵特
別重要的場景會有更好的效果
- 在我參加過的音訊分析競賽,原始特徵對於音訊表示特別重要,所以 DenseNet 比
起其他影像辨識 CNN 模型有較好的效果
像這樣,只選幾個特色來講、每個模型都只濃縮成幾句話,兩分鐘內就可以回答完一個貌
似範圍超廣的問題。我認為,不要讓面試官聽到不耐煩、比回答的完備性重要。
---
機器學習面試問題,具體該要如何準備?任何人問我這項問題,我都會給他這個毫無創意
的回答:
> 瘋狂蒐集題目、然後背答案!
機器學習有太多重要但是容易忘記的細節,求職前沒有複習的話,上了面試戰場肯定會十
分慌張,例如:
- Vanishing gradient 是什麼意思?怎麼解決?
- 決策樹是怎麼建立的(要解釋 Information gain 與 Gini impurity)
- 隨機森林實際上是指什麼東西隨機?
- 請解釋 Precision 與 Recall 兩個 Metrics
- Batch / Layer / Group / Instance Normalization 之間的差別
- 什麼是 Bagging (Bootstrap + Aggregating)
- 請介紹深度學習會遇到的 Underflow 與 Overflow 以及建模過程怎麼看出這兩個問題
我會地毯式地到處搜索蒐集題目,記下不會的地方,整理在自己的筆記本裡,時時複習,
資源包括:
Sroy20 的 GitHub:
https://github.com/Sroy20/machine-learning-interview-questions
板上 DrTech 大大分享的 NLP 面試經驗超實用:
https://www.ptt.cc/bbs/Soft_Job/M.1565495594.A.94B.html
我得強調,上述的「背答案」策略只是為了找工作採取的不得已手段,它並不是研讀機器
學習的好方法。機器學習模型背後的數學原理毫無疑問地非常重要,資料科學家需要了解
這些數學知識才能正確使用模型,但是,面對現實吧,如果你未來兩個月內就要開始面試
,根本來不及研讀所有數學公式與細節! 那就先拼命背答案,等到找完工作,再為自己規
劃更扎實的學習方法。
---
### 專案經歷
非本科系、或者跨領域轉職找機器學習工作常有的困境,是相關作品不足,或者專案在工
作中沒有太多實際成果。而在我的面試經驗中:
> 有機器學習相關實戰成果很好,但是就算成果不多,面試官也會重視你遇到什麼困難以
及如何找出問題點並解決
我會在履歷中列出參加機器學習競賽的經驗,但是名次從沒拿過最亮眼的前三名,參加比
賽也都是國內舉辦的、不是知名的 Kaggle 國際競賽,即使如此,只要有事先梳理內容,
小型或者名次不是頂尖的比賽也非常值得在面試中分享。為了引起面試官興趣,我在整理
經歷時,會為我的比賽作品強調以下兩點:
- 比賽的困難點:資料型態哪裡複雜、遇到過的「髒資料」、過擬合問題
- 與眾不同的做法:特殊的特徵工程、或者超參數調整策略等等,就算不是第 1 名,也可
以分享自己如何從最後一名進步到前 20 名
資料科學競賽類型的作品經歷,強調的不只是建立最複雜的機器學習模型,資料觀察與清
理能力、還有為分析流程找出錯誤的 Debug 能力,也都是資料科學家所重視的,有競賽經
驗的讀者,可以透過介紹困難點、以及與眾不同做法的方式,向面試官展現出自己在不同
分析流程的實力。
---
## 非本科系到底能不能應徵機器學習工作?
在此,筆者試著回答太多人都想知道的問題:
> 不是資工系或統計系,也能做機器學習工作嗎?
我投了 10 家公司,只有 3 間履歷過關、進入面試,最後只有 1 間拿到錄取。根據這個
經驗,我會回答:可以,但是請先整理自己的心態、並且分析自己的弱點。
首先,沒有資工系學歷,找機器學習工作時就該整理好心態。就如前面分享的求職結果,
我投的台灣公司機器學習職缺,全都沒辦法進入面試關卡,我個人主觀猜想,在台灣要是
沒有資工背景、或者沒有碩士學歷,找機器學習工作時,履歷特別容易被忽略。因此我認
為,非本科系的畢業生、或者從業人員,要準備好正確心態,在台灣跨領域求職不順利的
話,不要太難過!而是該盡快練練英文能力,鼓起勇氣往新加坡、日本、澳洲、或者中國
投遞履歷,海外的職缺對碩士學歷的硬性要求相對較低,而且海外的職位總數也比台灣多
得多,履歷多一些機會被看見。
其次,雖然現在網路上開源的學習資源超多,有熱情的資料科學家們即使不是本科系也能
積極自學,但是,非本科難以自學練成的最大弱點會是:機器學習實務經驗。以筆者自己
的經驗出發,可以舉例兩個方面,第一是 MLOps,包括了後端 API 開發與串接、模型大小
與準確度之間的權衡、串流資料的 Incremental learning、還有平行化運算等等議題,在
校沒有做過大型專題、或者沒有機器學習領域的工作經驗,就很難講出 MLOps 要解決的痛
點、也不容易扎實累積 MLOps 的知識,我面試的每家公司都有問我 MLOps 相關經驗,我
也感覺得出來自己對此回答較薄弱,總會讓面試官眉頭一皺。如果你距離開始求職還有時
間,請記得為自己補充點 MLOps 知識,至少不要上了面試戰場完全講不出一個字。
第二個值得提的非本科系弱點是完整的專案開發經驗,看書與上課自學、或者透過 Kaggle
競賽練習,通常只會學到資料科學流程的建模與特徵工程,而一開始怎麼把模糊的商業問
題定義成機器學習能解決的問題、如何選擇好的訓練資料、以及模型上線後如何驗證成效
等等,都需要從頭到尾參與過一項機器學習專案開發,才能在面試中講出有見地的回答。
我有通過面試的兩間公司,都被問到「我們發現使用者有某種濫用 APP 的行為,請問你如
何用機器學習來捕捉這項行為?」或者「我們公司的主要產品是有某某特色的影像串流,
請問你會怎麼設計推薦系統來改進使用者體驗?」這類開放式系統設計問題。不害臊地說
,我運氣好在這兩間公司提問的領域有一些些相關經驗才能面試過關,因此,建議非本科
系又有志於機器學習工作的朋友,請在鑽研酷炫機器學習與深度學習模型以外,規劃時間
研究一些如上述舉例的實務議題,並且為你有興趣的公司蒐集領域知識,對此,我非常推
薦你到 PyData 的 YouTube 頻道 向全世界的高手學習他們在實戰中遇到過的問題。
## 結語
不是資工系能找到機器學習工作嗎?可以!但是,即使我自認本業外的時間花了很多力氣
鑽研機器學習與深度學習、最後也的確拿到一封機器學習工作的錄取信,我還是認為自己
還有太多資料科學知識需要加強才能跟上業界標準,拿到錄取大概是運氣與實力的成分各
佔一半,成功換了工作後也依然不敢懈怠下班後的進修。所以,對於非本科系的畢業生或
已經在工作的朋友,既然要跨領域挑戰機器學習工作,就要比一般人投入兩倍以上的努力
、好好準備!希望這篇文章分享可以給大家跨領域的準備方向與啟發。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.183.213 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1646066584.A.403.html
... <看更多>