04_短期上岸美国大厂DS intern的经验和准备资料
04_短期上岸美国大厂DS intern的经验和准备资料 (English Translation Coming Soon)
短期上岸美国大厂DS intern的经验和准备资料
秋招季真的已经开始了!时间真的不多了,对于我们这些想在美国找个DS实习的留学生来说,现在就是冲刺的黄金时刻。说实话,每年这个时候我都焦虑得不行,感觉再不抓紧就来不及了。朋友圈里,A同学晒出了meta的面试邀请,B同学已经拿到了亚麻的offer,再看看自己,简历还没改到最满意,Kaggle比赛刚打了一半,心里那叫一个急啊。踩过坑的人都知道,准备DS实习这事儿,战线不能拉太长,但每一步都得踩扎实了。今天就跟大家掏心窝子聊聊,怎么在有限的时间里,高效准备,争取一举拿下大厂的DS intern offer。
首先,简历关是第一道坎,也是最难的一道。你的简历就是你的敲门砖,尤其是在海投阶段,HR可能就花几秒钟扫一眼,而且现在很多公司都用ATS (Applicant Tracking System) 来筛选简历,如果你的简历上没有匹配到JD里的keywords,可能连HR的面都见不到。所以,简历上一定要突出重点,把最亮眼的部分放在最前面。对于我们DS岗来说,最重要的就是Projects和Skills。我当时的简历,就把项目经历放在了教育背景之后,紧接着就是技能清单。项目经历这块,千万别写得像个流水账,一定要用STAR原则(Situation, Task, Action, Result)来写,突出你在项目里具体做了什么,用了什么技术,最后取得了什么成果。比如,你做了一个用户流失预测项目,不能只写“负责用户流失预测模型”。你要这么写:
Situation: 公司面临用户流失率上升的问题,需要提前识别高风险用户。 Task: 我的任务是利用历史用户数据,构建一个机器学习模型来预测未来一个月内可能流失的用户。 Action: 我独立完成了数据清洗、探索性数据分析(EDA)和特征工程(Feature Engineering),对比了Logistic Regression, Random Forest, 和XGBoost三种模型,并采用SMOTE方法解决数据不平衡问题。最后,我将模型部署为一个简单的API,并用Tableau制作了一个Dashboard方便业务部门实时查看。 Result: 最终模型在测试集上的AUC达到了0.88,成功帮助业务部门识别了80%的潜在流失用户,并通过精准营销活动将流失率降低了5%。
你看,这么一写,你做了什么,怎么做的,成果如何,一目了然。说实话,一开始我的简历也写得乱七八糟,后来找了已经在Google工作的学长帮我改了三四遍,才慢慢有了样子。他告诉我,大厂的HR都喜欢看有impact的描述,你的action要能直接导致一个可以衡量的result。
技能清单这块,也别什么都往上写。一定要跟你投递的岗位JD(job Description)相匹配。现在大厂的DS岗,基本上都要求SQL和Python。SQL是重中之重,面试必考。Python的话,Pandas, NumPy, Scikit-learn这几个库一定要滚瓜烂熟。另外,像Tableau或者Power BI这种数据可视化工具,至少要会一个,因为data Storytelling的能力非常重要。如果你的目标是更偏Machine Learning的DS岗,那PyTorch, TensorFlow这些Deep Learning框架也得写上去。还有,现在很多公司都看重Cloud Computing的背景,所以如果你会用AWS, GCP或者Azure,那绝对是加分项。我还想强调一下Git,这个版本控制工具虽然看似不起眼,但却是团队协作的基础,一定要会用。
搞定了简历,下一步就是疯狂刷题。DS的面试,技术面一般分好几轮,主要考SQL, Python编程,还有就是机器学习和统计的知识。SQL题我推荐大家去刷LeetCode,上面的题目基本涵盖了所有常见的考点,比如各种JOIN, Window Functions, Subquery, CTE等等。刷题的时候,别光顾着看答案,一定要自己动手写。Python编程题的话,难度一般不会像SDE那么高,主要考的是数据处理能力,比如用Pandas做各种data Manipulation。
机器学习和统计知识这块,就得靠平时的积累了。面试官很喜欢问一些开放性的问题,比如“如何处理imbalanced data?”,“L1和L2 regularization有什么区别?”,“A/B Test的流程是怎样的?”等等。这些问题没有标准答案,主要考察你对基本概念的理解和思考深度。比如A/B Test,你不能只说把用户分成两组比较CTR。你要能讲出实验设计的完整流程,包括如何确定实验单元,如何计算样本量,如何保证实验的statistical power,以及如何分析和解读实验结果,甚至还要考虑Novelty Effect。我当时是把《The Elements of Statistical Learning》这本书翻来覆去看了好几遍,然后结合网上的一些面经和博客,自己整理了一份笔记。面试的时候,能把这些概念用自己的话讲清楚,再结合一些实际的例子,面试官就会觉得你是个有思考能力的人。不得不说,这部分准备起来最花时间,但也最能体现你的专业素养。
除了技术面,Behavior Question (BQ)也千万不能忽视。很多同学技术很牛,但就挂在了BQ上,真的非常可惜。BQ主要考察你的软技能,比如沟通能力、团队协作能力、解决问题的能力等等。准备BQ的最好方法,就是提前把自己做过的每个项目都梳理一遍,然后针对每个项目,准备几个可能会被问到的BQ问题。比如“你在项目中遇到的最大挑战是什么?”,“你和团队成员有分歧时是怎么解决的?”。回答的时候,同样要用STAR原则,讲一个完整的故事。我当时准备了大概10个左右的故事,基本覆盖了所有常见的BQ问题。面试的时候,不管面试官问什么,我都能从我的故事库里找到一个合适的例子来回答。
最后,我还想吐槽一下,找实习这事儿,心态真的很重要。中间肯定会遇到很多挫折,比如简历投出去石沉大海,面试挂了一轮又一轮。我当时也有一段时间特别emo,感觉自己什么都做不好。但后来我想明白了,找工作本来就是一个概率游戏,你唯一能做的,就是不断提升自己,然后坚持下去。每次面试挂了,我都会厚着脸皮给面试官发邮件,问问自己哪里表现得不好,然后下次改进。说实话,大部分面试官都不会回复,但只要有一个回复了,你就能学到很多东西。我记得有一次面一个我很想去的公司,自我感觉良好,结果还是挂了。当时真的挺难过的,甚至开始怀疑人生。但冷静下来之后,我复盘了整个面试过程,发现自己在一个关于causal inference的问题上答得不是很好。于是我花了一周时间,把相关的知识点重新学了一遍。后来在另一家公司的面试中,又被问到了类似的问题,这次我就答得非常有条理,最后也顺利拿到了offer。所以,失败真的不可怕,可怕的是一蹶不振。
说了这么多,感觉有点啰嗦了,但都是我的肺腑之言。希望对还在挣扎的你有所帮助。秋招不易,大家一起加油!
资源推荐:
- 刷SQL题:LeetCode。建议刷medium和hard难度的题,特别是window function相关的。DataLemur也是一个专门针对DS面试的SQL练习平台,题目更贴近实际业务。
- 统计学习基础:《The Elements of Statistical Learning》和《An Introduction to Statistical Learning》,这两本是经典教材,面试前一定要多翻翻。StatQuest with Josh Starmer的YouTube频道也超级推荐,他能把复杂的统计概念讲得非常清楚。
- 数据科学面经:Medium上有很多大神的分享,可以多搜搜看,比如Towards Data Science这个publication就有很多高质量的文章。Glassdoor上也有很多公司的面经,可以作为参考。
- 简历修改:可以找学校的career Center,或者已经在工作的学长学姐帮忙。付费的简历修改服务我没用过,感觉效果因人而异。
- 模拟面试:Pramp这个网站可以和别人免费进行模拟面试,非常推荐。可以帮你提前适应面试的节奏和压力。也可以找同学朋友一起mock,互相提意见。
#美国求职 #DataScience #数据科学 #DS实习 #大厂实习 #秋招 #留学生求职 #面试经验 #求职干货 #经验分享
