从非技术背景到机器学习科学家
七年前,我是一家小型珠宝公司的运营经理。今天,我是亚马逊的一名高级应用科学家。

七年前,我是一家小型珠宝公司的运营经理,拥有政治科学学士学位。今天,我是亚马逊的一名高级应用科学家,负责构建生产人工智能和机器学习系统,并且我的收入大约是开始这段旅程之前收入的八倍。
今天的帖子是关于我是如何做到这一点的。我将逐步介绍我是如何学习必要技能的,如何获得我的第一个实习机会,以及在整个过程中获得每个新工作和晋升所需的条件。
让我们直接进入主题。
1、我如何进入机器学习领域
在这段旅程之前,我在职业生涯的前六年从事了各种不同的事情——没有任何技术性的东西。我第一次了解到数据科学和机器学习是在研究研究生院的时候。
当时是2018年,我经营着一家小型珠宝公司,我知道我需要在职业上迈出一步。但我并不知道该做什么。我的本科学位是政治学,过去曾在政治和非营利组织工作过,但很快就感到筋疲力尽。我觉得研究生院是一个不错的选择,由于我没有明确的愿景,公共政策研究似乎是一个足够好的选择。
我决定在柏林的一所公共政策学校攻读硕士学位。碰巧这所学校有一些非常相关的课程。我上了统计学、R语言编程、机器学习和深度学习的课程,所有课程都带有社会科学的重点。
虽然我的课程很好,但我知道在大萧条期间完成本科学习后,大学教育不足以找到工作。因此,我补充了大量的额外课程、书籍和项目。
除了学习之外,在学校期间,我抓住每一个机会来发展我的技能和建立人脉。我是高级统计课的助教,创办了一个数据科学俱乐部,参加了几次数据科学竞赛,并在一个数据科学非营利组织做志愿者。
所有这些额外的工作在申请我的第一份“真正”的工作时得到了回报——我会在后面详细说明——但首先,我需要一些工作经验。
这就是我获得第一个实习经历的方式。
2、我如何获得第一个实习机会
众所周知,实习机会很难获得。发布的职位非常有限,而且竞争激烈。所以我找到了一个漏洞。
我列出了柏林所有可能有数据科学团队的公司,并给它们发送了冷邮件,询问是否有实习机会。
几乎每一家都忽略了我——除了其中一家。他们邀请我去面试,并最终为我安排了一个职位。我在那里实习了一年,当我毕业时,他们给了我一个全职初级数据科学家的职位。
到目前为止,你会发现我只谈到了数据科学——但现在我是应用科学家,这意味着我负责生产机器学习系统。我现在的工作实际上更接近于机器学习工程师。这就是这段旅程的开始。
3、我的第一份“真正”的工作:Coursera
毕业后,我回到美国。我开始通过传统的途径找工作——只是在LinkedIn上申请。我一直跟踪我的求职申请,所以我知道在几个月内我申请了大约100个职位,才收到第一个不是拒绝的回复。
这个回复是Coursera的一个入门级ML导向的数据科学家职位的在家作业任务。
我完成了这个任务,我以为我完全搞砸了。但也许没有,因为被送到了招聘人员的下一轮。
在整个这个职位的面试过程中,我进行了大量的学习。我的学习文档有大约100页长,涵盖了我在研究生院和自学中学到的每一个概念,我所做的每一个项目,以及潜在行为问题的答案。
准备过程相当紧张,因为我知道这是我的唯一一次机会。
但所有这些学习在面试中都得到了回报。我准备得如此充分,以至于我猜中了一个案例研究,并能够给出一个非常扎实的回答,因为我提前已经考虑过这个问题。
但面试并没有完全顺利进行。我被给了一个非常具有挑战性的编码任务,他们让我从头开始编写正则化逻辑回归。当时这完全超出了我的能力范围,所以我做了两件事:
- 在面试期间,我逐步解释了正则化逻辑回归是如何工作的,以及我所能记得的所有相关细节,这些细节对于解决问题很重要。
- 面试后,我整个周末实际解决了这个问题,并将它发给了我的面试官,只是请求反馈。这发生在ChatGPT之前,也没有真正的资源可以复制,所以这是一个大项目。
我不确定这些步骤是否有所帮助,但我得到了这份工作。当他们给我提供工作时,他们提到他们欣赏我所做的所有额外工作,包括志愿服务和数据科学俱乐部的工作。结果证明这也得到了回报。
在Coursera工作是我第一次接触到生产系统。最初的几个月学习曲线很陡峭。我在周末学习并投入额外的时间来跟上进度。
但大约六个月后,我终于感到自信了。我建立了第一个生产模型,并实际做出了重要的贡献。
我构建了一个全新的深度学习模型来取代团队中的核心模型之一,管理了一些大规模项目与人工标注团队,最终在加入后的约一年半后,我从数据科学家I升职为数据科学家II。
我真的很喜欢在Coursera工作,但有一件事我不喜欢的是薪资。我不是说它比我在科技行业之前赚得少,但我知道其他公司支付的薪水要高得多。所以我又开始寻找工作。
结果,进行这次求职是我做过的最明智的财务决定之一。让我告诉你原因。
4、加入Twitch/Amazon
在Coursera时,我的正式职位是数据科学家II,机器学习。2022年1月,我申请了Twitch的相同职位。
我一段时间没有收到回复。我想直到三月我才完成了第一个在家的SQL作业,四月进行了现场面试。
我以与Coursera相似的方式准备了这次面试——几周的学习,此时我已经积累了数百页的学习材料。再次成功,因为我幸运地再次猜中了一个案例研究,因为我的准备工作。
Twitch属于亚马逊,所以他们提供的薪水是我在Coursera时的两倍,我跳槽了。
我在这里工作的最初几周是一堂不同公司职位名称差异的课程。在Coursera时,我负责整个机器学习生命周期,从探索性数据分析到部署和超越。
在Twitch时,我是我团队的第一位机器学习招聘人员。因此,没有生产模型——甚至没有建立它们的基础架构。
出于必要,我在Twitch的第一个工作是建立这种基础架构并扩大团队正在进行的工作规模。这对我来说很有挑战性,因为我没有计算机科学或软件工程背景。此外,亚马逊的系统和安全要求非常复杂。但几个月后,我做到了,我们启动了第一个模型。
我所做的工作与其他Twitch数据科学家非常不同,他们通常更专注于分析和实验。后来我意识到,实际上还有一个更适合我的职位系列——应用科学家。
亚马逊的应用科学家是数据科学家、MLE和研究科学家的混合体。该角色期望能够原型设计和验证新算法,并将这些解决方案投入生产。
大约在Twitch工作一年半后,我转到了另一个职位系列,这样我的职位名称就能更准确地反映我所做的工作。但我留在了同一级别(L5)。达到L6,即高级应用科学家,是另一个完全不同的挑战。
5、晋升为高级的路径
亚马逊L6应用科学家的职位指南相当令人畏惧。我非常不确定我是否能获得晋升,或者什么时候能获得。
为了提供一些背景,通常的资格包括:
- 计算机科学、机器学习、统计学或相关技术领域的博士学位。
- 博士学位之后至少三年的应用研究经验,或硕士学位后六年以上的经验,包括在商业环境中构建和部署机器学习模型。
- 强大的Python、Java或其他相关语言的编程技能。
- 有深度学习、自然语言处理、强化学习或生成式AI等机器学习领域的经验,通常在某个领域有专长。
- 展示出领导项目、影响团队和交付可扩展解决方案的能力。
- 并且发表论文和专利是有价值的,尽管根据职位重点的不同,它们并非总是必需的。
以下是我如何用社会科学研究的硕士学位和大部分自学的技术技能做到这一点。
如我之前所说,当我加入团队时,我们缺乏生产机器学习系统所需的基础架构。我主动建立了这一基础——设置开发环境、云基础设施、设计机器学习流水线,并创建了文档,使大约20名其他数据科学家能够使用这些工具。
在建立基础之后,我识别并领导了几个解决基本业务挑战的项目。例如,我开发了一种使用LLM的新方法来解决之前无法解决的内容理解问题。这项工作在多个不同的团队中产生了显著的业务影响。
在整个过程中,我创建了全面的文档,举办了培训会议,并积极指导团队成员了解新技术和最佳实践。这使我不仅在自己的职责范围内,还作为技术领导者确立了自己的地位。
实际的晋升过程涉及详细记录这些成就,收集利益相关者的反馈,并让高级领导审查我的工作。我的经理在整个过程中给予了极大的支持,帮助我识别展示影响力的机会,并在我合适的时候为我争取。
关键是持续地交付超出自己水平的工作——独立解决复杂的问题,领导对多个团队产生影响的技术倡议,并在获得职称之前,确立自己可以信赖地承担高级职责的形象。
这就是我今天到达这里的方式!
原文链接:How I Went from Non-Tech to Senior Machine Learning Scientist at Amazon
汇智网翻译整理,转载请标明出处
