原文:
towardsdatascience.com/how-to-transition-from-physics-to-data-science-a-comprehensive-guide-ff1951090f65
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/1c1c7e7857b99af1622b83ef278b3d6a.png
来源:DALL·E
你好!
我经常被问到从物理学转向数据科学、数据分析或机器学习的问题,尤其是学生和该领域的新手。考虑到我经常被问到这个问题,我认为分享我的经验和见解对这个话题会有所帮助。希望这篇文章对您有所帮助!
我的名字是 Sara,我拥有物理学硕士学位。目前,我在一家全球能源公司担任数据科学家。
在这篇文章中,我旨在与您分享我进入数据科学职业道路的个人经历,并提供一些从物理学转向数据科学领域的实用技巧和建议。
内容:
1- 为什么选择物理学?
2- 为什么对数据科学/机器学习感兴趣?
3- 物理学和数据科学实际上是如何相似的
4- 为什么物理学家在数据科学中表现出色
5- 如何开始转变
5.1 定义你的目标
5.2 定义你的策略
6- 如何开始学习?
7- 如何开始展示你的经验?
8- 找到工作
制作一份出色的简历和求职信
实习
9- 其他技巧和观察
你好!
我的名字是Sara Nóbrega,我是一名专注于 AI 工程的数据科学家。我拥有物理学硕士学位,后来转向了令人兴奋的数据科学领域。
我在这里写关于数据科学、人工智能和这些领域的职业建议。如果您想了解更多,请确保您订阅并**关注我**
为什么选择物理学?
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/ea80fd5c6c2ec6c87fdf95e287550ac4.png
来源:Unsplash
和许多学习物理学的人一样,我选择这个研究领域是因为我对周围世界的深刻渴望。
受到诸如“我们从哪里来?”、“宇宙是如何开始的?”、“时间和空间的本质是什么?”等问题驱使,并且作为爱因斯坦理论的粉丝,我决定在大学学习物理学。
或许你们中的一些人可以感同身受。在我的同事中,动机各不相同——有些人被天体物理学吸引,有些人被粒子物理学吸引,等等。是什么吸引了你进入你的研究领域?是宇宙的好奇心,还是其他完全不同的事情?
我并不知道我的物理学之旅会把我引向何方,而且我感觉到我的许多同事也有同样的不确定性。
为什么对数据科学/机器学习感兴趣?
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/eabee71099a97aac9e598ed7c15eb5e6.png
来源:Unsplash
在 2019 年完成我的本科学位后,我被介绍到数据科学,当时它被称为“世界上最性感的工作”。数据科学需求旺盛,并且越来越受欢迎,至少在我居住的欧洲是这样。
我必须做出选择:要么在硕士阶段学习天体物理学,要么转向数据科学。令人惊讶的是,我仍然选择了天体物理学,因为这是我童年的梦想。
然而,我也利用了大学里的一次机会,允许学生从其他研究生课程中选择课程,所以我能够在两个领域之间平衡我的学习。
所以,我就这样做了。我一半的课程涵盖了诸如原始宇宙、射电天文学和宇宙学等主题,而另一半则专注于机器学习、数据科学的统计学以及学习 R 编程。我很高兴学习所有这些迷人的主题,尤其是在疫情期间,因为它帮助我分散了对世界上发生事件的注意力。
转变的一个原因是意识到,虽然物理学学位是严格和通用的,但它并没有完全装备我所有必要的工具和技能来应对今天的就业市场。此外,对于专注于物理学纯学术研究的职业道路,我并不感兴趣,因为我从未想过自己会进入学术界。
此外,数据科学职业对我来说非常吸引人。它为我提供了将我在物理学学习期间已经获得的能力应用于一个既受欢迎又适合好奇心智的领域的机会——例如 Python、数学和统计学。分析大型数据集并提取见解感觉类似于侦探或研究工作,这些角色自然地吸引了许多物理学家。
因此,推动转变的另一个动力是希望拓宽我的技能组合并增加我在就业市场上的适应性。而且我不会否认:数据科学听起来也很酷、很现代,这当然是一个吸引人的方面。😃
物理学和数据科学实际上是如何相似的
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/24d9f2db25c7e7b73504a16318779cd0.png
来源:Unsplash
我已经意识到,物理学和数据科学其实并没有那么不同。事实上,两者之间有显著的相似之处,这吸引了我进入这两个领域。
首先,物理学和数据科学在本质上都是关于理解我们所观察到的数据中的模式和结构,无论是来自实验室实验还是庞大的数据库。在核心上,每个学科都严重依赖于使用数学模型来理解复杂系统并预测未来的行为。
更重要的是,物理学所需的技能集——分析思维、问题解决、对数学概念的深刻理解等——在数据科学中也是必不可少的。这些工具帮助我们探索未知,无论是宇宙的秘密还是大数据中的隐藏见解。
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/0d33ab0903e427c2172b3b39e66e8e4b.png
展示物理和数据科学之间关键相似性的图片 | 图片由作者提供
另一个相似之处在于物理学家和数据科学家采用的方法论。我们从假设或理论开始,使用数据来测试我们的假设,并根据结果改进我们的模型。这个迭代过程既是物理学的一部分,也是机器学习的一部分。
此外,从物理学到数据科学的转变感觉很自然,因为这两个领域有一个共同的目标:以可衡量的方式解释我们周围的世界。虽然物理学可能更多地处理空间和时间的理论概念,但数据科学将类似的概念应用于更具体、更日常的问题,使抽象的概念更容易接近和应用。
你在你的领域和数据科学之间看到其他有价值的相似之处吗?我很乐意听听你的想法。
为什么物理学家在数据科学中表现出色
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/b464eba6d4dfcec79d4987d47dcc09d3.png
来源:Unsplash
在我从物理学到数据科学的道路上,我遇到了许多协同作用的时刻,突出了物理学背景不仅相关,而且在数据科学领域是一个强大的优势。
这两个领域都严重依赖于提出假设、设计实验(或模型)以及从数据中得出结论的能力。
此外,物理学通常涉及处理由实验或模拟产生的海量数据集,这需要数据管理、分析和计算技术的技能。
因此,如果你正在学习或已经学习过物理,你正走在转向数据科学的一条伟大道路上。
此外,物理学家自然具备的定量技能——如微积分、线性代数和统计分析——在数据科学中是基础性的。无论是为机器学习模型创建算法还是分析大数据的趋势,通过物理学研究获得的数学能力是不可或缺的。
但在我看来,最大的优势甚至不是你学习的复杂数学,你参加的统计课程,或者你在课程早期开始学习的编程语言。学习物理培养了一种非常独特且在许多其他学科,包括其他科学领域都不常见的问题解决思维模式。这种接近和解决复杂问题的能力是无价的,尤其是在数据科学领域,那里分析和创新解决方案至关重要。
物理学家被训练去解决一些最抽象和最具挑战性的问题,从量子力学到相对论。这种在复杂和模糊问题空间中导航的能力在数据科学中极其宝贵,因为在数据科学中,答案并不总是明确的,而且往往需要跳出思维定式来找到创新解决方案。
最后但同样重要的是,推动物理学家的好奇心——一种探索和理解未知领域的渴望——与数据科学的目标完美契合。这两个领域都依赖于发现和从数据中提取有意义的见解,无论是理解宏观宇宙还是从销售数据中预测消费者行为。
如何开始转向数据科学
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/823902dd9acabef61e8c04fd5196d28a.png
来源:Unsplash
定义你的目标
自然地,一切归结于你的个人目标。首先明确你想要实现的目标是至关重要的。问自己一些关键问题,以指导你的旅程。
你是否对数据科学中的某个特定领域感兴趣?你是想严格专注于数据科学,还是愿意探索相关角色,如机器学习工程师、数据分析师或数据工程师?
我提到这一点是因为许多人最初的目标是学习数据科学,但往往发现自己转向了相关领域,如数据工程、机器学习工程或数据分析。这是旅程的正常部分,因为人们探索和发现他们真正喜欢做的事情是很常见的,这可能会使他们转向类似领域。
研究你需要首先获得的哪些技能(更多内容将在下一节中介绍)。
此外,为自己设定清晰的时间表——你希望何时获得第一个实习机会或获得那个令人兴奋的初级职位?
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/9d384b5005537d66e5fc54f7230d56fd.png
来源:Unsplash
定义你的策略
目标明确后,制定战略计划成为下一个关键步骤。
“没有计划的目标只是个愿望。”
- 安托万·德·圣埃克苏佩里
你打算先学习哪些技能?你将如何学习它们?
在决定你想要转向哪个领域(数据科学、数据分析、数据工程、机器学习工程)之后,你可以开始研究你需要学习的技能,以实现成功。
例如,数据科学中的角色通常更侧重于 Python 和机器学习,尽管这不是一条严格的规则,可能会有所不同。相反,数据分析职位通常更侧重于 SQL 和 R。
我的个人建议?我过去经常浏览 LinkedIn 和其他平台上的职位列表,以了解哪些技能需求量大。
好奇的是,即使在两年内,我也观察到了显著的变化。例如,目前对 AI 和机器学习操作(MLOps)技能的需求正在增长,这与 AI 兴趣的持续激增相一致。
但是,在你检查大多数职位发布中列出的庞大技能列表时感到恐慌之前,让我提供一些安慰:
首先,你不需要掌握所有列出的技能、工具、框架、平台或模型。
即使你在所有这些领域都很擅长,你也不需要成为所有领域的专家。对于较低级别的职位,拥有足够的知识来有效地完成任务通常就足够了。通常,公司更重视适应性、学习的意愿和可靠性,而不是对每个工具或编程语言的精通。软技能和在职位中成长的能力与技术技能一样重要。
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/566ab2e9ecb17a4c8910583d317cd9c3.png
来源:Unsplash
如果你来自物理学背景,那么你很可能已经具备了扎实的数学和统计技能,也许还有一些编程技能以及。
回顾我的个人经历,我参与的物理课程相当严格。我应对了大学中最具挑战性的数学课程,并深入研究了概率和统计学上所有可用的课程。尽管当时(学习所有这些硬核数学)有些痛苦,但回顾起来,我对那种强烈的数学和统计训练感到无比感激。
但是,如果你的物理课程没有广泛涉及这些领域,你可能需要重新审视它们。
一旦你巩固了你的基础知识,下一步实用的行动就是探索你感兴趣的职位的工作发布,并注意所需的技能。
这就是为什么制定策略很重要的原因。
根据学习的逻辑顺序,对要优先考虑的技能进行批判性思考。例如,在没有先理解机器学习基础知识的情况下,你不会直接学习机器学习操作(MLOps),对吧?这种逐步的方法确保你在处理更高级的主题之前建立了一个坚实的基础。
如果你需要一份路线图,我推荐这个酷炫的网站。你也可以给我发消息关于这个话题 😉 。
例如,这个路线图是关于 2024 年的 AI 和数据分析的。
如何开始学习?
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/6b467b74f8b2a1e6df29720bb2f5bfbe.png
来源:DALL·E
在我的情况下,我是在攻读硕士学位期间开始学习的。如果你刚刚完成本科学位,你可能会考虑攻读数据科学硕士学位或研究生文凭。对于那些已经拥有硕士学位的人来说,研究生课程也是一个可行的选择。
除了在大学里上课,数据科学领域的许多人(大多数?)主要是自学的,通过在线课程、参与在线挑战、项目或训练营来获取技能。坦白说,如果你想在数据科学领域,自学将是你余生需要做的事情!
数据科学家持续学习新的技能、工具、框架和模型——这是职业的必要组成部分。
正因如此,在这个领域中适应性变得至关重要,这项技能可能通过学习物理已经帮助你发展了😉。
假设你想开始在线学习。你该如何实现?这相当简单。如今,有许多平台提供数据科学和机器学习的课程。DataCamp、Coursera、Udemy、edX和Khan Academy是最知名的几个。YouTube 也提供了大量学习数据科学和机器学习的内容。
个人来说,我使用了 Udemy 和 Coursera,但 DataCamp 在获取更多实用、动手技能方面特别有效。
除了上课,参与在线挑战是提升你的技能和增强你的作品集的好方法。
我个人使用的一个平台是FruitPunchAI,这是一个提供Ai 挑战的初创公司。
FruitPunch AI 为那些热衷于通过他们的AI Challenges for Good对社会和环境产生影响的个人提供了一个独特的机会。这些挑战允许参与者在其有意义的项目中发展他们的 AI 技能,同时做出真正的贡献。
这些挑战不仅让你在世界上产生真正的影响,还帮助你展示你的能力。DataCamp 还与其他知名平台如Kaggle举办比赛。
可供选择的机会很多,所以花些时间探索并找到最适合你兴趣和职业目标的那一个。
如何展示你的经验?
谈到作品集,在你掌握了一些扎实技能并参与了一些挑战之后,是时候向世界展示它们了。
自我推广对你的职业发展至关重要。这是关于在就业市场中战略性地定位自己的事情。
建立一个强大的作品集至关重要,因为它不仅展示了你的技术能力,还突出了你的解决问题的技能。
一种向世界展示你的专业自我形象的有效方式是建立一个强大的领英(LinkedIn)个人资料。领英不仅仅是一个社交平台;它是一个全球性的专业故事讲述舞台。在这里,你可以突出你的教育背景、项目经验和你带来的独特技能。
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/2a133f9617f0e74af71c05bb36ee703c.png
领英个人资料 | 图片由作者提供。
除了领英之外,GitHub对于数据科学家和技术专业人士来说是一个无价的平台。它允许你托管和审查代码,管理项目,并与数百万其他开发者一起构建软件。
我一开始工作就马上开始在 GitHub 上上传我的项目。
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c6d24e0d54b3dcf2c87fe7845c4281e9.png
GitHub | 图片由作者提供。
对于数据科学家来说,GitHub可以用来展示你的编码技能,在项目上进行合作,并管理你工作的文档。通过积极维护包含你项目的 GitHub 仓库,你展示了你的实际专业知识和对你所在领域学习和发展的持续承诺。
你也可以选择在网站(通常在你有更多经验时)上展示你的工作,而不是 GitHub。
寻找工作
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/399f43c0b142bb47a6d20ac59baf9b43.png
来源:DALL·E
假设你已经开始学习技能,也许你已经完成了一到两个相关项目,并且你已经完善了你的领英(LinkedIn)个人资料。现在是你找工作的时候了!
制作一份出色的简历和求职信
为你申请的每个职位制作一份定制化的出色简历和求职信至关重要。这需要做一些研究来了解每个特定角色中使简历和求职信脱颖而出的具体因素。
抽出时间仔细阅读职位描述和公司简介,以了解雇主最看重的技能和经验。确保你的简历展示出你的相关经验,并且你的求职信清楚地解释为什么你是这个职位的理想人选。
个性化你的申请不仅显示了你对这个职位的兴趣,还表明你已经努力与雇主的需求保持一致。别忘了在简历中包含你的领英和 GitHub 个人资料链接哦 😉。
实习
为了开始我的数据科学之旅,我在两个不同的国家进行了两次不同的实习。除了丰富我的简历外,出国还向潜在雇主展示了我的适应能力和愿意走出舒适区的意愿。此外,出国也是展示你的英语语言技能(如果你不是以英语为母语)的好方法。
个人而言,我在领英上寻找实习机会,但还有许多其他求职平台。
如果职位在公司网站上列出,我建议你直接在公司网站上申请,因为这样有时可以增加你的申请在招聘团队中的可见度。
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/dad2b017ccb1388b3a2c282daf6fe40a.png
来源:Unsplash
在申请了几个职位后,我收到了一两个回复,经历了面试过程,并最终获得了一个职位。
通常,实习不涉及深入的技术面试;然而,它们可以是这个过程的一部分,特别是如果你正在申请竞争激烈的公司,如像谷歌或 Spotify 这样的主要公司)。
在面试中,他们问我在大学期间学到了什么,还要求我展示一个或两个我参与过的项目,以及其他问题。
这确实显示了为什么拥有一个坚实的作品集如此重要。能够有效地展示和解释你的项目至关重要,因为他们经常询问你为什么选择一个模型而不是另一个,以及你是如何在你项目中的特定挑战中采取方法的。
我还向他们展示了我在硕士学位期间完成的某些项目,更具体地说是在机器学习课程中。我还提到了我的硕士论文,其中涉及编码和深入的问题解决。此外,我还提到了我参与的在线挑战。一切都有价值!在第二次实习的面试中,我展示了我在第一次实习期间完成的项目。这就是你如何构建基础并在数据科学职业生涯中逐步成长的方法!
注意:你也可以展示你在课程中完成的物理项目。特别是如果它们涉及大量的编程、数学、统计学,尤其是问题解决和批判性思维技能,我相信这些技能是必不可少的!
在我自己的经历中,我觉得参与学术以外的活动也有助于我获得实习机会。例如,我给高中生上了 3 年的私教课,并确保突出这一经历。此外,我还参与了各种组织的志愿服务,这在你的简历和求职信中总是值得提及的。
你可能一开始没有什么可以展示的,但一旦你可以展示一个项目或挑战,你就可以利用它来为你的简历构建更多内容。从那里开始,你的经验和成就开始累积,为你提供了越来越多可以提供给潜在雇主的东西。
与选择实习相比,有些人可能更喜欢直接跳到初级或中级职位,特别是如果他们已经在其他领域拥有工作经验。这也是一条完全可行的道路!
您知道哪种工作环境最适合您吗?您在初创公司、企业环境,还是学术环境中更有效率?了解这一点也可以在您寻找工作时指导您定位合适的组织。当然,对各种选择持开放态度也是完全可以的,因为每种选择都可以提供独特的优势和成长机会。
最终观点和技巧 💡
在就业市场上,对有物理学背景的人有很高的评价。强大的数学和统计学技能,加上卓越的问题解决能力,使物理学家在各个行业中都非常受欢迎。物理学毕业生通常被视为适应性强且分析能力强,这使得他们在任何领域都是顶级候选人!
如果您正在学习物理学,您天生就是一个问题解决者,自然适应性强,好奇且坚韧。即使您认为自己没有这些品质,请相信我,您确实有。
在撰写您的求职信和简历时,务必突出您作为问题解决者、适应性强、好奇和坚韧的品质。强调您作为物理学学生或毕业生的培训已经磨练了这些特点。为您的物理学背景感到自豪——明确表示它是在您的职业追求中的重大优势。
记住,对于数据科学领域来说,由来自各种背景的专业人士组成是完全正常且有益的。
专注于质量而非数量:在构建您的作品集时,优先考虑参与相关项目和在线挑战,这些项目也符合您的职业目标。
https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/fdc1446cdeca25cc052a4b99cb24edfc.png
来源:Unsplash
这是一段旅程。过渡不会一夜之间或一个月内发生。确保享受这段旅程,保持好奇心,享受学习。
记住,即使在数据科学领域工作多年的人也在持续学习。最终,你会达到一个你对自己技能和知识有信心的点,那时你将能够与他人分享你的专业知识。
我相信这篇文章没有涵盖很多其他建议。如果您有任何具体问题,请给我发消息,我会很乐意帮助您。
此外,如果您需要帮助建立您的在线存在感,决定哪些项目值得投入时间,或者如果您正在寻找过渡路线图,请不要犹豫,通过LinkedIn给我发消息。
在这篇文章中,有没有您希望我深入探讨的特定主题?如果有,请在评论中告诉我!
您是从物理学或其他领域过渡到数据科学的吗?您面临的主要挑战是什么?在评论中分享它!
感谢您的阅读!如果您想支持我的工作,您可以买我最喜欢的咖啡:卡布奇诺。😊
在这里预约与我通话,向我提问或发送你的简历:
- 1:1 导师辅导和简历审查
其他资源:
Sara 的数据科学免费资源
你是否处理过时间序列数据?那么你必须查看下面的文章!
寻找时间序列数据中异常值的终极指南(第一部分)
查看我开发的一个**新颖的异常检测方法**:
下一级异常检测:解锁神经洞察
我的名字是 Sara Nóbrega,我是一名具有物理学和天体物理学背景的数据科学家。我对人工智能、MLOps、智能城市、可持续性、宇宙学和人权充满热情。