前车之鉴:我在数据科学职位面试中犯过的5个错误

新闻
我曾经多次参加面试,却总是与offer失之交臂,后来我才发现,我在面试过程中反复地犯了几个关键错误。我从中吸取教训,最终获得了一些数据科学家岗位的入职邀请。

 本文转载自公众号“读芯术”(ID:AI_Discovery)

我曾经多次参加面试,却总是与offer失之交臂,后来我才发现,我在面试过程中反复地犯了几个关键错误。我从中吸取教训,最终获得了一些数据科学家岗位的入职邀请。

我会特别标出数据科学家要注意的错误,这些也几乎是所有面试要注意的。希望各位免受面试和犯错的煎熬,专注于提升面试技巧,一举拿下心仪公司的数据科学家岗位。

[[344991]]

谈论同一个项目

面试数据科学家时,面试官们总会问相似的问题。我原来认为要用一致的答案回复所有人,甚至觉得可以回溯引用同一个项目回答新问题。但请谨记,所有的面试官会在面试结束后相互讨论。这就意味着他们会认为你只会用同一个教育背景或者专业的数据科学项目来应对所有问题,从而做出片面的评价。

总谈论同一个项目会使你看起来经验不足,我就是活生生的例子。面试官说我不断地讲同一个案例,他们想了解其他的情况,以及我是如何处理这些问题的。

我认为用相似的答案回答类似的问题不一定是大错——这种情况下,要确保每个提问的面试官能听到你补充的新细节。但这个问题需要引起你的重视。

不知道是否所有公司都这样认为,因为我往往对某个特定的项目感到自豪并且会引用它来回答每个新问题。此外,基于同一个案例给出的答案也能让面试官全面了解我作为一名数据科学家的资质。

我的问题出在所有答案太过相似,仿佛在过去一年中仅完成了一个项目,这样当然无法打动面试官了。很难说这是一定要克服的问题,但别人提醒过我这是一个错误,所以我吸取了教训并在下次面试时改进了。

没有问足够多的问题

[[344992]]

图源:unsplash

这一问题广泛存在,并且大多公司应该也视其为失误。没有提出足够的问题说明你:

  • 对公司不感兴趣
  • 不够专注导致提不出问题
  • 过于自信
  • 不好共事

没有人想和自以为是的人共事,那些对公司、公司目标和相应数据科学项目不感兴趣的人同理。最重要的是,提不出足够的问题时,你很像是不愿聆听。不仅适用于数据科学家,所有职业领域都是如此。

自认为面试官知悉我的过往经验

我常在面试和讲故事的时候犯这个错误。面试和讲故事其实是一回事儿。我常常认为面试官了解我的项目背景信息。但他们很可能什么都不知道,有些甚至不会看你的简历。

这话也许会令你震惊,但真的只会有几个公司认真阅读你的简历——但不意味着面试前可以不管简历了,因为面试官可能会就简历上的案例询问细节。再说讲故事,在回答问题的时候你需要设定场景,给出所做项目的基本信息,告诉面试官你可以与股东和非数据科学领域人士共事。

应提及的关键信息:

  • 商业问题是什么?
  • 为什么想做这个项目?
  • 参与者有谁?(产品经理,软件工程师等)
  • 过程如何?
  • 如何完成的?
  • 在宏观商业计划中有何作用?
  • 结果如何?
  • 完成度如何?
  • 帮助到了多少人/节约了多少资本/节约了多少时间?

没有考虑业务影响

前车之鉴:我在数据科学职位面试中犯过的5个错误

图源:unsplash

承接上文的讲故事,你需要确定自己的模型能带来的业务影响。这是数据科学家常犯的错误,因为他们只关注自己的模型及其表现,却忽视了业务影响。你需要用精准且有“影响力”的方式重点介绍结果。很可能项目结果非常有影响力,但没能告知面试官。

你可以这样措辞:“我做了一个决策树模型,将人工流程自动化,节省了50%的时间和50%的成本,为优化产品提供了时间和资本。”

如果不断强调99%的准确率却不提商业影响,面试官会认为你不适合企业,更适合学术。有时,如果整个过程在某种程度上更快、更有影响力,即使降低精度也可以。假设你是雇主,你会想知道谁对企业有用。

没有概述整个数据科学过程

这一点和第一点都是别人提醒过我的——没有概述整个数据科学流程,意思是我在谈论时缺少了主要数据科学项目前后的数据工程和机器学习的组成部分。

面试官想知道:

  • 数据如何得来?
  • 怎样预处理?
  • 根据面向对象编程原则对项目做出了什么改变?
  • 怎样做的测试?
  • 怎样部署?
  • 怎样与产品融合?

这些观点可能不是你的一手经验,但是面试官明白,数据科学家不会同时是该项目的数据工程师,机器学习工程师或软件工程师。他们只是想知道你是否了解全部流程以及各个步骤由谁完成。如果正确回答了这个问题,你在公司的眼里是更为专业的数据科学角色,并且可能会学习数据科学过程的开始或结束部分。

[[344993]]

图源:unsplash

避免了这些错误也不能保证你能收到职位的邀请,但它们可能以某种方式起到效果。理解这些观点,能帮助你更好地应对面试中的问题。

 

责任编辑:赵宁宁 来源: 今日头条
相关推荐

2010-11-08 10:24:34

2015-08-31 09:33:20

2017-12-03 13:00:23

CIO商业智能

2014-02-27 09:19:13

OpenStackCloud FoundSAP

2014-05-31 15:40:46

2022-05-13 11:47:42

前端框架实践

2020-11-05 15:00:55

以太坊区块链USDT

2009-09-17 08:28:30

Windows 7兼容性

2018-01-12 14:57:06

React Nativ开发错误

2010-08-12 09:24:14

2022-03-07 15:06:14

数据泄露黑客

2019-12-17 18:11:09

跳槽那些事儿机器学习人工智能

2023-03-03 08:00:00

重采样数据集

2012-12-24 12:46:19

IT技术周刊

2011-08-11 13:11:24

准入控制

2009-09-02 08:40:01

Windows 7兼容性

2019-12-16 14:11:14

数据科学数据集数据分析

2016-09-04 15:49:46

科学方法数据中心

2016-12-19 10:05:01

数据面试题PCA

2021-12-16 06:52:33

Ceph分布式对象
点赞
收藏

51CTO技术栈公众号