本文共 2496 字,大约阅读时间需要 8 分钟。
雷锋网(公众号:雷锋网) AI 科技评论按:如何找到一份机器学习的工作?对于这个问题, SharpestMindsAI 创始人、物理学家和机器学习专家 Edouard Harris 写了一篇博客,雷锋网 AI 科技评论整理。
我是一个在 YC 初创公司工作的物理学家。我们的工作是帮助刚毕业的学生得到他们的第一份机器学习工作。
前一段时间,我写了一篇关于如何才能获得第一份机器学习工作的文章。我在那篇文章中说,有一件你应该做的事是建立个人机器学习项目。但我并没有说明如何去做这件事,所以在这篇文章里,我会告诉你怎么做。
由于工作原因,我看到过成百上千的个人项目的例子,它们有的非常好,有的很糟糕。下面我将给你讲讲其中的两个非常好的项目。
全力以赴地投入项目
下面是一个真实的故事,只是为了保护隐私,我改了名字。
当杂货店需要更新库存的时候,X 公司使会用人工智能去提醒它们。我们有一个名叫 Ron 的学生,他真的很想去 X 公司工作。Ron 实在是太想去 X 公司工作了,因此,他投入所有的精力建立了一个个人项目,这个项目让他得到了 X 公司的面试机会。
像这样全力以赴地为进入一家公司做准备是一件冒险的事情,我们通常不建议这样做。但是我在前面说过,Ron 真的非常想去 X 公司工作。
那么 Ron 建立了一个什么样的个人项目?
红色的矩形框表示缺货
Ron 先把手机绑到购物车上,之后他推着购物车在杂货店的过道上来回走动,同时用相机把杂货店的货架拍摄下来。他在不同的杂货店做了 10 到 12 次这样的工作。
Ron 一到家,就开始着手建立机器学习模型。他的模型可以识别出杂货店货架上没有货物的地方,这些地方的玉米片(或其他东西)被拿走了。
Ron 在 GitHub 上实时构建模型,并完全公开。每天,他都会对自己的模型进行改进来提高它的准确性,并记录其中的变化。
当注意到 Ron 所做的事情时,X 公司表现出了极大的兴趣。事实上,X 公司甚至对此感到紧张。他们为什么会紧张?因为 Ron 不知不觉地在几天内重构了他们的专有的技术栈的一部分。
X 公司实力强劲,他们的技术在同行业中首屈一指。尽管如此,在 4 天之内,Ron 的项目已经引起了 X 公司 CEO 的注意。
试验项目
这是另一个真实的故事。
Alex 是历史系的学生,同时他辅修了俄语研究。不同于其他历史专业的学生,他对机器学习特别感兴趣。更不寻常的是,尽管从未写过一行 Python 代码,他决定去学习机器学习。
Alex 选择通过实践来学习。他决定建立一个分类器来检测飞机上的飞行员是否失去意识。Alex 想通过观看飞行员的视频来探索这个问题。人们很容易通过观察就能判断一个飞行员是否失去意识,所以 Alex 认为机器也有可能做到这一点。
以下是 Alex 花了几个月做的事情:
Alex 的意识丧失感应探测器模型 G-force
Alex 在 YouTube 上下载了从驾驶舱里拍摄的飞行员驾驶飞机的每个视频片段。
接下来,他开始标记数据。Alex 创建了一个 UI,他可以在上面滚动观看数千个视频片段,这个 UI 上有两个按钮,按其中一个按钮显示「有意识」,按另一个按钮显示「无意识」。按下按钮后,当前视频片段会被自动保存在正确标记的文件夹中。这个过程非常无聊,花了他很多很多天的时间。
Alex 为这些图像建立了一条数据管道,可以将飞行员从驾驶舱的背景中裁剪出来,以便使他的分类器更容易地将注意力集中在飞行员身上。最后,他建立了他的意识丧失分类器。
在做这些工作的同时,Alex 也在社交活动中向招聘经理展示他项目的照片。每次当他拿出手机展示他的项目时间,他们问会他是怎么做到这些的,关于他如何建造管道,以及他如何收集数据。但是他们从来没有抽出时间去问过他的模型的精确度--低于 50%。
Alex 当然打算提高他的准确性,但是在做这个事情之前他就被录用了。事实证明,他的项目所带来的视觉冲击,以及他在数据收集方面不屈不挠、足智多谋的特质,对公司来说比他的模型实际有多好更重要。
我提过 Alex 是主修历史辅修俄语研究吗?
他们有什么共同点?
是什么让 Ron 和 Alex 如此成功?因为他们做到了下面四点:
Ron 和 Alex 没有花太多精力去建模。我知道这听起来很奇怪,但是对于现在许多用例来说,建模是一个已经解决的问题。在真正的工作中,除非你做的是最先进的人工智能研究,否则无论如何,你将花费 80-90% 的时间来清理数据。是什么让你的个人项目与众不同?
Ron和Alex收集了他们自己的数据。正因为如此,它们最终得到的数据比 Kaggle 或 UCI 数据库中的数据更混乱。但是这些混乱的数据教会了他们如何处理混乱数据。相比从学术服务器下载数据,这种方式让他们更好地理解了他们的数据。
Ron 和 Alex 创造了可以被看到的东西。面试不是让你的技能被一个通晓一切的面试官客观地评估,而是一个向别人推销自己的过程。人类是视觉动物。所以,拿出你的手机,向面试官展示你所做的一切吧,确保你所做的看起来很有趣是值得的。
Ron 和 Alex 的所作所为看起来很疯狂,实际上也很疯狂。一般人不会把手机绑在购物车上。普通人不会花时间从 YouTube 视频中裁剪飞行员,你知道谁会干这种事情吗?想尽所有办法都要达到目标的人。而公司真的很想雇佣这些人。
Ron 和 Alex 看起来似乎做了太多的工作,但实际上,这并不比你在一份真正的工作中所需要做的事情多。这就是最关键的一点:当你没有做 X 的工作经验时,招聘经理会从你做过的事情中寻找那些和 X 相关的事情。
幸运的是,你只需要构建一两个项目---Ron 和 Alex 的项目在他们所有的面试中被反复使用。
因此,如果要我用一句话概括一个伟大的机器学习项目的秘密,那就是:构建一个带有一个有趣的数据集的项目,这个数据集必须是花费了显而易见的努力收集来的,并使这个项目尽可能给人以深刻的视觉印象。
雷锋网
雷锋网版权文章,未经授权禁止转载。详情见转载须知。