除Google、Facebook以外的公司们,该如何打造自己的机器学习团队?

除google、facebook以外的公司们,该如何打造自己的机器学习团队?作者给出了自己的建议:小公司,雇用擅长工程和数据的ml人才;中型公司,聘请一位优秀的机器学习研究人员,雇佣更多的机器学习工程师,协同增效,各尽其职;大公司,避免从头建立自己的机器学习基础设施,鼓励工程师掌握机器学习。
最近,来自不同规模、不同行业的朋友一直问我同样的问题:
“我如何将机器学习应用到我的公司里?”
这些人知道充分利用机会学习的话会得到甜头。而这里面每个人的困境都是如何将其转换成现实,如何发挥作用,如何雇用人员并获得成功。
所以,我根据这些公司不同的业务规模,给予不同的建议:
当你只是个小团队…
以下是我对处于早期创业阶段的公司或非盈利机构关于如何打造机器学习团队的建议:
对于一家小型的、没有资金或资金不足的公司来说,在企业内部获得机器学习专业知识应该是不可能的。但好消息是,许多机器学习从业者都对这种工作感到兴奋。
寻找那些关心公司使命的人。在这个规模上,您将依靠您的机器学习从业者实现从数据收集和清理到部署的端到端的一切。
雇用工程和数据专业的人才肯定是小企业的首选。那些已经返回校园或者线上工作的经验丰富的工程师可以顺利完成这些工作。因为目标并非完美,所以要让系统端到端工作,然后慢慢优化所有步骤。如果是我选择候选人,我会选择简历里展示了参加一些kaggle比赛或自我导向的项目,开朗务实的人也是好的选择。那些希望在构建和测试模型之前将一种模型应用于所有内容,或者想要花费数月优化数据管道的研究人员却不是合适的人选。
当你已经发展成了一个中型公司…
当那些对机器学习应用程序感兴趣的不初创公司或中型企业建立机器ml团队时,我建议他们采取略微不同的方法。与谷歌不同,你不能雇用很多研究人员,因为你不需要他们来撰写研究论文。
成功组建团队的关键是聘请一位非常优秀的机器学习研究人员,并让他与数据工程师合作,以提高他们的工作效率。这样的人才就像珍贵的宝藏,请不要让他们编写代码,把他们安排在想要学习机器学习的工程师中,实现“王者带青铜”。
一些公司建立了一个功能性的机器学习小组,而一些公司将机器学习嵌入到团队中。很多人对此褒贬不一,但我必须实事求是地说,这两种组织结构都有效。
一个机器学习团队如何真正帮助人才?这通常是最大的瓶颈。您需要仔细管理团队,以确保他们正在为公司执行最相关的任务。在整个组织中合理分配机器学习专业知识是很实用的,因为这样机器学习专家就可以接近最终用户,但它也会使招聘更加困难。
雇用更多的机器学习工程师而不是机器学习科学家,并且保证分配给他们的任务是匹配适合的,这点至关重要。
通常来讲,机器学习团队进行算法优化的操作通常与商业需求并不相符。如果没有一个有效的端到端系统,这种错位可能会长达数月。另一个常见问题是需要更改或更新训练数据,但在训练和部署算法之前人们往往不会发现数据需要更新。因此,在更新数据之前,让端到端系统尽可能快地进行就变得至关重要。
成为大公司后,也有困境…
与很多大公司合作,我一次又一次地看到了相同的错误。在这个范围内,一家公司能够雇用优质的ml人才,但没有更多预算与行业巨头竞争。
facebook和谷歌的精英团队正在使用标准的开源模型和架构。最近,我与许多财富500强企业进交谈时发现,这些企业正在建立自己的神经网络架构而不测试是否有必要这样做。
机器学习研究人员喜欢做研究,而管理者则欺骗自己:研究人员正在构建有价值的ip。事实上,他们并非如此。他们浪费了大量的时间来进行一些重复的事情,而那段时间最好花在最新的尖端模型上。最好从最简单,最标准的事物和层着手,每增加一部分都应该保证能对算法的性能产生重大影响。
大公司应避免建立自己的机器学习基础设施。我与之交谈的所有科技公司几乎都在建立自己的定制机器学习堆栈,并且感到非常兴奋。使用开源工具比构建和维护自定义基础架构更具可持续性。
大公司应该培训他们的工程师进行机器学习。工程师非常渴望学习机器学习,如今的基础工具使得这个想法变得更容易。在这一点上,我认为培训工程师学习机器学习比培训机器学习从业者如何成为优秀的工程师更有效率。无论如何,具有一些机器学习培训的工程师可以通过多种渠道发挥作用。一些公司正在这样做,但我很惊讶更多的公司没有明白这一点。

建立机器学习团队真的值得吗?
招聘ml团队既昂贵又需要大量工作。一些公司雇用一支ml团队,但目的只是为投资者检查一些设备,这就太浪费资源了。无论公司的规模如何,如果没有明确的机器学习应用程序,这家公司必然会后悔进行这项投资。所以,组建之前,要问自己的关键问题是:
1)我有需要通过机器学习才能解决的问题吗?
2)我可以获取相关的培训数据吗?
3)我试图解决的问题对我的业务至关重要吗?
如果你对所有这些问题回答“是”,那么就可以着手准备了。

蓝牙耳机什么牌子好?年度性能最强的五款蓝牙耳机
新功能发布 | TSMaster诊断功能之基础诊断配置
智能照明控制系统的设计与应用案例解析
米粉节小米新品来袭:红米Note4X高配版、红米Pro2、小米平板3、小米电视4,米粉节狂欢周等你来约!
表面结构单元对纳米材料表面性质和形貌的影响
除Google、Facebook以外的公司们,该如何打造自己的机器学习团队?
美芯片巨头:失去最大客户华为 公司处境非常艰难
模拟数字转换器(ADC)的工作原理
构成堆叠式PCB的设计层是什么?
iPhone6s电池更换苹果解决方案:问题背后满满都是套路啊
由于COVID-19的影响,IT在服务器和存储上的支出将急剧下降
无人机与环保业珠联璧合,两者融合发展前景可期
Oculus Rift消费者版来啦,我们也来说说虚拟现实技术
msp432介绍_msp432的特点
沃尔玛推出3D虚拟购物之旅
越来越厉害了!三星将展示世界首款可伸展OLED显示屏
AT2401C可以PIN TO PIN完美代替使用,对频率带宽而言的解决方案
台积电透露,明年第1季将进行5纳米制程风险性试产,再度领先全球
电子自锁互锁开关电路
国外牛人制作机器人全过程