DeepX的AI加速器能够脱颖而出吗?

在评估ai硬件时,规格竞赛(能效、性能和对各种算法的支持)绝对是重要的。
但是,当系统公司把在gpu上开发的ai模型移植到其他类型的硬件时发生的精度损失怎么处理呢?这就是deepx的特色。
上周,ai芯片初创公司deepx的创始人lokwon kim,在加州santa clara的展会上推出了一系列ai加速器。kim声称,这些芯片将实现“无处不在的ai,人人可用的ai。”
kim选择了嵌入式视觉峰会作为他的首次公开亮相。需明确的是,deepx是一个刚加入这个拥挤赛道的初创公司。然而,deepx在韩国却有着深厚的根基。通过向韩国政府积极地营销,kim已经把deepx在ai领域的研发变成了一个国家项目。
deepx从政府那里筹集了4000万美元,还在韩国的风投圈中筹集了2000万美元。根据kim的说法,今年晚些时候将计划进行b轮融资。
deepx正在推出一系列用于边缘设备嵌入式视觉产品的ai加速器。它还开发了包括编译器和运行时在内的软件开发套件dxnn。deepx认为dxnn是其皇冠上的明珠。
据报道,dxnn可以简化深度学习模型部署到deepx的ai soc的过程。其编译器提供了高性能量化、模型优化和npu推理编译的工具。其运行时包括npu设备驱动程序、带有api的运行时和npu固件。
最重要的是,该公司声称,dxnn支持“以浮点格式训练的dnn模型的自动量化”。
deepx并没有凭空创造出其ai硬件架构。kim说,自2016年创立公司以来,“我们实际上已经与数百家全球公司坐下来进行了面谈。”
kim观察到,“可扩展性、ai精度以及功率/性能效率”是边缘ai系统开发者一直在苦苦挣扎的三个领域。deepx的目标是在其ai加速器上实现gpu级的ai精度,同时提供高吞吐量和低功耗。  
deepx的源起
在deepx之前,kim是apple的ap的首席设计师,参与开发了a10、a11 bionic和a12 bionic。
kim创办deepx的灵感来源于他2010年在ibm的t.j. watson研究中心做访问学者的经历。他当时的工作是开发深度学习mpu,这是darpa指派给ibm的一个项目。
当时kim是ucla的博士生,自那以后,他一直沉迷于在mpu上运行dnn的想法。
即使在加入apple后,kim也一直坚持着自己的ai创业梦想。“我实际上已经把我的想法带给了apple的高层管理人员。”他们拒绝了,于是kim结束了在apple的工作,并返回韩国。
kim表示,他非常敬仰张忠谋。半导体行业对张忠谋的贡献有很大的感激之情。张忠谋离开美国,在台湾创办了tsmc。这个起初并不被看好的企业最终成为了全球最大的代工巨头。
kim说,tsmc对台湾的重要性(无论是经济上还是政治上)已不言而喻。通过利用ai的力量,kim希望在他的祖国取得类似的重要地位。
这是一个大胆的说法。但是kim的想法反映了这个时代。无论是好是坏,地缘政治已经成为先进半导体发展的内在因素。
战略
deepx设计了同属一系列的四款ai加速器,所有的焦点都集中在视觉应用上。其策略是为多个边缘视觉ai领域提供可扩展的解决方案。
dx-l1,适用于ip摄像头、车内监控、机器人摄像头和无人机等摄像头应用。
dx-l1包含四核risc-v、isp、mipi和视频编码器,提供12 etops的ai性能。kim指的etops是“相当于gpu的tops的性能度量标准”。
dx-l2支持3-4个摄像头的边缘ai视觉系统,提供38 etops。
dx-m1,配备了双核arm核和isp,支持10个摄像头,提供200 etops。
dx-h1,提供1600 etops,将以pcie卡的形式生产,可以部署在能够执行大规模ai操作的边缘服务器中。通过支持10,000个摄像头,dx-h1可以服务于安装了大量监控摄像头的工厂。h1具有与m1类似的双核arm核和isp模块。
所有四种芯片都由三星代工,其中l1和l2采用28nm制程。m1是14nm,h1则使用5nm工艺。价格范围从10美元(l1)、20美元(l2)到50美元(m1)和1500美元(h1)不等。  
准确性
除了提供低功耗和性能效率外,deepx还将资源集中在量化工作上,以保证gpu级的准确性。
基于自身经验,deepx专注于解决准确性降低的问题上。kim指出,将原本在浮点格式gpu上训练的ai模型移植到其它硬件上,都会导致准确性降低。
因此,deepx的团队寻找了每个数据路径中准确性降低的点。结果就是deepx在其sdk,即dxnn中称之为“世界顶级的量化器”。
市场细分
过去几年中,许多ai硬件创业公司被汽车行业所诱惑,梦想着他们的ai芯片将成为下一代车辆平台的计算机大脑。
相反,kim得出的结论是,对于一家初创公司来说,向车厂销售ai芯片是一个糟糕的选择。因为汽车芯片需要经过漫长的验证时间,asil b和c等认证作业增加了很多困难。即使解决了这些障碍,芯片销量也微乎其微。
相反,kim的策略是与车厂合作,为deepx mpu授权ip,包括软件。kim解释说,deepx一直被oem忽视,现在却开始收到oem要求评估deepx芯片的请求。
这可能意味着两件事。
首先,许多欧洲车厂向kim暗示,他们对下一代车辆平台仍未做出决定。
其次,一些领先的车厂已经投入资源使用nvidia的gpu开发自己的ai模型。但现在,当他们将模型移植到其他硬件上时,准确性降低问题正在出现。这迫使他们重新寻找另一种ai硬件解决方案。
kim表示,deepx只会为车厂提供ip授权。对于其他应用领域,其业务模式则是直接销售芯片。
kim表示,deepx的ai芯片的最佳应用场景是机器人,无论是配送机器人还是在工厂内作业的机器人。
nvidia显然已经通过gpu赢得了ai市场。然而,ai竞赛的下一章或许在于如何将在gpu上训练的ai模型有效地移植到非gpu硬件上。


年度技术引领!望繁信科技入选GAIR 2023 GPT Pioneer 5
长虹CN-5机芯电源原理及维修
汽车总线向CAN FD升级 需要简化设计并降低成本
最先被AI革命的是AI工程师?
贴片电感器烧坏的原因分析
DeepX的AI加速器能够脱颖而出吗?
PID到底是什么PID的本质详细分析
双重角度梳理工业互联网创新发展模式
数字电位计可实现开关模式电源的快速线性调整
苹果连续互通功能:实现多设备间无缝复制粘贴,提升工作效率
到2031年,技术将在网络安全领域取代人类
洲明科技发布AI+多显示终端技术,推动LED行业数字化、智能化升级
无线传输技术优势以及传输构成详解
什么是磁力链接?如何用Python获取磁力种子?
Xencelabs 新数位板现已上市,为创意再添一笔
N3055功放引脚图和电路图 2N3055晶体管的工作原理和应用电路
电机芯片也开源 意法半导体展示入门套件
会议邀请 | 5月30日-6月1日127展位,纳特通信邀您相约2023中国电磁兼容展暨峰会
百度下场造车,谁将是赢家?
国产手机“扛把子”华为mate9/小米note2/5s/一加3T/魅族pro6plus,每一部都堪称机皇