英特尔推云端AI芯片 拟联手国内厂商开发AI服务器

英特尔在中国推出云端ai训练芯片habana gaudi2,该芯片可满足大规模语言模型、多模态模型及生成式ai模型的需求。
7月11日,英特尔在中国市场推出云端ai训练芯片——habana gaudi2。该芯片可满足大规模语言模型、多模态模型及生成式ai模型的需求。据现场介绍,该芯片性能在一些关键指标上胜过英伟达a100。
据了解,该gaudi2处理器及gaudi2夹层卡hl-225b,以第一代gaudi高性能架构为基础,具有24个可编程tensor处理器核心(tpcs)。
每颗芯片集成了21个专用于内部互联的100gbps(rocev2 rdma)以太网接口,配备配置96gb hbm高速内存及2.4tb/秒的总内存带宽,满足大规模语言模型、多模态模型及生成式ai模型的需求。
据现场介绍,英特尔gaudi2运行resnet-50的每瓦性能约是英伟达a100的2倍,运行1760亿参数bloomz模型的每瓦性能约达a100的1.6倍。
在发布会上,浪潮信息高级副总裁、ai和hpc总经理刘军现场发布搭载gaudi2的新一代ai服务器nf5698g7。
目前,英特尔已与浪潮信息合作,打造基于gaudi2深度学习加速器的ai服务器nf5698g7。该服务器集成了8颗gaudi2加速卡hl-225b,还包含双路第四代英特尔至强可扩展处理器,支持amx/dsa等ai加速引擎。当日,该款ai服务器也正式发布。
浪潮信息高级产品经理王磊强调,nf5698g7是专为面向生成式ai市场开发的新一代ai服务器,支持8颗oam高速互联的gaudi2加速器,将为ai客户提供大模型训练和推理能力。
新华三集团计算存储产品线副总裁刘宏程表示,基于英特尔gaudi2 ai加速器,新华三正与英特尔合作,开发适合大模型训练和推理的高性能ai服务器。
同时,超聚变数字技术有限公司算力基础设施领域总裁唐启明指出,超聚变将与英特尔,共同推出基于gaudi2的全新产品与解决方案。
此前,英特尔中国区董事长王锐在接受《科创板日报》记者采访时指出,chatgpt浪潮带来计算需求的大幅度提升,目前正与包括百度、阿里等在内的中国的客户开展共同研究。王锐透露,不管是高性能的计算还是分布式的计算,都已经进行了布局。
一位英特尔技术专家《科创板日报》记者分享了英特尔在大模型领域的布局情况。在训练层面,针对cpu、gpu、ipu、habana等异构计算,英特尔用oneapi以及xpu平台来提供更多的选择。在推理方面,第四代sapphire rapids发布后,基于amx加速器,可在行业中解决80%以上的客户推理需求。同时,也充分利用cpu,包括用于训练的ponte vecchio,和用于推理的arctic sound等。
伴随着大模型的热潮,云计算的商业模式正朝着maas(模型即服务)的方向演进,其所带来的算力需求也值得关注。
“它的理念是利用预训练模型,对行业数据进行训练,从而形成针对特定场景的、面向各行业的细分模型。我们知道通用模型的参数量非常大,例如gpt-3可达到1750亿,部署这些模型会比较麻烦,因此,可能需要对大模型进行蒸馏和压缩,形成行业可部署的模型。”上述技术专家称。
此外,把大模型进行私有化部署是不少行业的潜在需求。“很多细分行业不接受saas服务,尤其金融等行业。因此,英特尔正在探讨如何把这个模型小型化之后,在本土落地做私有化部署,使其真正在行业落地。”

建筑机器人将解决全球建筑工人的短缺的问题
区块链带来的技术创新和变革
使用集成示波器,执行五项常见调试任务
简单介绍一下如何制定会报时的电子表
想转行做大数据 技术门槛比较高
英特尔推云端AI芯片 拟联手国内厂商开发AI服务器
如何防止电路中的闩锁问题
复旦微FM33LG048软件I2C驱动OLED的demo 帮助新手快速从STM32上手FM33
不知道这些功能你的新买的算iPhone白买了!
PLC故障排查步骤
中国ic设计业进一步提高的两个关键:资本和技术
保点成为全球首家通过ARC认证的NXP UCODE 9芯片RFID INLAY制作商
MSP430™ MCU 又一新玩法,解锁简易肺活量测试仪
主流的深度学习模型有哪些?AI开发工程师必备!
雷曼光电十七年积累或将迎来收获季
特斯拉亚太首座机场超级充电站上线,目前只拥有 8 个充电桩
简易病房呼叫器电路图
三星第三代10nm工艺DDR4内存下半年量产
语言建模中XLNet比BERT好在哪里
国内芯片行业暴露短板_“中国芯”崛起还要多久?