首张国产游戏显卡问世,国产GPU又迈进一大步!

日前,摩尔线程在其2022秋季发布会上推出多款新品,包括全新多功能gpu芯片“春晓”,基于musa架构打造的业内首款国潮显卡mtt s80和面向服务器应用的mtt s3000,以及元计算一体机mccx。
其中,专为游戏玩家打造的业内首款国潮显卡mtt s80备受瞩目。据介绍,mtt s80显卡已经完成首批生产与备货,将于2022年11月11日在京东电商平台开启销售。
此前国内游戏显卡基本采用英伟达、amd、英特尔三大厂商的gpu芯片。如今摩尔线程基于“春晓”打造的显卡mtt s80上线销售,意味着国产gpu在发展进程中又迈进了一大步。
国内首款游戏显卡性能如何
摩尔线程第二颗多功能gpu芯片“春晓”,集成了220亿个晶体管,是行业首个使用pcle gen5的gpu产品,内置musa架构通用计算核心以及张量计算核心,可支持fp32、fp16和int8三种计算精度;搭配gddr6高速显存,同时内置musa智能多媒体引擎2.0及musa多维虚拟化技术,支持8k超高清视频编解码以及显示输出。
相较于今年3月发布的首款自研的gpu“苏堤”,“春晓”内置的四大计算引擎全面升级,带来了显著的性能提升:图形渲染能力方面平均提升3倍;编码能力提升4倍,解码能力提升2倍;ai计算加速平均提升4倍;物理仿真计算性能提升2.5倍。
摩尔线程ceo张健中表示,“我们第一个gpu苏堤,实际上属于中低端处理器,在gpu行业中可以满足国内国产化应用的需求。但对于大部分主流用户,他们还期待更高性能的gpu,因此我们快速发布了春晓,去满足高端的游戏玩家,满足更多用户对图形和计算的需要。”
mtt s80游戏显卡搭载了完整的“春晓”芯片核心,内置4096个musa流处理核心,在1.8ghz的主频下,能够提供14.4tflops的单精度浮点算力。mtt s80不仅为游戏玩家提供强大的的3d渲染能力,还可以为学生和研究人员等提供在人工智能、通用计算和多媒体处理等方面的完整gpu能力。
在超高清游戏方面,mtt s80是国内首款支持windows环境和directx图形接口的显卡产品;同时,也对vulkan、opengl、opengl es等主流图形接口提供支持。这意味着mtt s80能够满足玩家群体的游戏需求。通过在驱动层面的攻关,mtt s80的windows驱动目前已经内置了musa directx driver模块,并已完成对《暗黑破坏神3》、《英雄联盟》和《穿越火线》等数十款主流游戏的适配。
发布会现场,摩尔线程实机演示了mtt s80带来的流畅游戏运行效果。目前,摩尔线程正在与unreal和unity等游戏引擎开发商,以及腾讯游戏、网易游戏、西山居、完美世界、360游戏等国内顶尖游戏开发商展开深度合作,以便对游戏引擎和游戏产品提供更好更快的支持,使得玩家可以获得持续更新的3a级游戏体验。未来,摩尔线程还将持续更新windows驱动及musa directx版本,实现更多游戏的兼容与性能优化。
国产gpu最新进展
目前全球gpu基本处于寡头垄断状态,英伟达、amd、英特尔三家厂商几乎占据了全部市场份额。国内在gpu方面的起步较晚,近几年越来越的厂商加入其中,并且逐渐取得一些进展。包括上文提到的摩尔线程,以及较早入局的景嘉微,还有芯动科技、天数智芯、沐曦集成、燧原科技、壁仞科技等。另外国产cpu厂商龙芯、兆芯也开始了gpu的研发。
景嘉微可以说是国内gpu领域的先行者,2014年景嘉微就率先成功研发出国内首颗国产高性能、低功耗gpu芯片jm5400,打破国外长期垄断的市场局面。2018年景嘉微又成功研发出第二代gpu芯片jm7200,这款产品在性能和工艺设计上,较jm5400有很大的提升。
此外在jm7200的基础上,2019年景嘉微推出商用版本jm7201,满足桌面系统高性能显示需求,并全面支持国产cpu和国产操作系统。前不久,景嘉微对外表示,其最新的jm9系列图形处理芯片已完成流片、封装阶段工作及初步测试工作,目前已在多个行业开展试点应用工作。
龙芯和兆芯自主研发的gpu主要是集成在其cpu中。今年7月,龙芯官微透露,公司新一代龙芯3号系列处理器配套桥龙芯片7a2000正式发布,这个桥片上首次集成了龙芯自研统一渲染架构的gpu模块。
根据官方介绍,该gpu核心频率为400-500mhz,基于opengl 2.1和opengl es 2.0规范实现,集成ddr4显存控制器,显存频率达到2000mhz-2400mhz,最大支持16gb;支持两路显示,典型分辨率1920x1080@60hz 最高支持2560x1440@30hz,glmark2性能超过300 fps,glxgears 性能超过1800 fps;可满足桌面办公领域需求。
兆芯在2020年公布发展路线图的时候,就确认将推出旗下首款gpu。今年7月,兆芯子公司格兰菲在官网上详细介绍了其首款gpu,称为arise-gt10c0。格兰菲表示,这是为桌面、商业显示以及通用计算等中高端应用场景,研发设计的第一款图形和图像独显芯片。
arise-gt10c0采用了28nm工艺制造,内置新一代图形图像处理引擎。核心频率为500mhz,浮点运算性能约为1.5tflops,像素及纹理填充率分别为48gpixels/sec、96gtexels/sec。搭配的显存为ddr4,频率为1200mhz,容量为2gb或4gb,对应位宽为64bit或128bit,接口为pcie 3.0 x8,显示输出为hdmi、dp和vga,可支持4k分辨率。
arise-gt10c0兼容银河麒麟kos、统信软件uos、windows等操作系统,同时可搭配兆芯、飞腾、龙芯、英特尔和amd的cpu,运行在x86、arm、mips等硬件平台上。arise-gt10c0支持多种图形和图像的api接口标准,包括directx11、opengl4.5、opencl1.2等。
芯动科技目前已经推出两款gpu芯片产品,风华1号和风华2号。今年9月30日,芯动科技公司董事长敖海在某活动上宣布“风华1号”gpu正式量产。
今年8月,芯动科技正式发布“风华2号”gpu,这是一款集超低功耗、强渲染、4k高清三屏显示、4k视频解码及智能ai计算于一体的桌面和笔记本gpu。
在渲染能力方面,“风华2号”像素填充率48gpixel /秒,fp32浮点算力1.5tflops,在麒麟操作系统下风华2号glmark2基准测试实测评分超过 6500。同时,“风华2号”还支持 4k 级三屏高清显示。在发布会现场,工程师还即兴试玩了linux下最新的重量级赛车游戏。
“风华2号”已与统信和麒麟等操作系统完成互认证,并全面支持飞腾、龙芯、申威、海光、兆芯、鲲鹏等主流国产cpu平台。此外,“风华2号”已经流畅支持微软win10 directx图形框架,工程师现场演示了win10操作系统下的qq通讯、办公上网和娱乐游戏等各种应用。
沐曦集成于今年1月宣布首款采用7nm工艺的异构gpu产品正式流片,该公司联合创始人杨建9月表示,这款芯片预计很快量产。沐曦集成该款产品主要用于ai推理场景,可应用于人工智能、自动驾驶、工业和制造自动化、智慧城市、自然语言处理、边缘计算等领域。
沐曦集成第二款用于科学计算、数据中心弹性计算、ai训练等的旗舰gpu芯片也进入研发收尾阶段,计划于2024年全面量产。此外据该公司介绍,到2025年将推出融合了图形渲染的完整gpu产品,也就是显示和游戏用途的gpu。
小结
游戏是gpu最为关键的市场方向,另外近些年数据中心高性能计算也是gpu增长较快的市场方向。从量产应用来看,入局较早的景嘉微产品获得了较多的市场,不过更多的是在军用领域,如今也开始进入民用市场。天数智芯和芯动科技的产品也已经进入量产应用。
在游戏显卡方面,随着mtt s80在今年11月上线销售,摩尔线程估计是国内在该领域走得较快的玩家。另外,芯动科技今年8月发布的风华2号也具备娱乐游戏应用,而沐曦集成在游戏应用方面也有规划,将在2025年推出相应的gpu产品。

荣耀Magic6护眼表现获赞,网友:信任专业评判
吸尘器的工作原理是怎样的
Q50/ATS/IS发动机舱全方面对比解读
中国CPU和美国差距有多大
Digi-Key Electronics宣布与Septentrio建立全球分销合作关系
首张国产游戏显卡问世,国产GPU又迈进一大步!
cd4047引脚图及其各脚功能说明
LG显示广州新工厂预计每月可制造13万块OLED板
全球70%的数字化转型都败在哪里了?
采用ATPAK封装功率MOSFET在开关器件设计中的应用
一种3D结构复合材料的导热系数模拟计算方法
verilog是什么_verilog的用途和特征是什么
工业机器人增量放缓,明年有望提速
智能手表终于上线微信支付功能
炼油厂仪表自动化类型
从结构特点性能三个方面比较永磁同步电机与异步电机
华为P10配置强悍曝光 华为P9价格滑铁卢
1n4007分正负极吗?1n4007正负极判断方法
用于检测并筛选疾病生物标志物的液滴微流控技术
提出多目标最优化方法 进而产生柏雷多最优电动汽车充电策略