知乎发布AI大模型！特定条件下水平接近ChatGPT-4，全面AIGC时代要来了？

日前，知乎在北京召开“2023知乎发现大会”，首次公开旗下与面壁智能共建的大模型产品“知海图ai”。官方表示，在热榜上抽取、聚合知乎用户回答的41条内容，“知海图ai”的表现基本接近chatgpt-4。
在openai推出chatgpt之后，近几个月，国内外科技企业陆续推出自己的大模型，包括百度的文心一言，商汤科技的商量sensechat，阿里云的通义千问，昆仑万维的“天工”3.5，以及亚马逊的titan，还有360、腾讯、搜狐，王慧文的光年之外等都传出相关消息。
目前都发布了哪些大型语言模型
openai在2022年11月30日发布的chatgpt，在短短几个月时间风靡全球。今年3月14日，openai再次发布更强大的多模态大模型gpt-4。其最大股东微软公司不仅宣布推出由chatgpt支持的搜索引擎bing和edge浏览器。还宣布将gpt-4全面接入所有办公软件。
在chatgpt的带动下，全球科技公司掀起研究大型语言模型的热潮。国内最新跟上的要数百度了，3月16日，百度正式发布新一代大语言模型、生成式 ai 产品文心一言。在发布会上，李彦宏还展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等使用场景中的综合能力。
除了百度，最近还有多个大型语言模型密集发布。4月10日，昆仑万维宣布，其和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型——“天工”3.5发布在即，并将于4月17日启动邀请测试。该公司表示，“天工”大模型已经非常接近openai chatgpt的智能水平。
4月11日，在2023阿里云峰会上，阿里云也正式发布了旗下的类chatgpt大模型——通义千问。阿里巴巴集团董事会主席兼ceo、阿里云智能集团ceo张勇表示，阿里巴巴所有产品未来将接入“通义千问”大模型，进行全面改造，钉钉、天猫精灵已率先接入通义千问测试，并会在评估认证后正式发布新功能。
4月12日，商汤科技发布“日日新sensenova”大模型体系，推出语言大模型“商量sensechat”、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。据悉，作为千亿级参数的自然语言处理模型，“商量sensechat”使用大量数据训练，并充分考虑了中文语境，能够更好地理解和处理中文文本。
4月13日，亚马逊推出一项名为“bedrock”的云服务，允许开发者使用类似于chatgpt聊天机器人的人工智能系统。通过bedrock生成式人工智能服务，亚马逊旗下云服务aws将向开发者提供自家的语言模型“titan”，以及来自初创公司ai21和谷歌支持的anthropic的语言模型。这其中，一个titan模型可以为博客帖子、电子邮件或其他文档生成文本，而另一个可以帮助搜索和实现个性化。
此外，华为、腾讯也在大模型方面有所积累，华为最早于2021年便发布了华为云盘古基础大模型，包括nlp、cv和科学计算大模型。最近有消息称，华为云官网即将上线盘古系列ai大模型，分别为nlp大模型、cv等。不过华为云方面，并没有对此做出回应。
腾讯很早就已经进行ai大模型的研究——混元ai大模型覆盖nlp（自然语言处理）、cv（计算机视觉）、多模态等基础模型和众多行业/领域模型。腾讯不久前表示，近期混元ai大模型团队也推出了万亿中文nlp预训练模型hunyuan-nlp-1t，实现在中文语言理解能力上的新突破，而且得益其低成本、普惠等特点，目前hunyuan-nlp-1t大模型已成功落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。
除了科技大厂，也有创业团队宣布加入大模型研究大军。4月10日，搜狗创始人王小川正式宣布入场大模型创业，和前搜狗coo茹立云联合创立人工智能公司——百川智能，要做的事情是打造中国版的open ai基础大模型及颠覆性上层应用。王小川表示，有信心在年底发布国内最好的语言大模型。
另外，还有之前很受关注的创业项目，美团联合创始人王慧文设立的光年之外科技公司。以及前商汤科技副总裁、通用智能技术负责人闫俊杰创办的minimax。
大模型的训练和运行，离不开算力支持
然而，大模型的训练和运行，需要强大的算力基础。阿里云、商汤科技、腾讯等，在研究推进大模型研究的同时，也在构建算力基础设施，供公司自身或其他公司使用。
大模型背后的算力基础，包括高性能计算硬件、分布式计算框架、高效的算法和优化技术以及大量的训练数据和存储资源。这些因素共同支撑着大模型的成功运行。
阿里云在这方面做了充足准备，张勇表示，十多年来，阿里云已经累积了从飞天云操作系统、芯片到智算平台的“ai+云计算”的全栈技术实力，并在iaas（基础设施即服务）和paas（平台即服务）的基础上，建立了第三层maas（模型即服务）的体系。
具体而言，“飞天智算基础设施”智算iaas服务涵盖了一系列卓越特性，包括能够支持高达十万卡gpu的单集群规模、可让多个万亿参数大模型同时在线训练的强大智算集群，以及为万卡规模ai集群提供无拥塞通讯的自主研发rdma网络架构等；
智算paas服务则以机器学习平台pai为核心，可支持万卡的单任务分布式训练规模，ai训练效率提升可达10倍，推理效率提升可达6倍，覆盖全链路ai开发工具与大数据服务，深度支持了通义大模型的研发。
智算maas服务包括通义大模型系列和以之为基础的企业定制大模型。
凭借这些能力，阿里云不仅可以为自家大模型“通义千问”提供支持，还能够把丰富的算力资源和大模型能力分享给更多企业和社会各界，共同推动ai技术的发展。
商汤科技在这方面也有积累，当前业界训练大模型对大算力的需求非常旺盛，并且真正好用的基础设施十分稀缺。商汤历时五年，建设了业界领先的ai大装置，大装置上总共有27000块的gpu芯片卡，可以输出5.0 exaflops的总算力，是亚洲目前最大的智能计算平台之一。
基于大装置的能力，商汤目前已构建了计算机视觉、自然语言处理、ai内容生成、多模态、决策智能等多个领域的大模型，持续演进能力并广泛支持各种应用。
面向大模型训练，4月14日，腾讯云正式发布了新一代hcc(high-performance computing cluster)高性能计算集群。该集群采用腾讯云星星海自研服务器，国内首发搭载英伟达最新代次h800 gpu，能够提供高性能、高带宽、低延迟的算力支撑。根据官方数据，新的hcc计算集群能够将大模型的训练时间从上一代的11天压缩至4天，可以有效节省大量时间。
全民aigc时代要来了
从目前的情况来看，国内外科技企业巨头都已经加入到大模型的研究大军中，在过去短短几个月时间，各种大模型产品密集发布。与此同时，作为大模型训练和部署重要的支撑，算力基础设施的构建也在加速推进。
另外，日前消息，微软宣布开源了deep speed chat，可以帮助用户轻松训练类chatgpt等大语言模型，使得人人都能拥有自己的chatgpt。也就是说，用户通过deep speed chat提供的“傻瓜式”操作，能以最短的时间、最高效的成本训练类chatgpt大语言模型，这标志着人手一个chatgpt的时代要来了。
当然，当前chatgpt等大模型还处于初期发展阶段，人们不免对安全隐患、数据隐私、道德问题存在担心。不过，最近多个国家已经开始着手制定ai相关的规则和政策。这意味着，大模型在经历了过去几个月的野蛮生长之后，将会逐步向规范化发展。

CAN总线通信性能的仿真分析研究
HSD线束厂家三大认证你知道吗？
分析5种或将在未来10年后消失的开发语言
人工智能的圈子里，怎么能少得了腾讯的叮当语音助手？
从硬件和算法上系统分析如何排除医疗电子设备的信号干扰
知乎发布AI大模型！特定条件下水平接近ChatGPT-4，全面AIGC时代要来了？
PLC选择型号的方法都有哪些
MP3播放器
嘉楠科技曝光AI芯片新突破联合AWS实现国内首家IC上云
微软游戏主管：微软和索尼比苹果和谷歌更有理由保留 30% 的抽成
坚果激光电视惊艳亮相，为到场观众全方位展现大屏影音的实力和魅力
西部数据大容量SSD支持大规模云数据中心的高性能表现
制造成本可降低90%，日本信越开发新技术
芯华章谈国产EDA生态：建立不易要脚踏实地做出口碑
人民日报怒批：“最低价中标”不改，何谈工匠精神、中国制造！
挖掘数据：视觉AI初创企业“深挖”矿业和建筑业的数字孪生
新型智能移动电源
旭日X3派更新最小启动固件
亚马逊美国站纽扣电池锂电池新增UL4200A标准详解
压电偏转镜的特点、应用及参数