OpenAI最新大模型曝光！剑指多模态，GPT-4之后最大升级！

大模型之争，又卷起来了。
据the information爆料称，openai即将推出多模态模型gpt-vision。
如果消息为真，这将是openai在gpt-4之后推出的最大更新。
另一边，谷歌的多模态模型进展也在最近传出，为的就是能和openai抗衡。
目前为止，openai还没有对爆料中的传闻做出回应，但此前发布过多模态模型测试。
ceo奥特曼在回应有关gpt-5的传闻时，也暗示过gpt-4“正在增强”。
究竟谁能更胜一筹，还得让子弹再飞一会儿。
不能让google抢了先
我们先回到openai，被爆料的多模态模型将搭载什么样的功能呢？
首先是图像内容识别，比如根据手绘草图生成网页代码、输出可视化图表的文本分析等。
另一方面则是图像生成，通过简单的文本生成绘画、logo或表情包。
虽然openai没有对这次的爆料做出回应，但做多模态模型这件事本身只是个时间问题。
3月份，openai在发布gpt-4时，就曾推出了一个多模态gpt的预览版本。
当时，openai把demo提供给了研究帮助视障群体的机构be my eyes。
除了这家机构之外，就再也没有人见过openai的多模态模型是什么样子了。
在此之后，这个多模态模型更是杳无音讯。
唯一和图像有点关系的，就是gpt-4的升级版代码解释器（后改名为高级数据分析）可以处理一些图片任务。
但这是通过调用python库实现的，而且也达不到ai中图像识别的程度，和多模态模型更是不沾边了。
有说法称gpt-vision迟迟没有推出的原因可能是对安全的担忧，担心被用于破解验证码和人脸识别系统。
直到这次google多模态模型gemini的消息传出。
安全问题有没有解决不得而知，但也许openai是真的急了，不能任由谷歌超越，才有了模型发布的传闻。
另据爆料，openai还在准备从头开始开发一个名为gobi的多模态模型，不过训练还未开始。
那么，谷歌这边的情况又是怎样的呢？
gemini来势汹汹
来势汹汹的gemini，让网友直言其或将成为游戏规则的改变者。
甚至有媒体夸张一些地说将有机会取代gpt-4。
gemini主要由谷歌deepmind团队开发。谷歌ceo皮查伊介绍，gemini集成了多种技术，支持同时输出文本和图像，还可以使用工具和api。
据悉，gemini吸取了很多来自alphago的经验教训，包括强化学习和树搜索技术。
而且，凭借着拥有youtube这一得天独厚的优势，海量的训练数据可以说是唾手可得。
实际上，google也一直把openai视为竞争对手。
为了和chatgpt较量，google此前已经在bard中加入过图像识别功能，但并未改变chatgpt的地位。
但这次推出的gemini，openai也感到害怕了。
尽管竞争激烈，有一点倒是让谷歌和openai不谋而合。
那就是，把模型的能力变成真金白银。
谷歌计划的gemini提供方式是通过其google cloud vertex ai云服务平台进行，预期价格为每个用户每月30美元。
这一做法预计将成为谷歌新的收入来源，尤其是针对企业客户。
而openai这边，也已经开始通过金融服务等各种应用程序将gpt-4变为现金。
此次多模态的角逐究竟鹿死谁手，我们拭目以待。

全球首座采用免涂装耐候钢的跨海大桥南岸主塔正式封顶
Ansys携手索尼推新一代汽车图像传感器仿真
Numpy基础之数组过滤功能介绍
乐视收购北美市占率第一电视品牌Vizio最快要等到2017年
德勤分析：全球电动车到2030年前或将达到3110万辆
OpenAI最新大模型曝光！剑指多模态，GPT-4之后最大升级！
安防监控领域如何选用红外热成像仪的关键技术指标
投入或超6000亿打造宽带中国梦
数字化转型时代,网络安全如何胜出
薄膜电容
华为云通过端云协同技术优势，帮助和赋能互联网企业出海
工业机器人强大后的挑战有哪些
有方科技亮相欧洲电力及新能源展助力能源物联网优化升级
5G/IoT设备必不可少的体温计——热敏电阻
Note 10系列相册已经可以与OneDrive云存储进行同步
APUS李涛受聘为深圳人工智能行业协会专家委员会专家
如何为物联网传感器选择合适的电流隔离技术
再次登榜｜亿达科创入选“2023年度软件和信息技术服务竞争力百强企业”
惠普 TouchPad平板电脑拆分折算成本
什么是网络中的服务质量 (QoS)，其相关技术和关键指标有哪些？