复旦大学自然语言处理实验室桂韬、张奇课题组发布信息抽取统一大模型 instruct-uie,在领域大模型上取得突破性进展。instruct-uie 在信息抽取精度上全面大幅度超越chatgpt以及基于预训练微调的单一小模型。
自2022年11月 chatgpt 横空出世以来,其在对话、阅读理解、对话、代码生成等方面优异性能,受到了极大的关注。大模型所展现出来的长文本建模能力以及多任务统一学习能力使得自然语言处理范式正在发生快速变革。
在对 gpt 系列工作进行了详细分析[1][2]后,我们发现虽然 chatgpt 在很多任务上都展现出了良好的性能,但是在包括命名实体识别、关系抽取、事件抽取等在工业界有广泛应用的信息抽取任务上效果却亟待提升。chatgpt 在某些命名实体识别数据集合上的的精度甚至只有不到20%。但是大模型所展示出来的多任务统一学习能力,驱使我们针对信息抽取领域的统一大模开展了深入研究。
实 验 结 果
针对信息抽取任务,我们收集了包括 ace 2005、conll 2003 等在内的41种评测集合,针对flan-t5、bloomz、llama 等大模型进行了系统研究,构建了信息抽取统一大模型instruct-uie。该模型在绝大部分信息抽取任务中(85%以上)都超越了单个小模型的预训练微调结果。
instruct-uie 统一了信息抽取任务训练方法,可以融合不同类型任务以及不同的标注规范,统一进行训练。针对新的任务需求,仅需要少量的数据进行增量式学习,即可完成模型的升级。
小模型时代任务,模型开发需要经过标注数据,训练模型,模型评测和模型部署等多个步骤。其显著缺点是成本高、时间周期长;相同任务的微小需求变化,需要30%-70%的重新开发成本;模型开发和维护成本高等问题都极大地制约了自然语言处理产品化。
而在大模型时代,我们可以将大量各类型任务,统一为生成式自然语言理解框架,并构造训练语料进行微调。由于大模型所展现出来的通用任务理解能力和未知任务泛化能力,使得未来自然语言处理的研究范式进一步发生变化。这样的研究范式使得小模型时代所面临的问题可以在一定程度上可以得到解决。针对新任务和需求,基于大模型的方法可以快速训练,并且不需要部署新的模型,从而实现自然语言处理的低成本产品化。
instructuie 工作验证了领域大模型的可行性,针对b端场景,百亿级领域模型具有高效、成本低、可私有化部署等优势,在行业应用中具有广阔前景。我们将近期开源相关代码和模型。
韩国投资者谈区块链
KUKA机器人的涂胶控制
解读ChatGPT背后的技术重点
华为四项主张为5G商用铺平了道路
什么是量子计算机?量子计算机的诞生,人类是否有望被模拟出来?
Instruct-UIE:信息抽取统一大模型
三星Galaxy Note10+星球大战特别版将于12月13日开始限量销售
Symbian系统
鸿海将与ST合作建晶圆厂?
稳压二极管的工作状态 测量稳压二极管的方法
瑞士计划年底引入世界上首个以氢为燃料的卡车车队
5个PCB行业项目新进展
可在125°C 环境下工作的汽车级I2C接口FeRAM
国产替代给力 大族激光光刻机已小批量销售
苹果决定将为其反垄断行为支付大量罚金来与韩国FTC和解
韩国5G为何率先“点亮未来”?
搭载鸿蒙OS的华为智慧屏S Pro体验分析
华为手机与围棋的结缘,有一个共同的媒人——AI
高压开关电源3D PCB绘制教程:SOLIDWORKS绘制SOT23教程
模具3D打印技术可使注塑品冷却时间缩短68%