谷歌发布ASPIRE训练框架,提升AI选择性预测能力

近期,谷歌公布新版aspire训练架构,该架构主要用于改进大型语言模型的选择性预测情况。谷歌表示,尽管大语言模型在自然语言理解与生成领域发展迅速,应用广泛,然而在涉及到高风险决策时,其预测能力仍待加强。为此,谷歌推出aspire训练框架,通过向模型引入“可信度”机制,提升预测准确率。
该框架分为三步骤:“特定任务调整”、“答案采样”以及“自我评估学习”。首先,“特定任务调整”阶段针对基本训练的大型语言模型进一步深化训练,重点提高预测能力。其次,“答案采样”阶段模型会根据调整的参数,生成多个答案,同时建立自我评估学习数据集,产生较高信度的选项。最后,“自我评估学习”阶段则设定参数以提升机模自我评估能力,使之能检测答案准确性,以便在回答问题时附加可信度评分。
据悉该架构取得显著成效。在coqa、triviaqa和squad三个问答数据集测试中,经由aspire调整的opt-2.7b小模型表现全面优于更大规模的opt-30b模型。此成果证实,经适配调整,小型语言模型亦有潜力超越大型语言模型。
研究人员总结指出,aspire训练框架有效改善了大型语言模型的输出精度,使小型模型经微调后可以实现“恰当且自信”的预测。

聚丙烯电容介绍
日光灯低于额定使用时间原因
华为手机芯片排行 华为手机芯片哪个好
盘点2018年我国晶圆产线布局
可控四足机器人的制作教程
谷歌发布ASPIRE训练框架,提升AI选择性预测能力
二极管的正负极图示
Cisco最后的王牌—FabricPath
双管反激变换器适用于高电压宽输入场合的原理
数字电源系统管理是什么?在设计中有何作用
燃梦再起航 大润科技20周年庆在黔举办
【坚果派】JS开源库适配OpenHarmony系列——第一期实操
区块链智能合约是什么情况
深度了解国产工控主板,主板各部件名称及功能介绍
最适合玩王者荣耀的国产手机是什么
反激电源的基本原理?反激电源怎么选择工作模式?
直线导轨的误差匹配度如何?
基于Arduino Mega Shield基础上防盗报警器设计方案的实现
2021款iPad Pro或将支持毫米波5G
最创新的近红外二区荧光/生物发光双模式光学成像技术