快商通发明单通道电话人声分离技术,拯救呼叫中心单通道语音数据

自声纹识别技术被推广应用以来,声纹库建设的数据来源,一直是从业者们头疼的难题。
对于金融、保险、证券、市场调研、电商等拥有呼叫中心,并会产生大量语音数据的领域来说,建设声纹库本不是难事,但受历史技术水平的限制,这些领域所存储的历史语音数据来源大多为单通道,客服与客户的声音共存在同一段音频之中,难以分割,无法发挥数据价值。
最近,kriston ai lab发明了一种基于深度学习的单通道电话语音快速人声分离技术(简称“单通道电话人声分离”),破解了复杂场景下的人声分离的难题,将银行、保险、市场调研等行业的呼叫中心历史语音数据变废为宝,大大降低了声纹数据库的建设门槛。
二、电话信道人声分离是如何“炼”成的?
人声分离技术以深度学习技术为基础 , 构建多层rnn循环神经网络。
1、利用现实生活中电话信道双通道音频作为训练的数据集 , 将电话信道双通道音频合并为融合左通道客服音频和右通道客户音频的单通道音频作为整个模型训练的输入音频,将双通道音频直接读取的左通道音频和右通道音频作为网络训练的标签音频;
2、输入单通道融合客服和客户音频到整个网络当中 , 网络的输出结果为模型预测出来的拆分客服和客户后的左通道音频和右通道音频;
3、将模型预测拆分的左通道音频和右通道音频,与原始双通道音频读取的左通道音频和右通道音频进行损失值的计算, 训练整个模型网络的参数;
4、当模型训练拟合之后,将模型取出,输入现实生活中电话信道单通道音频,模型输出的音频即为拆分后的左通道音频(客户)和右通道客服(客服)。
三、电话信道人声分离能发挥怎样的作用?
电话信道人声分离的最大作用,便是利用分割后的音频进行声纹库注册,以实现反欺诈、电话营销等功能。
在银行领域,客服会对逾期不还的订单进行电话提醒,从而产生大量的不还款语音数据,如果彼时该银行使用的是单通道通话,可以应用快商通电话信道人声分离技术对失信者音频进行分割。分割后的音频,便成为黑声纹库建设中历史黑产数据的重要来源。银行可进一步以黑声纹库为基础,准确识别黑名单用户,从源头上降低坏账率,完善金融反欺诈链条。
在营销方面,使用快商通电话信道人声分离技术,可以对客服外呼电话进行客户音频分割,将客户声音与会员标签、交易标签、营销标签等特征相匹配,统一由后台系统进行管理,实现高质量的电话营销。
技术日趋成熟、政策大力支持,声纹识别这种身份认证方式已逐渐被各领域所认可,但与此同时,种种实际应用问题也浮出水面,声纹库建设的数据来源便是使用者们需要跨过的首个难关。
kriston ai lab从客户的需求出发,推出能够解决复杂场景下的人声分离技术,为银行、保险、证券、市场调研、电商等行业呼叫中心提供了声纹库建设的可行性方案。未来,kriston ai lab将持续发挥国际领先的算法优势,完善声纹识别技术与产品的服务能力,推动产业链上下游共同发展。
附:kriston ai lab由快商通于2012年创建,专注于自然语言处理、声纹识别和大数据技术研发,现由李海洲教授牵头负责。kriston ai lab共申请400余项发明专利,为医疗、教育、金融、公安、智能家居等行业提供ai技术服务。

中国光模块行业表现亮眼,这家本土企业市场份额全球第一
ABB让用户无需额外布线 就能控制智能家居设备
由省能源局驻村工作队协调帮扶资金购买的两棵光伏树“栽植”到骆驼湾村的公路一侧
电气工程师必须知道的40个知识点问答
高精度土壤重金属检测仪的功能特点
快商通发明单通道电话人声分离技术,拯救呼叫中心单通道语音数据
建立在ARM基础上的ADSL2+测试仪的设计
毫米波雷达的工作原理及发展趋势
核电站设备仿真器中的反射内存应用
自动驾驶优化出更好的算法
iOS11为二手iPhone带来新麻烦,卖iPhone要注意了!
如何在AI时代不实业
屏蔽罩夹子在PCB设计中还有这样的作用!
零零科技:Hover2无人机已8倍超额实现目标众筹额度
三相全波无刷电机的正弦波驱动中施加更大电压的方法
这是oppor11还是iPhone 7,都错了,这是一加5
全国首个5G智能网联无人驾驶车亮相湘湖景区
多功能电扇控制器(555、CD4017)
为华为Mate50系列提供N种可能,雷克沙NM卡领势而上
电流互感器的基本工作原理和特点