音视频新技术可以让声音返老还童

声音也能返老还童?当垂垂老矣语音混沌时,借助受损语音修复技术就能让声音完美再现,重返青春。记者近日从天津大学获悉,该校自动化与信息工程学院张涛副教授带领团队,在音视频智能分析中实现重大突破,借助大数据和神经网络等人工智能技术首次实现了受损声音的修复和再现。
据介绍,老年人的喉粘膜萎缩以及声带老化、声带肌松弛等会导致出现发音无力、音质下降等问题,另外声带出现一些病变如萎缩或肥厚、声带长肉结或息肉等都可能导致声音改变、沙哑。对由于疾病或器官衰老而引起的语音受损研究,目前大多着眼于病理嗓音的检测和识别,对于受损语音带来的交流方面的问题研究则相对较少。
随着音频场景智能分析应用越来越广,科学家开始借助大数据和神经网络等人工智能技术模拟修复受损声音。张涛主持的天津大学-ti dsp联合实验室也主要聚焦于音频场景智能分析和受损语音信号修复两个方面。在对因衰老、病变等因素造成的声带受损语音进行修复过程。
张涛团队独辟蹊径,提出了一种新型截取信号的窗函数,可以对因病变、衰老造成的声带发声受损进行有效修复。这一修复研究主要借助嗓音的声学特征及其动力学非线性特征参数等,通过结合神经网络等技术建立激励和声道模型对修复的嗓音特征重新合成,从而大大提高了受损语音的可懂度。目前,该实验室研究已经申请国家专利并被采纳为国家技术标准。

电荷型压电传感器使用中的几点注意事项
AR红包有趣的野心 阿里再战社交领域新尝试
CPU中自适应电压超频的概述和过程
纳米机器人的未来 将源源不断地进入人类的日常生活
《工业互联网解决方案创新应用报告2020》
音视频新技术可以让声音返老还童
简单介绍一下Markdowm语法的用法及效果
电源电路图及工作原理解读 13.2W电源电路原理图讲解
在真正的生产环境中使用无铅焊膏
后处理尿素泵及尿素喷嘴故障特征
基于以太坊区块链的MIX项目介绍
消费电子及汽车电子仍将继续推动SMT行业发展
iphone5s:是时候退出历史舞台了!
Chrome 浏览器再次屏蔽 8 个 TCP 端口,防止被利用 NAT Slipstreaming 2.0 漏洞进行攻击
Teradata天睿公司提升JSON数据查询性能 增强业务敏捷性
华为P10最新消息:华为闪存门会有什么影响?任正非说:没事你们别瞎跑分?
单管共射放大电路设计步骤
工业自动化关键:机械手臂多轴化趋势显现
苹果公司证明App Store的佣金结构合理
英创信息技术ESMARC工控主板升级简介