一站式智能语音识别方案将大幅提高工作效率

(文章来源:站长之家)
全球实时音视频开创者声网agora宣布推出一站式智能语音识别解决方案,将通过ai智能降噪、声纹检测、语音识别等技术,进行在线实时语音识别,帮助平台更智能、高效的识别语音中存在的涉黄、涉政、广告等违法违规信息。净化平台内容质量,降低监管风险,提升用户体验。
一段时间以来,网络音频行业乱象频出。今年 6 月,国家网信办针对网络音频乱象问题启动专项整治行动, 26 款音频平台因传播历史虚无主义、淫秽色情等内容被采取约谈、下架、关停等处罚。
一方面,随着移动互联网的发展,ugc内容生产数量越来越庞大,asmr、娇喘等色情擦边球内容频频出现在语音聊天室、直播、短视频等平台上;另一方面,相对于图文和视频,音频审核本身在技术上也更具难度,这大大增加了平台方的内容审核压力。因此,在国家网信办强监管的大背景下,借助更高效、便捷的语音鉴黄方案加强内容审核成为众多社交、音视频平台的刚需。
无论传统语音审核还是人工审核方案,一直以来各平台都在积极寻找更高效的内容审核方式。在传统审核方案的对接模式中,企业想要同时上线直播、鉴黄等功能,需要分别对接cdn厂商、rtc厂商和内容审核厂商,并且额外支付cdn拉流成本,通过三步才能拿到内容审核结果,步骤繁琐、时间成本高且面临故障风险。而单纯使用人工鉴黄虽然对新型问题有较强的灵活性,但也面临人员流动性大、质量效率不稳定等运营成本。
声网agora的一站式智能语音识别解决方案,将上述传统语音审核和纯人工语音审核进行了优化升级,通过自建的全球虚拟实时通信网络sd-rtn™,整合目前业界top3 智能语音识别服务商,为企业提供可集成实时音视频、实时录制和实时智能语音识别的一站式服务,提供市面上最高效、便捷的智能语音识别技术。
同时,声网也是目前唯一一家打通人工智能、实时语音识别、实时音视频三大技术解决方案的服务商。使用声网的一站式服务,企业无需部署额外sdk、无需自己对接cdn厂商、更无需支付拉流成本,就可同时上线直播(实时音视频)和鉴黄(实时语音识别)功能,帮助企业大幅节省接入成本,真正做到一站式方便接入。
在目前流行的众多k歌平台,直播、语音聊天室中,为了追求内容效果,用户在ugc内容创作时普遍都会使用背景音乐或音效来营造氛围,这对平台进行语音识别增加了难度。对于语音识别中常见的噪声、背景音等音质问题,声网的一站式智能语音识别解决方案融合声网agora语音引擎与ai音频降噪算法,可提供去除背景音、环境音之后的高音质音频源,在原来算法的基础上将不良信息的识别率有效提高30%以上。
在语音识别过程中,对于有语义的声音,系统先将语音识别转成文字,然后再对文字内容进行识别;而对于无语义的声音,例如娇喘、asmr中的色情擦边球等,则可以通过声纹检测来进行识别,再通过内容安全引擎判断是否包含涉黄违法内容。这样“双管齐下”的方式,可以避免娇喘等无语义声音的特殊性带来的审核漏洞。
声网通过深度学习语音识别技术与在线实时语音分析,智能识别语音环境中的广告、涉黄、涉政、暴恐、谩骂等不良信息,保障语音聊天室、娱乐直播等语音应用绿色安全。未来,声网还会联合更多业界知名智能语音识别服务商,为企业持续提供高效、严格的内容审核机制,促进网络生态健康发展。

振动电子装置可以减轻皮肤癌切除带来的疼痛
Aerotenna借助赛灵思Zynq SoC 器件的处理能力和I/O功能
30V的驱动晶体管降压DC/DC转换器
快速实现Modbus和Profinet互转的方案
NVIDIA 亮相 2023 中国移动全球合作伙伴大会,引领数实融合新篇章
一站式智能语音识别方案将大幅提高工作效率
强力巨彩携手胡军开启新一轮品牌升级 助推LED大显示普及
手机收音机功能
如何将中国智能座舱推向全球
单相双电容电动机接线详解
详解12种桥式电路原理图
低压电阻柜的原理和检修
工业自动测试设备企业华兴源创发布2022第一季度报告
全球首次700MHz(n28频段)FDD频段2x30MHz大频宽5G数据呼叫
比特币财富分配不平衡的原因分析
《中国人工智能产业发展指数》正式发布,安徽排名第六
中移在线与商汤科技强强联合、UMCloud与数人云合并、蚂蚁金服或将入股猩便利,无人货架格局生变
日材料禁运对SAMSUNG和SK海力士影响甚微 而NAND却上涨了10%
投资者适当新能源板块 重点关注锂电池行业
Nokia 重返市场,强调不会糟蹋自己品牌!