苹果正在努力让siri等语音技术更容易被语言模式不典型的用户所接受。根据《华尔街日报》的报道,该公司正在研究如何自动检测某人说话是否有口吃。为此,该公司已经从播客中积累了近2.8万个人们说话时有口吃的片段。
这一数据发表在本周的一份苹果研究报告中(pdf链接:https://arxiv.org/pdf/2102.12394.pdf)。
虽然苹果发言人拒绝评论它将如何使用这些数据的发现,但至少该公司计划至少利用其中的一部分来改进语音识别系统。在此期间,苹果在2015年推出的hold to talk功能允许用户控制他们希望siri倾听多长时间。这有助于防止助手在命令完全说出之前打断用户或超时。
虽然文章没有提到,但siri也可以在macos和ios上使用type to siri功能来激活和控制。
针对非典型语音模式的训练只是siri改进的一个研究领域。苹果还在开发系统,可以通过锁定用户独特的语音模式来帮助保护设备的安全。《华尔街日报》还报道了亚马逊和谷歌等其他科技公司如何训练他们的数字助理,以了解更多可能在语音命令方面有问题的用户。
亚马逊在去年12月推出了一个新的基金,允许拥有非典型语音模式的用户训练算法,以识别他们独特的声音。谷歌也在收集非典型语音数据,用于谷歌助手。
责编ajx
CES 2011:音频产品趋势
瑞萨电子推出RA8T1微控制器产品群
库克放大招,苹果AR眼镜有望于年内发售
【新专利介绍】一种智能燃气表的计量异常警告系统
5G领航城市旨在通过5G新基建提供更好的用户体验
苹果正改进Siri等语音助手识别用户是否口吃
如何判断3D打印机价格是否值得
低功耗光纤光功率监测终端报警器内置电池远程NB联网
安信可-小安派智能监控终端
如何在英特尔架构上为Android创建高性能的游戏
半导体发展:半导体材料将走向“纳米化”
知识普及:关于直觉AI与无人驾驶你知道多少呢?
TC-PT型40GHz高速光探测模块
会议室中的应用拼接屏和LED显示屏二者该如何选择
Python股市数据分析教程——学会它,或可以实现半“智能”炒股
直播行业是否会成为5G技术的第一款杀手级应用
品牌英飞凌BTS5210G
Silicon Labs推出新一代硅电视调谐器,具有最高性能、集成度及最低系统成本
小米11首支夜景视频公布:支持计算摄影
模数转换器性能参数对硬件选型的重要性