ibm watson text to speech api,它能够将文本合成为多种语言、声音和方言的音频。这里面“allison”的声音音色很甜、很有吸引力,特别契合我的书中主人公 hailee tupper 的年龄和性格特点。
有这样一种说法,一张图片胜过千言万语。但事实上,清晰、措辞得当、音调和发音准确的口头语言能够更好地营造最难忘、最美好的画面。而人工智能已经取得了显著的进展,能够完成上述表达要求。
我想知道能否用一个女性人工智能声音来演绎我所著的“miraculous”一书中的主角,以让人信服的方式让听众相信她就是书中的真实角色。
我如何借助 watson api 赋予主角生命
在对多家公司的多个不同的 ai 角色进行试音后,我最终选择了 ibm watson text to speech api,它能够将文本合成为多种语言、声音和方言的音频。我选择了“allison”的声音,因为她的音色很甜、很有吸引力,同时也契合书中主人公 hailee tupper 的年龄。
为了帮助她演绎书中场景,我使用了文本转语音 api 的表达功能“expressiveness”,该功能可以使用情感元素扩展 ssml,而该情感元素能够表达好消息 (goodnews)、道歉 (apology) 或不确定 (uncertainty) 的说话语气(仅适用于美音 allison 声音)。可以进一步了解 ibm watson 情感语音服务 expressive ssml。
我的书中有数万个单词组合,watson allison 的声音能够以不同的方式处理这些单词组合。通过单独使用或组合使用三个情感语音情绪中的一个或多个情绪,并在说话时加上不同的停顿时间,她就能表达更多的情绪。
小说角色说话时会长短不一,因此会影响到一句话停顿的次数和频率,而这种停顿也需要计算。书中特定场景的总体情绪也会影响停顿的频率,如说话中止、语气平静和欢呼等。
下面,我将通过一个例子来展示上述技术有哪些作用。
若要完成此类项目,你是否必须成为一名 it 人员或程序员?我不这么觉得。不论怎么想,我都不可能成为计算机人员或程序员。但是,我想说的是,耐心、实践和创意都是非常重要的因素。这就像是一个故事的导演。整个过程会涉及大量的复制粘贴工作。关键要知道如何将代码粘贴至文本中的正确位置,最终达到预期效果。
假如您对此类项目感兴趣,我非常愿意与你分享我的知识和专业技能,比如,通过一个免费的视频,帮助您取得最佳成果。
最后,我想说的是,与 ibm watson 合作是一段美妙、精彩的经历。如果有可能,我很希望能够跟他握手致谢。
2018年性价比最高的电视盒子有哪些
HanLP 关键词提取算法分析
科学家在钙钛矿太阳能电池稳定性方面取得突破
realme X2 Pro大师版开启预约搭载骁龙855 Plus平台屏幕刷新率为90Hz
双十二宠耳指南:为何全球都在热捧韶音骨传导运动耳机
如何借助Watson API 赋予主角生命
贸泽顺利完成SOC 2 Type II、ISO 27001 Stage 2和Cyber Essentials认证
联通“瘦身健体2.0”升级版方案曝光,合并部门和减少领导配置
解读汽车连接器的基本结构和应用特点、发展趋势
教你手上没有开发板如何跑RT-THREAD STM32应用?
迅远RFID超高频桌面式读写器F5002
Achronix与BittWare共同研发FPGA芯片VectorPath加速卡
环境在线监测系统系统配套监测平台的介绍
赛灵思推出首款一体化SmartNIC平台,预计将于Q3季度批量供货
简化大规模视频监控系统的设计
什么是安全智能锁,它都有哪些功能
俄罗斯机器人能双手持枪,将于2019年发射太空
手撕英特尔i7 AMD“线程撕裂者”处理器型号曝光
南卡和漫步者蓝牙耳机哪个更好?两款游戏蓝牙耳机评测!
组件增益推动下一代协作机器人