微软Edge,你这是人干的事吗?( 二 )


安装App之后 , 首先点击系统TTS设置把首选引擎更改为大声朗读 , 下面也可以调节语速和音高 , 还可以点播放进行试听 。

微软Edge,你这是人干的事吗?
文章图片
然后点击SSML语音合成标记语言 , 可以看到它默认的就是刚才那位女生Xiaoxiao的语音 。

微软Edge,你这是人干的事吗?
文章图片
那什么是SSML语音合成标记语言呢?
根据微软官方的解释:
语音合成标记语言(SSML)是一种基于XML的标记语言 , 可让开发人员指定如何使用文本转语音服务将输入文本转换为合成语音 。 与纯文本相比 , SSML可让开发人员微调音节、发音、语速、音量以及文本转语音输出的其他属性 。 SSML可自动处理正常的停顿(例如 , 在句号后面暂停片刻) , 或者在以问号结尾的句子中使用正确的音调 。

微软Edge,你这是人干的事吗?
文章图片
简单说 , 有了这个技术 , Xiaoxiao可以用更多的风格 , 或者说是情感来朗读了 。

微软Edge,你这是人干的事吗?
文章图片

微软Edge,你这是人干的事吗?
文章图片
我们简单听几个 , 看看到底和正常的风格有什么不一样?
沉着冷静calm
紧张恐惧fearful
生气angry
悲伤sad
轻蔑disgruntled
撒娇affectionate
那怎么用呢?比如说 , 下面的的代码就设置了Xiaoxiao生气风格的AI语音 , 把它复制粘贴到前面点开SSML语音合成标记语言之后的输入框内点击确定就可以更换风格了 。
更换其它风格时把angry换成其它单词就可以了 , 建议大家一定要试试(撒娇affectionate)这个效果 , 非常销魂 。
(不过我在实际测试过程中发现以上代码直接复制 , 有部分手机不生效 , 来回重复测试了N多遍 , 还是不能解决问题 , 怀疑问题出在微信对话框换行标记和编辑器的换行标记不一致 。
不过这个只能在你使用App中朗读功能时才能用 , 它并不能改变手机自带的语音引擎 , 比如说小爱同学 。
比如说 , 用之前安利的阅读App听书时 , 先在大声阅读App中设置不同的朗读风格 , 然后在阅读App朗读时勾选跟随系统就可以了 。

微软Edge,你这是人干的事吗?
文章图片
至于用哪个就看你喜欢什么风格了 , 说到这里 , 我估计你们又会在评论里说「我有一个大胆的想法」 , 你懂的 。
如此以来 , 这个应用场景就大大拓宽了 , 相信有很多小伙伴喜欢听书 , 不过可不是所有小说都有真人朗读版本 , 用这个就可以想听啥就有啥 。
结语
本来说到这儿就算完事了 , 从新Edge的大声朗读功能来看 , 微软的人工语音合成效果已经足够出色了 , 但这还不算完 。
微软一直都在憋大招 , 你觉得上面的效果就不错了对吧 , 来 , 再听听下面这段:
这是我从B站上一个关于小冰F201首次曝光的视频提取出来的音频 , 你从弹幕中就能感觉到这效果究竟如何:

微软Edge,你这是人干的事吗?
文章图片
看了这个视频的人 , 第一反应都以为这是真的 , 当知道是AI后 , 没有人不为之感到震撼 , 甚至有那么一丝恐惧:这是人工智能觉醒了吗?
就拿一位小伙伴的话来说:不管是语调、尾音、口音 , 甚至说每句话的抑扬顿挫 , 和普通的人实在太像了 。
我也不多分析了 , 感受就只一句:俺也一样 。

微软Edge,你这是人干的事吗?
文章图片

微软Edge,你这是人干的事吗?
文章图片

微软Edge,你这是人干的事吗?
文章图片

微软Edge,你这是人干的事吗?
文章图片
感兴趣的可以去看看视频bilibili.com/video/BV1LC4y1h7kA
不过目前这个代号为F201的人声目前还没有开放使用 , 我相信 , 这其中并不存在技术上的难关 , 正是因为效果过于逼真 , 如果开放使用可能会带来意想不到的隐患 。
现在的问题是 , 球已经踢回给人类了 , 留给人类代表队的时间真的不多了 。
新朋友先看这里:写过的软件分类合集!
黑哥从电子工业出版社的老师那里为大家争取到了送书福利 。 往后每天都会给留言获赞最多的1位小伙伴送去实体书一本 , 每天的书都不一样!包邮到家 , 大家踊跃留言吧!