柯南中变声器的可实现性? 容貌是脸部

容貌是脸部器官各类参数信息的整合,声音也是一样
我去参加上一届青岛人工智能大会的时候就有一个功能很是类似的产品
你只需要和它说上四句话,它就能模仿你的声音,而且与真人差别无二
只听几句话，百度AI就能模仿你的声音 | 附论文效果
害怕！能模仿你声音的人工智能出现了_哔哩哔哩 (゜-゜)つロ干杯~-bilibili【柯南中变声器的可实现性?】

■网友的回复
理论上可行。可以通过语音识别系统，让机器获得说话者想要表达的信息，然后再通过语言合成系统，发出另一种声音发。整个系统可以理解为摄像机采集图像后，再通过电视播放出相关但不尽相同的画面的过程。既然视觉效果是可处理的，听觉一样可以。问题是，语言识别存在一定的误码率，且属于人工智能里颇有难度的课题。语音合成难度不大，我认为数据库建的足够大足够合理即可。由于只是改变声音而不是改变内容，所以无需触碰语义转换这个大难题。不过说话者如果胡言乱语，人和机器都听不懂，系统又该如何转换呢…呵呵
■网友的回复
问题好像是柯南用了变声器自己的声音还被屏蔽了…所以可能性不大吧？备注解释下:在推理的时候，别人只听到了毛利的声音啊。明明柯南的变声器是敞开式的，柯南声音去哪儿了？
■网友的回复
另外答案说的都有问题，要机器来识别语音也是逗逗的。很明显这是一个实时录音放音装置。微信用过吗？微信对讲机可以实时变音你该不会不知道吧。还有屏蔽自己声音的，你没有用过扩音器吗？自己的声音小，只要机器能接收到就行，而放出声音事正常对话的声音，当然就把柯南忽略了。PS目暮他们连柯南都没有发现，当然不会注意一个小孩弱弱的背景音！！