思必驰|思必驰会议魔方背后有何黑科技?三大算法核心技术加持


思必驰|思必驰会议魔方背后有何黑科技?三大算法核心技术加持
文章插图
智东西(公众号:zhidxcom)
作者 | 韦世玮
编辑 | 漠影
思必驰在AI智慧办公赛道上正不断玩出新花样!
两个月前的上海AWE(中国家电及消费电子博览会)上,思必驰首次亮相了面向智慧办公场景的新产品——会议魔方M1,具有蓝牙和USB两种连接方式、360°全向麦克风拾音、智能降噪和录音转文字等功能,大大满足了各类办公场景的会议需求。
作为我国人工智能语音行业的独角兽,思必驰在这条赛道上已布局多年,构建了语音识别、声纹识别、口语对话系统等一系列核心技术,其自然语言交互解决方案已落地车联网、IoT及政务、金融等行业场景。
与此同时,思必驰长期以来也为许多合作伙伴提供了会议场景下,声音采集和处理的软硬件解决方案。而会议魔方M1推出,也是思必驰将这部分智能语音技术向更加专业的方向集成拓展。
思必驰|思必驰会议魔方背后有何黑科技?三大算法核心技术加持
文章插图
作为思必驰智能语音技术的集大成产品之一,会议魔方M1背后的技术城池是如何构建的?能解决哪些行业及用户的痛点需求?未来产品迭代路径是如何规划的?
为此,智东西与思必驰智慧办公业务负责人进行了深入交流,在尝试寻找上述答案的同时,也看到了不少思必驰打磨会议魔方系列背后的思路和闪光点。
一、三大核心技术加持,会议魔方的技术护城河在深入交流之前,我们也亲自体验了一下会议魔方M1,看看使用它来进行远程会议是不是真的那么方便。
刚拿到会议魔方M1,我们感觉它比一台iPhone 12要重一些,形状是一个塔尖被“削平”的倒金字塔形立方体,重量只有260g,方便携带。
在一次业务周会中,我们体验了一下它在多人远程会议场景下的使用效果,并和手机进行了对比。参加远程会议的异地同事反馈,会议魔方的拾音效果明显优于手机,对环境噪音的抑制能力很强,以往在远程会议中不可避免的键盘敲击声、开关门声、以及空调运转声等,在使用会议魔方时,都没有听见。与会发言者们的声音也始终非常清晰,无论远近,听到的音量都几乎一致,没有忽高忽低现象出现。
思必驰|思必驰会议魔方背后有何黑科技?三大算法核心技术加持
文章插图
如果要使用会议魔方的录音以及“语音转写”功能,在初次使用时,首先要下一个名为“晓语听听”的APP,打开后根据软件提示进行绑定。绑定成功后,直接点击软件下方的“蓝色加号–开启录音”,会议魔方M1就会同步开启录音,记录会议内容。

思必驰|思必驰会议魔方背后有何黑科技?三大算法核心技术加持
文章插图
从结果上来看,在我们长达3个小时的会议中,会议魔方M1除了口语交流中的少数同音词、多意词没有识别准确外,其他大部分的对话内容都能准确且流畅地转写完成。还可以快速生成会议记录,一键分享给参会的同事。
之后,智东西在和思必驰智慧办公业务负责人的沟通中了解到,会议魔方M1流畅的远程会议体验背后有三大核心算法技术,一是拾音,包括远距离拾音;二是智能降噪;三是对语音进行识别和转写,整个过程也是沟通信息被数字化和智能化处理的过程。
1、拾音:5米内全方位清晰拾音
思必驰|思必驰会议魔方背后有何黑科技?三大算法核心技术加持】用户所处的空间环境不同,给会议魔方M1带来的拾音挑战也不同。目前,会议魔方能够做到在75分贝条件下,清晰拾取5米内的任何语音。
思必驰|思必驰会议魔方背后有何黑科技?三大算法核心技术加持
文章插图
2、降噪:3项智能降噪核心
拾音后的降噪工作是一个大工程,涉及到噪声抑制、回声消除、增益放大等技术。
一方面,通常会议场景中也会存在许多噪音,包括会议室外有人说话、走动、敲键盘,或是室内空调、风扇的声音,会议魔方M1则需要对这部分噪音进行噪声抑制,把会议中的人声清晰地呈现出来。
另一方面,由于设备的扬声器和麦克风连接得很近,当人们在讲话过程中很容易出现回音,这也会影响到用户的通话效果,这时就需要对拾音内容进行回声消除。
同时在远距离拾音过程中,有些说话人离麦克风较远,会议魔方M1也需要对这部分声音进行增益放大处理。
思必驰|思必驰会议魔方背后有何黑科技?三大算法核心技术加持
文章插图
3、转写:实际会议场景中准确率达95%
正如前面的体验,目前会议魔方M1在转写方面有两项核心功能,一是区分说话人,根据声纹和音色的不同,让转写文字能按不同说话人段落显示;二是文本智能校正,识别口语中常出现的反复、停顿等表达,让转写文本更加流畅。