首页 > 经典案例 > 政府部门

关于五麦克风环形阵列的分析

发布时间:2023-09-04 21:43:48   来源:江南体育官网

  。自2015年3月和8月,讯飞相继对外发布四麦、二麦麦克风阵列解决方案。今天在深圳阿基米互联网公社举办的“讯飞核心技术开发日——麦入云端,引领

  在科大讯飞15年底年度发布会上,在场的3000余人见证了这样的一场人机互动:演示人员在5米开外,用声音操控叮咚音箱,完成了一系列高难度的订票任务,引来台下阵阵惊叹——现场那么嘈杂,叮咚音箱却如此“听话”,要让叮咚音箱听懂这么多声音,而且具备远场识别的功能,它必须听的到,而且要听的更加清晰,人类可以带上助听器,机器要说明呢?【麦克风阵列】就充当了助听器这样的角色。可以说,麦克风阵列犹如远场识别的心脏。有了这颗“机器之心”, 在远场场景中,就可以一举解决在了远场识别中遇到的背景噪声、其他人声干扰、回声、混响等核心问题。

  讯飞开放平台副总经理马汉君进行了开场演讲,马汉君以”科大讯飞——人工智能引导者“为主题系统地介绍了人工智能的起源和发展,以及讯飞在AI领域里的最新研究成果和在人工智能+IOT时代的愿景和目标,并在演讲的最后详细的阐述了于去年底发布的人机交互界面——AIUI。

  马汉君说:“AI将助力IOT时代的蓬勃兴起,而科大讯飞的愿景则是加速这一过程。当前讯飞的自然开放交互平台上的应用已超越90000个,连接终端超过8.8亿台。接下来讯飞将通过深度神经网络与大数据的结合,实现AI从“能听会说”到“能理解会思考”的突破。2014年8月,科大讯飞成为中国首个人工智能项目“类人答题机器人”的牵头单位,真正开始启动超脑计划。未来,讯飞超脑将能参加高考甚至取得“一本”的成绩。

  在2015年,讯飞发布了AIUI,这是一个智能硬件量身定做了智能交互方案,重新定义了万物互联时代人机语音交互标准,具备了远场降噪、方言识别、语音纠错、多轮对话等功能。通过统一接口、开放的服务扩展、灵活的能力搭配实现人机交互与产品体验的结合,科大讯飞希望和合作伙伴一起,用人工智能改变世界。

  讯飞开放平台智能硬件产品总监张良春则从人机交互的三大痛点谈起,介绍了讯飞在这样一些问题的看法以及解决之道。“咬耳朵”不是智能交互,让机器人能远场对话,需要用麦克风阵列。现在讯飞推出有最新的环形五麦克风阵列,远场拾音距离可达5米。相比以往线°全平面拾音角度,而且去噪效果更好,抗环境噪音的能力更强。

  总的来说五麦麦克风阵列功能特性包括:二维空间拾音、抗噪能力增强、远距拾取音频、支持连续唤醒、支持回声消除、支持语音打断。麦克风阵列模块优点是迅速集成,缺点成本比较高,适合小批量。所以讯飞也能够给大家提供麦克风软核方案,包括K、录音板、加密芯片和构型说明。目前软核方案有单麦软核、双麦软核、四麦线性软核、环形五麦软核和环形七麦软核。环形七麦支持5~7米拾音距离、360°声源定位、±10°声源定位精度,阵列录入的音频信噪比更高。

  在演讲的中,张良春还风趣的套用了周星驰电影国产凌凌漆中的一个桥段:咱们的产品只要一开口说话,无论在哪里,都像黑暗中的一只萤火虫,那样的鲜明,那样的出众……

  除了邀请讯飞开放平台的相关同事,此次发布会还特意从讯飞研究院邀请了信号处理领域的技术大牛王海坤博士。而王博士的发言无疑让此次本便干货满满发布会变得更泥泞。王博士从信号与信号声学处理谈起,全面的剖析了讯飞的麦克风阵列与回声消除技术。

  “噪声、混响、干扰和回声是声学信号处理要解决的问题,而这样一些问题的解决离不开麦克风阵列。讯飞采用声源定位技术,利用麦克风阵列用基于TDOA(到达时间差)计算声源距离阵列的角度和距离,实现对目标声源的跟踪。再通过波束形成技术,即在期望方向上有效地形成一个波束,仅拾取波束的信号,进而达到同时提取声源和抑制噪声的目的。对于混响,则使用麦克风阵列+深度学习,实现有效的混响处理“。

  “科大讯飞的回声消除技术更是达到国际顶尖水平,利用自适应滤波方法估计回声路径和利用参考信号求得麦克风拾取的喇叭声音,并将其减去。通过这一系列的技术,讯飞麦克风阵列实现了优异的声学信号处理,确保了良好的使用者真实的体验”。

  发布会最后做压轴演讲的,是讯飞开放平台智能硬件商务总监汤熙,汤熙以“生活不止眼前的苟且,还有诗和远方的田野”生动开场,着重介绍了开发者获取讯飞开放平台相关能力的一套流程。

  汤熙最后表示:如果你确定与讯飞合作,讯飞将提供深入对接的全套服务。我们在深圳、北京、合肥都有支持团队,除了技术上的支持+商务本地化服务外,讯飞还提供包括资本服务、宣传服务、渠道服务等多种服务。我们大家都希望在做好服务的同时,陪伴大家一同成长。讯飞会不断把核心技术做好,产品打磨好,把本地支持做好,只有这样才可以陪伴大家往前走。讯飞也许不够完美,但是完美的讯飞需要大家一起缔造。

  麦克风犹如远场识别的心脏和引擎,在其基础上,远场识别技术的远距离、高识别率支撑,现在用户在以家庭为单位的活动范围内,能够最终靠语音轻松操控家里的一切智能硬件设备,推而广之,搭载远场识别的智能硬件产品将无限扩大适合使用的范围和应用场景。未来,科大讯飞将依靠自身强大的人工智能科研实力与高品质的产品,更具创造性地去改变世界,让人们的生活更加美好。

  的识别率对比。另外也要提醒,语音识别率并非只有一个WER指标,还有个重要的虚警率指标,稍微有点声音就乱识别也不行,另外还应该要考虑阈值的影响,这都是

  ,是对空间传播声音信号进行空间采样的一种装置,采集到的信号包含了其空间位置信息。根据声源和

  ,是对空间传播声音信号进行空间采样的一种装置,采集到的信号包含了其空间位置信息。根据声源和

  波束成形 /

  模块能够在一定程度上帮助开发者迅速开发产品,非常大地节省产品研究开发周期,也提供包括单麦、双麦、四麦线性、

  的结构简单,成本低、容易实施、功耗低等特点让它更容易在家电产品中实现落地。目前国内主流家电厂商应用语音交互技术的产品中,海信电视、美的空调等选择的大都是双

  的原理、分类及作用 /

  146.【P216】第216讲 NX85同步建模技术详解六细节下拉菜单各命令 #硬声创作季