首页 > 新闻中心 > 企业新闻

智能音视频设备浪潮来袭迪韵科技带你冲浪

作者:江南体育电子游戏 来源:江南体育app下载 时间:2024-01-09 17:06:53

  无需再回顾智能音箱的发家史,由亚马逊Echo引起的这股战火从国外一直蔓延到国内:联网巨头们加入了,无数智能硬件厂家,包括家电厂家,连内容提供商也开始加入了,智能音箱俨然已成为物联网技术应用的一大风口。很多类型智能音箱的火热反映出整个智能语音设备市场的持续升温。根据Global Market Insights数据则显示,未来七年全球语音市场的年增长为34.9%,预计到2024年市场规模达到110亿美元。如此诱人的市场自然不容错过,但是,对于想分享市场蛋糕的玩家来说,开发带有智能语音功能的设备真有想象中的那么容易吗?曾经,语音识别功能只出现在手机、平板这些成熟的移动互联网设备,多半以SDK集成或API调用来实现。但近几年,在物联网设备上集成语音功能的趋势越来越明显,除了大火的智能音箱外,可用语音控制的智能家电、智能家居产品都已出现。然而,对于想开发具备语音功能的智能硬件公司来说,打磨出使用体验较好的产品并非易事。语音功能涉及到器件选型与结构优化、远场拾音与信号处理、语音识别、语义理解、语音合成等多个环节,这是一个需要软硬件协同优化的全技术链条工作。单凭硬件或软件一方,根本支撑不了一个优异的产品和良好的交互体验。语音识别、语义理解、语音合成还可以调用几家巨头公司的云端接口(如国外的Amazon、微软,国内的百度等),而且已经能够较好的满足语音识别场景需求,但在设备端的拾音环节却会难倒一大批中小企业:麦克风选型所涉及的各项参数指标、声学结构的设计、信号处理、音频信号的传输等技术难点导致拾音效果不佳,即使云端的识别算法再强大,识别率也不会高。据深圳迪韵科技公司的CEO呼生刚指出,在物联网设备上整合语音功能是热点,也是难点:硬件上,为控制成本,主控芯片的功能承载和运算资源有限;软件上,没有如安卓生态那样成熟、易移植的算法;服务上,很多语音公司的技术支撑资源有限,项目并行服务能力没办法保证,使得在物联网设备上整合语音功能成为了很多中小企业甚至一些大企业的梦魇:明明是一个多功能定义的硬件产品,语音识别仅仅是其中一个功能特性而已,却使得公司将大部分ID与结构、产品、研发、项目管理、供应链资源全都投入其中了,实际效果还不一定保证。而一些语音识别公司不给力的服务又会带来产品研究开发进度拖沓,以及昂贵的NRE开发费,企业的痛楚可想而知。

  产品型企业要优质的语音方案支持语音产品没有通用的解决方案,因为产品实际的使用场景、使用环境对语音功能的效果影响非常大。呼生刚介绍,以家庭应用为例,其实家庭都是一个很复杂的噪声环境,不同房间里语音信号的处理差异很大。比如,浴室是一个相对封闭的环境,由于玻璃等介质的强反射性,会产生大量的多径反射和混响;客厅里木地板、瓷砖、墙纸等各种不同的反射介质形成了声音的多路径传播;而厨房里则主要是烟机的工作噪声和炒菜时的非稳态噪声。这些不同的噪声需要不同的算法来降噪,在声音的处理技术上对于整个业界来说都是痛点。针对需要语音识别功能的智能产品研究开发,迪韵科技首先已经很成熟对接了国内外主流的语音识别开放云,这些开放云从技术实力、场景化语音服务及收费情况去看,都是相当的好的选择。同时,迪韵科技提供了一整套软硬件结合的音频解决方案:包括单麦、双麦、3+1麦、6+1麦的麦克风阵列及相匹配的自有知识产权核心算法,这套算法在不同芯片平台上拥有非常良好的可移植性。

  迪韵科技还能够准确的通过客户需求提供定制化的方案服务,在产品定义之初就为客户提出声学建议,包括声腔的设计、器件的选型、麦克风阵列的选择和安放位置、针对使用场景的算法优化、语音信号网络传输优化等,保证最优的产品使用体验。迪韵自主开发的语音算法使得麦克风阵列通过I2S标准接口直接连到主控芯片就能完成语音的降噪功能,同时能基于客户对结构、产品和成本控制的要求,选择数字信号或模拟麦克风,驻极体或MEMS麦克风。对于硬件资源受限的开发项目,迪韵也可以非常完美的应用科胜讯等降噪芯片,将语音信号处理完全放在第三方DSP上,主控资源只需要处理客户的业务逻辑即可。两种方案大幅度的降低了产品的开发成本和开发周期,使得厂家在选择主控芯片时具有更大的自由度,更便利的保证了产品成功。

  音视频结合的应用和IP内容分发将成为趋势语音交互是智能产品交互形式的终极吗?从迪韵科技的对应用场景和商业逻辑的理解上来看,并不是,将音视频整合会成为继智能语音后的下一个趋势。还是以Echo为例,亚马逊在最近发布了搭载显示屏、具备视频通话功能的Echo Show,可看出亚马逊也将音视频的结合作为发力的方向。如何为用户更好的提供更方便快捷的应用服务?视频能提供比语音更丰富的信息:当用户询问天气时,语音还能对付;而当用户询问交通路线时,语音播报显然不如在屏幕上直接显示地图和路线更直观。能预见,随着亚马逊推出Echo Show之后,在物联网设备,尤其是智能家用设备上整合音视频功能将成为风潮。甚至在呼生刚看来,未来在家庭设备上,音视频功能会普及。用户走到各个房间各个角落,都可以跟设备发生音视频交互,形成一个分布式的人机交互系统。而不仅仅只有一个家庭中控中心,万物互联、实时互联不再是梦想。在语音交互的基础之上,迪韵还提供特色化的云服务功能:云存储、云录播与直播、人形识别、人脸检测、物块识别、IP内容分发等等。迪韵自主开发的编解码和网络传输技术提供云端、通信、设备端的一系列完整方案,保证音视频体验的协调性。迪韵还计划将所有音视频功能整合成一个SDK,客户只需依据需求灵活选用其中的某些功能就能够迅速开发出个人需要的产品方案。而在内容授权与合作方面,迪韵科技已经从产业链的核心合作伙伴获取了数百万首音乐及儿童教育的内容资源,通过授权和联合分发,使得客户的最终产品有着非常丰富的应用内容。通过迪韵提供的硬件、软件、内容的整体解决方案,保证客户的产品能快速落地,帮助客户取得商业成功。

  语音信号处理+音视频结合+内容分发,三位一体构成了迪韵科技完整的音视频解决方案,迪韵将自己定位于智能物联网设备的音视频整体方案商。呼生刚表示,“迪韵科技对商业经济价值链条具有深刻理解,为客户服务、保证客户商业成功是我们的核心宗旨。而且基于对自身技术的领先性和实用性的信心,迪韵正在积极地推进亚马逊的认证工作,为开拓海外市场准备好。迪韵的技术方案追求在有限的硬件资源和成本控制下,达到最优质的实际效果。科技不能永远追求极致,如果极致需要用高昂的价格来支撑,实际上用户也不会太接受。在智能家用产品整体处于发展期的大环境下,如何在价格和使用体验上取得平衡,如何在服务上取胜,也是厂家需要思考的,否则高昂的价格只会成为智能产品普及的障碍。”呼生刚指出。

  在日本,由于核电站停运使得火力发电的燃料费大幅度的增加,因此,自5月1日起,关西电力公司及九州电力公司分别将电价平均提高了9.75%和 6.23%。其他电力企业也是同样的状况,东京电力公司于去年9月进行了提价,北海道电力公司、东北电力公司、四国电力公司也在向政府申请提价。从4月 30日发布的日本10大电力公司的财年结算结果来看,除北陆电力公司、冲绳电力公司外,8家公司都为最终亏损。 遗憾的是,目前仍看不到电力企业业绩好转的征兆。原因主要在于,核电站全面重新再启动还没有眉目,并且日元贬值使得天然气进口价格处于上涨的趋势。不过,为了弥补电力业界的亏损而无限度提高电价的作法,在政治上也不会被允许。日本政府在改组日本原子能安全保安院的同时,

  电网如何革新未来 /

  导读:国外媒体今天撰文称,与PC市场不同,英特尔应当自主开发平板电脑和智能手机,以应对当前的弱势表现。 以下为文章全文: 英特尔以往浪费了很多时间,等待其合作伙伴开发足以与iPad和iPhone抗衡的产品。 此前,英特尔一直在等待着惠普和宏碁等合作伙伴开发基于英特尔的平板电脑,但却没有一点结果。随着曾经任职于苹果和Palm的麦克·贝尔(Mike Bell)的加盟,英特尔应当放弃以往的策略。 在上周五的任命中,英特尔表示,贝尔的“新职责是带领一支团队来开发突破性的智能手机参考设计,以便加快英特尔架构向这一市场的拓展。”所谓参考设计,从根本上讲,就是为用户更好的提供的设计蓝图,但对于英特尔的智能

  丰田研究院CEO普拉特     6月20日消息,据路透社报道,丰田先进研究部门主管表示,公司计划在未来5年内开发整合人工智能技术的驾驶辅助系统,以提升汽车安全性。     丰田近期成立了专注于AI的研发公司丰田研究院(TRI)。丰田研究院CEO吉尔·普拉特(Gill Pratt)表示,将通过让汽车提前预料和避开潜在事故状况来提升汽车安全性。     随着行业开发无人驾驶汽车的竞争不断加剧,丰田已表示丰田研究院将在未来5年投资10亿美元。本月初,丰田本土对手本田表示,将建立一个新的研发机构,专注于人工智能技术,从而加入了其他投资机器人技术探讨研究的全世界汽车制造商行列。福特、大众等制造商也在研发人工智能技术。

  格芯55LPx平台内含嵌入式非易失性存储器和集成射频,助力复旦微电子打造中国最先进的CPU银行卡。 格芯(GLOBALFOUNDRIES)及 上海复旦微电子集团股份有限公司 今日宣布,已利用格芯55纳米 低功率扩展 (55LPx) 技术平台,制造出下一代双界面CPU卡 芯片 。格芯55LPx平台能够将多种功能集成到单芯片上,从而提供安全、低功耗且具成本效益的解决方案,该解决方案尤其适合中国银行卡市场,包括金融、社会保障、交通、医疗和移动支付 等 应用。 复旦微电子集团股份有限公司的双界面 CPU 卡 FM1280 ,支持接触式和非接触式通信模式,采用低功耗 CPU 以及经过格芯硅验证的 55LPx 射频 IP 。 FM1

  4月29日,江苏林洋电子股份有限公司与华为技术有限公司签订全面合作协议。根据协议约定,林洋旗下的光伏电站将采用华为智能逆变器、无线年内,华为将作为智能光伏逆变器供应商协助林洋打造1.5GW以上业界最领先的智能光伏电站。 双方将在智能光伏电站解决方案及核心部件、智能光伏电站解决方案标准及联合创新、海外光伏市场合作等相关领域建立全面合作伙伴关系。 林洋负责这个的人说,此次与华为的合作,是强强联合、互利共赢。通过华为智能光伏电站解决方案精细化运营能保障发电量,提高电站投资收益。并借助高精度和高可靠的数据采集与大数据挖掘分析对电站持续来优化,促进光伏电站逐步走向主动经营管理。双方将利用项目开发与实施、尖端材料、数字信息技术

  StrategyAnalytics手机元器件技术(HCT)报告《2014年智能手机应用处理器市场占有率:高通、苹果和联发科攫取前三名》指出,2014年全球智能手机应用处理器市场录得21%的年增长率,市场规模达209亿美元。 StrategyAnalytics预计高通、苹果、联发科、展讯和三星LSI攫取全球智能手机应用处理器市场收益份额前五名。高通再次以52%的收益份额赢得全球智能手机应用处理器市场占有率第一名,苹果和联发科以18%和14%的份额尾随其后。 StrategyAnalytics执行总监SravanKundojjala谈到: 凭借高端骁龙芯片强劲的发展势头,2014年高通的骁龙801和805芯片并列

  一、为何需要进行形状识别? 货架的摆放不是一直都能固定在某个位置上的,当AGV要对货架进行一些拉取或者顶升等操作时,需要精准的知道货架的位置,此时AGV自身在地图上的定位是准确的,但是货架的位置在地图上却是未知的,这样我们应该对货架进行识别来确定货架的位置。而某些场景要求不能对货架腿做改造(如粘贴反光膜等),这样一个时间段就需要对货架腿的形状做识别。 二、货架腿形状识别要求 1、正常的情况下,货架是有四条腿,要求四腿形成一个矩形; 2、货架设计的别的部分都要求成轴对称的形式,包含:和顶升机构配合的限位孔、货架腿上支撑的货架部分; 3、货架内侧宽度要比机器人最大宽度宽20cm,也就是左右各冗余10cm的钻货架调整空间; 4、货架高度要求,

  一、功能简介 本项目使用Proteus8仿线单片机控制器,使用LCD1602液晶、按键、蜂鸣器、L298N电机驱动模块、直流电机、DS18B20温度传感器等。 系统功能: 系统运行后,LCD1602显示传感器检验测试的温度值;默认以自动模式运行,若按下K4键切换为手动模式,此时能够最终靠K1和K2控制风扇加减速,风扇档位共5档(0-5)。当再次按下K4键切换为自动模式;自动模式下,实时检测温度值,当温度高于上限且在2C范围内,以3档运行。当温度高于上限且在4C范围内,以4档运行。当温度高于上限且在6C范围内,以5挡运行。当温度高于上限且超过6C范围,以5档运行且蜂鸣器报警。若温度在上下限范围内,风扇以2档运行。若

  温控风扇设计简介 /

  能源(SE)应用

  ADI世健工业嘉年华——深度体验:ADI伺服电机控制方案

  解锁【W5500-EVB-Pico】,探秘以太网底层,得捷电子Follow me第4期来袭!

  Linux 内核 6.7 正式版发布:Bcachefs 文件系统上线,初步支持英特尔 Lunar Lake

  1 月 8 日消息,Linus Torvalds 宣布Linux Kernel 6 7稳定版本发布,引入了多项新功能和改进。据介绍,该版本拥有超过 1 7 万个非 ...

  随着“碳中和”的号召慢慢的变大,慢慢的变多的汽车行业转型生产电动汽车以此来解决碳排放问题,冷却系统成为电动汽车热管理发展的重要研究课题 ...

  OBU英文全称是On Board Unit,指的是车载电子标签(OBU),市面上常见的名称是粤通卡ETC、ETC速通卡、ETC苏通卡等。车载电子标签(OBU)是ETC ...

  我们之前简单描述了汽车MCU常见的安全启动。这里我们要对启动中所使用的加密算法进行描述。首先我们来分析在MCU中安全启动时所需要的成员 ...

  电动汽车动力电池热失控(thermal runaway)是指动力电池在使用或充电过程中出现过热并不受控制的情况,这样的一种情况可能引发火灾或爆炸等严重 ...

  站点相关:嵌入式处理器嵌入式操作系统开发相关FPGA/DSP总线与接口数据处理消费电子工业电子汽车电子其他技术存储技术综合资讯论坛电子百科