当前位置:首页 > 汽车电子 > 汽车电子
[导读]一辆新能源汽车以120km/h时速行驶时,车内麦克风采集到的不仅是驾驶员的语音指令,还有胎噪、风噪、空调声等多重干扰的叠加。实测数据显示,高速行驶时的车内背景噪声可达75-85dB SPL,而人正常说话的声音仅约65dB。这意味着麦克风接收到的信噪比可能为负值——语音信号完全淹没在噪声之中。传统单麦克风降噪方案在此场景下力不从心,而结合麦克风阵列与智能降噪算法的声学前端技术,正在成为车载语音交互、TWS耳机通话、AI眼镜录制的核心突破点。

一辆新能源汽车以120km/h时速行驶时,车内麦克风采集到的不仅是驾驶员的语音指令,还有胎噪、风噪、空调声等多重干扰的叠加。实测数据显示,高速行驶时的车内背景噪声可达75-85dB SPL,而人正常说话的声音仅约65dB。这意味着麦克风接收到的信噪比可能为负值——语音信号完全淹没在噪声之中。传统单麦克风降噪方案在此场景下力不从心,而结合麦克风阵列与智能降噪算法的声学前端技术,正在成为车载语音交互、TWS耳机通话、AI眼镜录制的核心突破点。

一、风噪的物理特性与麦克风阵列的应对原理

1.1 风噪的频谱与空间特征

风噪不是单一的噪声类型,而是湍流气流与麦克风物理结构相互作用产生的复杂声学现象。其核心特征包括:低频主导(能量集中在500Hz以下)、非平稳性(瞬时波动剧烈)、空间相关性低(不同麦克风位置的风噪信号几乎不相关)。这些特性决定了风噪难以用传统谱减法有效抑制——算法无法稳定估计噪声基底,且过度抑制会造成语音失真。

韩国铁道研究院的研究揭示了高速场景下噪声源的复杂性。他们采用144通道麦克风阵列对KTX高速列车(时速300km/h)进行噪声源可视化测试,识别出三类主要噪声:轮轨滚动噪声(200-800Hz)、牵引系统机械噪声(中频),以及气流绕流产生的气动噪声(高频段尤为突出)。这一研究表明,高速移动场景下的声学环境是多源、宽带、动态变化的,要求拾音系统具备空间选择性。

1.2 麦克风阵列的空间滤波本质

麦克风阵列的核心能力是“空间滤波”——通过多个麦克风的空间分布,构建具有方向选择性的接收模式。其物理基础是声波到达不同麦克风的**时间差**与**幅度差**。对于间距为d的线性双麦克风阵列,声源入射角θ与到达时间差Δt的关系为:Δt = d·sinθ/c(c为声速343m/s)。

当目标声源(驾驶员说话)位于阵列的特定方向(如正前方0°),而风噪来自四面八方且空间相关性低时,阵列可通过**波束成形**算法,在目标方向形成高灵敏度主瓣,在其他方向形成低灵敏度旁瓣。以延迟-求和波束成形为例,通过对两路信号进行时间补偿后相加,目标方向的语音信号相干叠加(幅度翻倍),而各向同性的噪声非相干叠加(功率仅增加一倍),实现理论最大6dB的信噪比提升。

二、硬件架构:从麦克风选型到阵列布局

2.1 麦克风选型的关键参数

针对车载和移动场景,麦克风选型需重点考量以下指标:

信噪比(SNR):典型值为64-68dBA,决定了拾音系统的本底噪声水平。高SNR麦克风在弱语音场景(如轻声指令)中尤为重要。

灵敏度一致性:同一阵列中的麦克风灵敏度差异应控制在±1dB以内,否则会引入额外的方向性误差。

声学过载点(AOP):需大于120dB SPL,以应对突发大声音或近场强信号。

2.2 阵列拓扑设计

不同应用场景适配不同的阵列拓扑:

线性双麦阵列(间距3-5cm):适合智能音箱、车载语音,波束指向性强,可有效抑制侧后方噪声。间距选择需权衡:5cm间距在1kHz频段的理论定位精度约3.6°,但过大的间距会导致高频空间混叠。

环形4麦阵列:如ReSpeaker XVF3800,支持360°声源定位,适用于会议系统、机器人等需全向拾音的场景。其波束成形模块可同时输出多个固定波束和扫描波束,方位角估计精度达±10°。

耳戴设备双侧阵列:Bose公司专利中描述的耳麦双侧麦克风阵列,利用左右耳机上的前后麦克风组合(共4路信号),通过加权合并可生成近场语音波束(对佩戴者自身说话敏感)和远场环境波束(对外部声音敏感),并动态调整分频点以适应风噪强度。

在电路设计层面,多麦克风系统的关键挑战是通道同步。各麦克风信号的采样时钟必须严格对齐,否则引入的亚微秒级时钟偏差会转化为明显的定位误差。推荐使用支持多通道同步采样的音频CODEC(如TLV320AIC3254),其内部锁相环可将通道间延迟控制在1个采样周期内。

三、算法引擎:风噪抑制的三大核心技术

3.1 广义旁瓣对消器

GSC是自适应波束成形的经典架构,由三部分组成:固定波束成形器(FBF,指向目标方向)、阻塞矩阵(BM,滤除目标方向信号输出纯噪声参考)、自适应噪声对消器(ANC,根据参考噪声动态调整权重,从FBF输出中减去噪声分量)。

在风噪场景下,GSC的阻塞矩阵设计尤为关键。由于风噪的空间相关性低,传统延迟-和阻塞矩阵效果有限。改进方案是在辅助路径中引入语音活动检测,仅在非语音帧更新噪声协方差矩阵,避免语音信号被误消除。

3.2 风噪状态检测与自适应参数调节

风噪是非平稳的,算法需实时感知“当前风有多大”并动态调整策略。Bose公司的专利提出了一种巧妙的检测方法:比较麦克风信号的**和信号**与**差信号**的能量比。

其原理是:在无风噪条件下,目标声源(语音)在两个麦克风上高度相关,和信号能量远大于差信号;而当风噪占主导时,由于风噪在空间上不相关,差信号能量显著上升。通过计算和差比,系统可实时估计风噪等级,并据此调节三个参数:高通滤波器的截止频率(风噪增大时提高截止频率,牺牲低频语音保真度换取噪声抑制)、波束成形的主瓣宽度、以及降噪算法的过减因子。

3.3 频点加权GCC-PHAT时延估计

准确的声源定位依赖于可靠的**到达时间差**估计。GCC-PHAT算法通过对互功率谱进行白化处理,增强频谱尖锐性,在传统噪声环境中表现优异。但风噪的频率选择性会污染特定频点的互相关函数,导致定位抖动。

针对这一问题,学术研究中提出了基于频点离散值加权的改进GCC-PHAT算法。该方案首先计算各频点的信噪比估计值,对低信噪比频点赋予较低权重,从而抑制风噪污染频点对互相关峰值的干扰。实测表明,该算法在10m/s风速条件下的时延估计误差可控制在0.5个采样周期以内。

四、产业落地与效果验证

4.1 AI眼镜的风噪录制解决方案

户外录制vlog时,迎面吹来的大风常使语音素材报废。艾为电子推出的帝江™上行音频算法系列,专门针对AI眼镜等穿戴设备设计了风噪处理模块。

该方案采用多麦克风阵列(支持2-8路),通过麦克风状态检测模块实时识别哪些通道正受风噪冲击(风噪在物理上表现为气压脉动,可通过低频能量突增和信号过零点率异常判断),并将“噪声标志”传递给后续处理链路。降噪模块依据此标志动态调整降噪强度——无风时保留高频细节和空间环绕感,大风时提升语音信噪比、保留必要环境音但抑制湍流噪声。实际测试显示,在骑行场景(风速约8-10m/s)下,开启风噪算法后的语音可懂度从45%提升至82%。

4.2 车载高速通话实测

某车型在120km/h时速下的实测数据显示,采用双麦克风阵列+FFNS(远场噪声抑制)技术后,语音清晰度提升35%,误码率降至0.3%以下。其中,风噪能量在200-800Hz频段被抑制15-20dB,且通过动态调整高通滤波器截止频率,语音的低频共振峰保留完整,避免了“机械音”失真。

4.3 可穿戴设备的实时处理能力

对于TWS耳机等对功耗敏感的设备,模拟电路方案展现出独特优势。通过无源高通滤波网络和运放构成的减法器实现基本波束成形,可在不启动ADC/DAC的情况下完成噪声抑制,典型工作电流低于2mA,较全数字方案节能60%以上。

结语

高速风噪曾被视为语音交互的“不可抗力”,但麦克风阵列与智能算法的协同正在打破这一局限。从Bose耳机的双耳阵列动态分频,到艾为帝江的AI眼镜风噪检测,再到高速列车上的144通道声源定位,核心逻辑一以贯之:利用空间维度信息补偿时间维度的信噪比损失。随着边缘AI算力的提升和传感器融合的深化,声学前端的“抗风噪”能力正从“听得见”向“听得清、听得懂”迈进,为全场景智能语音交互扫清最后一片障碍。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除( 邮箱:macysun@21ic.com )。
换一批
延伸阅读

  为了寻找具有创意的智能语音设计方案,我爱方案网联合科大讯飞举办的2016讯飞智能语音设计大赛正在火热报名中,截止现在,我们已经收到了近100名参赛名额与优秀的设计方案。本文将介绍其中一位参赛

关键字: 汽车电子 语音识别 麦克风阵列

1 麦克风阵列         麦克风阵列,是一组位于空间不同位置的全向麦克风按一定的形状规则布置形成的阵列,是对空间传播声音信号进行空间采样的一种装置,采集到的信号包含了其空间位置信息。根据声源和

关键字: 麦克风阵列

便于座舱舒适的音频技术 图2:典型的CSE简化框图 在图2中,您会注意到,声音由麦克风阵列捕获;这种情况下,阵列包括四个模拟驻极体电容麦克风。尽管在图2中未显示,但典型的驻极体电容麦克

关键字: 信噪比 音频信号 麦克风阵列

(文章来源:易车网) Google和Amazon是人工智能领域公认的两大巨头,和国内的小米、百度等智能语音公司一样,都以智能WiFi音箱为入口,推进各自的人工智能战略。但是Google 

关键字: 语音交互 麦克风阵列 人工智能 GOOGLE

过去的几十年里,安防行业一直聚焦在以视频监控为核心的视觉技术的应用方面,由此也带来了视频监控相关产品的持续演进。而伴随着城市精细化管理进程的加快,除了视觉感知系统的建设之外,基于声学技术的听觉系

关键字: 智能安防 声学 噪音 麦克风阵列

(文章来源:数码猴子) 随着AloT物联网产业的纵深发展,智能语音交互技术也成为应用最普遍的交互技术。除了最常用的智能手机外,智能音箱、智能家居、智能机器人等众多智能终端设备的语音应用不

关键字: 语音交互 核心技术 语音识别 麦克风阵列

因为资本的涌入、智能家居的火热和人工智能的崛起,市场对语音市场的关注度迅速提升。尤其是近年来随着亚马逊、谷歌、华为和BAT等厂商入局智能音箱,争先押宝这个智能家居的关键入口之后,语音市场变得空前

关键字: 语音识别 神经网络 噪声 降噪算法

AI芯片创企探境科技发布用于语音识别降噪的高计算强度神经网络(HONN),并提出了增强识别一体化的端到端识别流程。HONN在远场和高噪声等环境下的识别率明显优于DNN。 此前在今年9月,

关键字: 神经网络 语音识别 降噪算法 AI

12月31日消息,OPPO公布了OPPO Enco Free真无线耳机首销战报: 获京东平台耳机类目销量和销售额双料第一; 获天猫平台蓝牙耳机类目销售额第一; 获苏宁易购

关键字: OPPO 真无线耳机 降噪算法 AI

采用赛普拉斯CYW43438 型号Wi-Fi与BLE组合(Combo)芯片,广泛适用于智能音箱、DOT、电视盒子等语音智能产品,采用高集成度和高性价比一体化设计,具有全方向唤醒、声源测向、定向拾音、噪声抑制、混响消除、回...

关键字: 赛普拉斯 麦克风阵列 语音交互系列
关闭