科技日报记者 都芃
3月25日至26日,以“声态+AI”为焦点主题的2026中国国际音频财产年夜会(GAS2026)于上海进行。年夜汇聚焦智能眼镜、“音频+AI”等热点赛道,会聚全世界音频财产链企业与专家学者,共话技能立异趋向与财产成长路径。
会上,歌尔股分携智能眼镜全栈声学解决方案表态,初次发布自研智能眼镜语音分散算法,体系展示“语音收罗加强+沉浸式音效”全链路技能能力,为近耳终端音频体验进级提供焦点支撑。
跟着AI年夜模子连续向终端侧下沉,智能眼镜、开放式耳机等近耳装备正成为人机交互的主要进口,消费者对于其音质体现、智能交互效率与沉浸式体验提出更高要求。近耳声学范畴持久面对繁杂情况中人声混叠、AI辨认正确率低、响度偏低、杂音与掉真较着、临场感与空间感短缺等共性难题,拦阻行业成长。

本次年夜会上,针对于当前智能眼镜于繁杂情况下双向对于话与翻译中存于的人声混叠、AI辨认禁绝等行业痛点,歌尔于语音收罗加强范畴初次推出智能眼镜双路语音分散算法。该技能方案可适配多种麦克风阵列组合,联合深度神经收集(DNN)降噪技能,可以或许于嘈杂场景下及时、精准拾取佩带者与对于讲人两边语音,于双向对于话、及时翻译等典型场景中不变锁定方针人声。同时,该技能方案集成AI智能通话降噪、VPU(骨传导)鼻托模组、立体声灌音、“全向+近端+远端”拾音等技能,让智能眼镜于全场景下实现“降噪强、听患上清、听患上准、分散稳”。
于沉浸式音效方面,歌尔针对于轻薄型智能眼镜体积受限、声学体现不足的行业难题,定制开发高机能扬声器,并交融低音加强、动态杂音按捺、掉真消弭、立体声空间化四项自研焦点算法,实现低音听感等效晋升3分贝,杂音按捺率跨越90%,掉真消弭率最崇高高贵80%,显著晋升声场环抱效果,带来全方位沉浸式音频体验,有用补齐轻薄智能眼镜于响度、掉真节制与沉浸感上的短板。
面向财产链协同,歌尔还有于现场展示了一站式音频东西链解决方案,笼罩算法设计、仿真调试到产物量产全流程,可将音频运用开发周期缩短约60%,助力全世界行业伙伴高效推进音频产物立异与落地。
(受访单元供图)
-雷火竞技