构建语音入口:模组化音频系统选型关键要素

在构建具备语音交互能力的智能设备时,音频前端系统的稳定性与灵敏度直接影响用户体验。采用集成化音频模组可大幅缩短研发周期,但选型不当易导致唤醒率低、误识别等问题。本文围绕灵敏度、抗干扰、软硬件协同等维度,系统阐述模组选型的核心考量点。

物联网开发中,为产品赋予“听觉”与“语音”能力,是实现智能交互的关键一步。

模组通过开箱即用的内置音频方案与灵活扩展的外置音频方案,大幅降低了语音应用的实现门槛,让设备能听会说,开发更简单高效。

本文特别分享4G模组选型与硬件设计要点,为开发者提供实用参考。

一、模组音频支持概况

从主芯片是否原生支持音频功能来看,4G模组大致可分为两类:

1.1 主芯片支持音频功能

比如:Air724UG。

1.2 主芯片不支持音频功能

比如:Air780Exx系列、Air8000系列、Air700ECH。

▼ 音频芯片方案 ▼

尽管部分模组主芯片本身不支持音频,但可以通过搭配Audio Codec芯片实现音频功能。

常用的Codec是顺芯ES8311,其集成方式分为内置与外置两种:

1)内置ES8311的模组型号

Air780EHV模组已内置ES8311,开发更为便捷。

2)可外置ES8311的模组型号

Air780EHM

Air780EGH/Air780EGG

Air700ECH

Air8000全系列

此系列模组虽然没有内置ES8311,但可以将ES8311外置,通过I2S接口进行驱动。

特别注意:

即便可以搭配Audio Codec芯片顺芯ES8311,有些配置较低的模组型号(主要是指Flash和RAM4MB的型号),也无法支持Audio音频功能。

不支持音频功能的型号:

Air700EPM

Air780EGP

Air700ECP

综上,我们可以将是否支持Audio音频功能的模组型号归类如下:

wKgZO2mJhWqAQ3djAAIhvkya4mI164.png

二、硬件设计要点

以Air780EHV为例,作为支持多样化语音场景的4G-Cat.1模组,支持VoLTE高清通话/TTS语音合成/录音/MP3播放等功能;已内置Audio Codec芯片ES8311,支持1路Mic和1路Speaker,极大方便了硬件电路设计

得益于8MB Flash+8MB RAM的资源配置,Air780EHV在支持LuatOS二次开发时更加得心应手:UI、中文字体、触摸屏等多媒体功能也都可以支持,适用于有OPEN开发需求的智能语音交互场景。

2.1 管脚资源占用

由于Air780EHV内置了Audio Codec芯片ES8311,相应的,有一些管脚资源必然会被占用,明细如下:

wKgZO2mJhbWADG-bAAIkQ2uYDpw071.png

2.2 硬件参考设计

相关原理图与PCB、硬件参考设计、音频应用示例等资料,持续更新开放。

驻极体麦克风:Air780EHV已内置Micbias偏置,外面无需再加;

喇叭:必须外置音频PA,内置ES8311的音频输出无法直接驱动喇叭;

AudioPA_EN:芯片PA使能信号,涉及到POP音的控制

音频配件板:我们设计了AirAudio_1000,可以帮助大家搭配Air780EHV快速验证音频功能。

wKgZO2mJhi6AKy7oAAZpla6qhns610.png

今天的内容就分享到这里了~

审核编辑 黄宇

为您推荐

当前非电脑浏览器正常宽度,请使用移动设备访问本站!