3G移动语音编码标准

在mp3之后,3gpp又制定了一系列的语音编码(压缩)新标准──aac和amr家族。aac家族包含了aac、he-aac、eaac+;其竞争对手amr家族则包含了:amr、amr-wb、amr-wb+。这些新技术足够让人眼花缭乱,但对手机芯片、制造业者和工程师而言,这是一个崭新的机会。
aac
aac(advanced audio coding)也称为mpeg-2 aac,是一种数据会遗失(lossy)的语音串流压缩标准。aac是mpeg-2的一部份,是用来取代mp3的,但是aac和mp3不同,aac无法向后兼容,mp3可以,例如:mp3可以和mp2兼容。
aac最多可以支持48个频道,取样率从8 khz到96 khz。aac的语音分辨率(resolution)比mp3高,一般而言,96 kbps的aac之语音品质优于或等同于128 kbps的mp3,因此,aac可以在低速的网络内传输语音串流,而且,不会影响语音的品质。
he-aac(aac+)
he(high efficiency) aac又称为mpeg-4 he-aac或简称aac+,它是mpeg-2 aac和sbr(spectral band replication)带宽延伸修订版的技术组合。he-aac不是要取代aac,而是要延伸mpeg-4的语音品质,能够以更低的速率传输(32 kbps)。而且,he-aac译码器可以对aac解碼。
若要产生48 kbps的he-aac立体声,he-aac编码器会产生两种信号:一个是42 kbps的mpeg aac信号,另一个是6 kbps的sbr信号。然后,此sbr信号置于mpeg aac的辅助字段内(该字段是mpeg-4定义的)。最后,构成一个完整48 kbps的mpeg-4 he-aac串流。sbr代表高频的成份,而aac代表低频的成份。he-aac译码器使用aac和sbr信号,产生全频信号;而aac译码器只使用aac信号,亦即,只有低频成份被它解碼。
he-aac能传输48 kbps的cd立体声,或128 kbps、5.1声道的“环场声”(surround sound)。这样的效率,使它适用于internet传输,或移动数字广播。不过,由于he-aac的高延迟特性,使它不适用于双向的通信应用。
eaac+
enhanced aac+(eaac+)是在2004年时,纳入3gpp的第6版标准中。根据3gpp,它是由mpeg-4 aac、mpeg-4 sbr和mpeg-4“参数立体声”(parametric stereo)技术组合的。“参数立体声”技术能够在低传输率中,进行“立体声”的编码,其基本原理类似sbr。
amr
amr(adaptive multi-rate)标准是在1998年被提出。它的主要功能是提供移动装置使用的基本语音(baseline speech)。它以可变速率的非立体声(mono)传输,速率在4.75 kbps~12.2 kbps之间,它属于窄频,带宽只有3.5 khz。它被3gpp当成3g无线电网络系统的基本编译码技术;3g是从gsm、wcdma、edge、gprs演变而来的,而且,不管是2g、2.5g或3g,amr都是这些无线电网络标准的最基本编译码技术。
amr的基本原理是:当通信干扰增加时,就降低编译码速率,而且还能实现更多的校错(error correction)功能。amr也可以让不同手机系统的编译码技术之间能够尽量兼容,这是靠acelp(algebraic code excited linear prediction)技术达到的。acelp是一种语音压缩系统,它可以在低速的网络环境中,提供高品质的语音。
amr-wb
amr-wb(wideband extension)是amr的升级版,它也是使用acelp技术。2000年12月时,etsi/3gpp将amr-wb标准化,并公布于世。itu-t在2002年采用它,并另命名为g.722.2。
由于amr-wb的语音带宽很宽(50 hz~7 khz),所以它的语音品质很高。它具有9种采样速率(都是非立体声),分别是:23.85 kbps、23.05 kbps、19.85 kbps、18.25 kbps、15.85 kbps、14.25 kbps、12.65 kbps、8.85 kbps、6.6 kbps。其中,能够保持高的语音品质,并且速率最低者是12.65 kbps。amr-wb已经被umts/imt-2000无线电网络采用,作为它的编译码基本技术;umts也是一种3g新标准。
amr-wb+
2004年9月,etsi/3gpp将amr-wb+标准化。amr-wb+是amr-wb的升级版,它使用acelp和tcx(transform coded excitation)技术,提供高品质的语音和其它音频内容──这包括:自然声、数字音乐、与音乐相混合的声音(voice-between-music/voice-over-music)。
amr-wb+增加了立体声信号和支持更高的采样速率。并且,使用高效率的“参数立体声”(he-ps)技术,能够以低速率传输高品质的立体声。tcx转换编码技术则补偿了acelp的不足。
amr-wb+的采样速率是从6 kbps~48 kbps;立体声的采样速率是8 kbps~48 kbps,非立体声的采样速率是6 kbps~36 kbps。这使得它的语音带宽更宽(24 khz),接近cd的语音品质。此外,amr-wb+可以和amr-wb兼容。
技术比较
根据欧洲广播联盟(ebu)的人工测试(其方法称为mushra),除amr家族尚未测试以外,编译码后的语音品质最好者是aac+,在采样率为48 kbps时,它的品质与cd一样好。其它技术的语音品质,按优劣顺序分别是:mp3pro、aac、real 8、7 khz lpf、wma 8、mp3、real g2、3.5 khz lpf。
按照3gpp的分类,依传输率大小,可区分成两类:
1. 低于或等于24 kbps者:arm-wb+、he-aac/aac+、eaac+。
2. 高于24 kbps者:he-aac/aac+、eaac+。
根据3gpp的mushra测试结果,arm-wb+在采样率为48 kbps时的语音品质最高。若以arm-wb+与eaac+做比较,在采样率低于24 kbps时,arm-wb+的立体声优于eaac+。
结语
目前,aac和amr-wb技术已经被使用于2g和2.5手机中。而aac+、eaac+和amr-wb+则被使用于3g手机中。它们的应用如图1所示。音乐手机比视频手机、电视手机更早被市场接受。但是,mp3播放机的价格却一直下滑,所以,音乐手机或音乐播放机极需要aac+、eaac+和amr-wb+的兴起和普及,以带动另一波的购买热潮。

如何选择医疗器械的连接器?
VectorCAST/QA如何在LiteOS-A内核上实现系统白盒测试
节卡机器人上半年销量比上升超200%,如何逆势生长?
MIPS出售引群雄折腰 芯片市场混战必将加剧
大族激光PCB业务有望延续增势
3G移动语音编码标准
华勤技术或成为科创板手机ODM产业第一股
未来音圈模组3D打印的鞋子将会慢慢的实现市场普及
CRT阴极射线管的组成和运行原理
外星人x15 R2怎么样:游戏本电脑的品牌首选
主动红外入侵探测器的安装环境_主动红外探测器的安装注意事项
联通上线5G升级包 9.9元即可畅享5G流量
嵌入式状态监测与故障诊断装置设计
智能硬件创新设计行业走势及战略布局
基于LINUX的嵌入式浏览器的设计与实现
华为史上最好看手机今天发布 叫板iPhone7
带鱼屏+升降镜头?颜值超高,但看到处理器?再见?
适用于传输少量数据的蓝牙低能耗技术
IBM助力客户斩获多项IDC中国未来企业大奖
三种write mode,你真的理解吗?