近年来,MP3技术受到了广大消费者的热烈欢迎。它的确是一种非常好的技术。一张和普通CD一样的碟片,可以储存高达600多分钟的高质量音乐,比普通CD多了将近10倍。尤其是随着Flash存储器的价格的降低,便携式的MP3更受到广大消费者的欢迎。现在512MB的便携式MP3播放器的价格在200-300元人民币左右,这已经是在广大的学生的购买能力范围之内。在2005年,国内全年的销售额达到了674.2万台。比2004年增长69%。而全球的销售量更高达5,600万台。根据In-Stat的预计,到2010年全球的MP3销售量将会达到2.86亿台。真可以说它是消费产业中的一颗灿烂的明星。
MP3的算法是很复杂的,在这里,我们将对MP3的算法进行一些深入浅出的解释和说明。
概述
MP3其实并不是什么新技术。它实际上就是一种音频压缩技术。而这种音频压缩技术早就在VCD中已经采用了。也就是MPEG-1的音频压缩技术。只不过现在把这种技术单独拿出来应用到音乐唱盘中去。但是为什么它会引起这么大的轰动呢?
在80年代初期,当时还广泛流行着密纹唱片,发明了CD唱盘。CD是Com-pactDisk的缩写。意思是轻便的碟片。CD唱盘相对于密纹唱片在技术上是一大进步。它第一次把高密度的激光存储技术应用到消费类电子产品中去。相对于原来的机械式密纹唱片,它带来了很多优点:音质好、体积小、重量轻、便于携带。相对于磁带录音机来说,它没有直接的机械接触,因而噪声低,不会磨损,使用寿命和保存时间提高很多。尤其重要的是,它第一次用数字技术代替了模拟技术,这为今后MP3的发展奠定了基础。
到80年代中期,CD唱盘的技术日益成熟,但是售价还比较贵。经过了将近10年的发展,CD唱盘现在已经完全取代了密纹唱片,也在很大程度上取代了录音机。它几乎已经深入到了每一个家庭。在汽车音响中也成为了标准装备。看来真像要千秋万代的存在下去。就在这个时候,出现了MP3。
MP3的光碟从外表上来看和普通CD完全一样,音质也不比CD差,但是它所需的存储容量却比CD小了将近10倍。这完全靠了数字压缩技术才能实现。
音频信号的数字化
普通的CD虽然采用了数字技术,但是它只是简单地把模拟信号加以数字化。为了把模拟信号数字化,首先要对模拟信号进行采样。根据Nyquest采样定律,通常其采样频率至少是信号中的最高频率分量的两倍。对于高质量的音频信号,其频率范围是从20Hz-20kHz。所以其采样频率必须在40kHz以上。在CD中采用了44.1kHz的采样频率。在对模拟信号采样以后,还必须对其幅度上加以分层。在CD中,其分层以后的幅度信号用16比特的二进制信号来表示,也就是把模拟的音频信号在幅度上分为65,536层。这样,它的动态范围就可以达到96分贝(6分贝/比特)。这种直接模数(A/D)变换的方法也称为PCM编码。直接数字化的最大缺点是比特率非常高。达到44.1x16=705.6kBbps,或即88.2kBbps。比特率高就意味着要求的存储容量很大。要记录1分钟的音乐,就需要5.292MB的存储容量。对于两路立体声,就需要10.584MB。而要记录几十分钟的音乐就需要几百兆的存储容量。
为了存储数字化了的音乐,就只能尽量开发高容量的存储系统。在70年代末,终于开发出了利用激光读写的光盘存储系统。因为这种光盘比起密纹唱片,无论在体积和重量上都要小得多,轻得多,所以称它为CD(CompactDisk)。意思为轻便的碟片。而一张CD的容量大约为650MB,也就只能存储61.4分钟音乐。
纯粹音乐CD通常也称为CD-DA。DA就是数字音频(Digital Audio)的缩写。它的技术指标是由一本所谓的“红皮书”所定义。这本红皮书是菲立普公司和索尼公司在1980年公布的。以后,在1987年,又由国际电工委员会(IEC)制定为IEC908标准。根据这些标准可以比较精确地计算一张CD所能存储的音乐时间。实际上在CD碟片中是以扇区为单位的,每个扇区中所包含的字节数为2352个字节。总共有345k个扇区。因此总的字节数为345kx2352=811440kB。可以存放76.92分钟的立体声音乐。还有一种方法来计算播放的时间,CD在播放时,其播放的速度为每秒钟75个扇区。一张CD有345k个扇区,因而可以播放的时间为345k/75=4600秒=76分40秒。两种方法计算的结果是一样的。
数字音频信号的压缩
因为音频信号数字化以后需要很大的存储容量来存放,所以很早就有人开始研究音频信号的压缩问题。音频信号的压缩不同于计算机中二进制信号的压缩,在计算机中,二进制信号的压缩必须是无损的,也就是说,信号经过压缩和解压缩以后,必须和原来的信号完全一样,不能有一个比特的错误。这种压缩称为无损压缩。但是音频信号的压缩就不一样,它的压缩可以是有损的只要压缩以后的声音和原来的声音听上去和原来的声音一样就可以了。因为人的耳朵对某些失真并不灵敏,所以,压缩时的潜力就比较大,也就是压缩的比例可以很大。音频信号在采用各种标准的无损压缩时,其压缩比顶多可以达到1.4倍。但在采用有损压缩时其压缩比就可以很高。下面是几种标准的压缩方法的性能。按质量由高往低排列。
需要注意的是,其中的Mbyte不是正好1兆比特,而是1024x1024=1048576Byte。必须指出,这些压缩都是以牺牲音质作为代价的,尤其是最后两种方法,完全靠降低采样率和降低分辨率来取得的。这对音质的损失太大,所以这些方法并不可取。
MP3评论送耳机活动继续进行,此次给予我们礼品支持的是魅族MP3。活动为每周10个获奖名额,每周公布一次获奖名单。奖品为魅族最新款的PT700耳机(评测文章),市价168元。 如确认自己已经中奖,请将通讯地址,电话,电子邮件地址发至meizu@zol.com.cn。
此次活动针对在MP3.ZOL.COM.CN频道发表评论的热心网友,并且礼品增加到每周10款。再次感谢魅族提供奖品,魅族官网:http://meizu.com.cn/。
- 第1页:数字音频信号的压缩 MP3技术浅释
- 第2页:MP3的压缩方法