子带编码(Subband Coding,SBC)是一种将时间域和频率域编码组合的技术。PCM宽带输入信号通过带通滤波器组分成许多频带子带,通过分析每个子带取样的频谱,依据心理声学模型来编码。输入音频信号通过变换编码变换到频域,根据心理声学模型对变换系数进行量化和编码。
为了达到最佳压缩效果,在自适应变换编码(ATC)中,应用模型自适应地对每个独立子带进行量化,但是子带内的系数都被量化到相同的位数。比特分配算法计算每个子带的最佳量化噪声,以达到要求的信噪比。循环分配提供附加的比特数来增加编码的余地,而且保持比特速率。通常在传输之前,已经被减少的数据经过无损压缩的熵编码。解码器对系数进行反量化,而且进行相反的变换来恢复时域信号。下图是一个自适应变换编码的例子。
(1)层次1一般用于不很强调低码率的场合,如数字盒式录放机(DCC)等。
(2)层2会有更多的比特数对声音信号进行编码,层2的音质比层1更高。同时,比特分配、缩放因子和量化样本值更加紧凑使得MP2比MP1压缩比更高,因而在消费电子和专业音频中有广泛应用。
(3)MP3其高压缩比、CD般的音质、开放性和易用性使之深受好评。高压缩比使MP3实际记录的信息量比压缩前小得多。根据不同的音质要求,其压缩比可在10׃1~96׃1。这样,一张只能容纳十几首歌曲的光盘,就可记录150首以上的MP3格式歌曲。MP3的这一特性,大大节约了节目成本,在商业上获得了巨大的成功,尤其在Internet网络上广为流行,成为目前流传最广的一种音乐压缩格式。不少厂商还推出了播放MP3的硬件设备。
图像信号的相关性是由象素间的相关性形成的。图像由按一定规则排列起来的象素组成的。所以,在同一扫描行的邻近象素间、同一帧的邻近行间、在活动图像中的同一位置的相邻帧象素间的灰度和色度往往相同或相近,我们称这种相关性为象素间冗余或空间冗余。
不能,只有若图像上相邻两像素点的亮度电平值相等/相近或者相邻两时刻同一位置上的像素的亮度电平值相等/相近,才能说明上述两种情况下的像素相关。
当室内有一个声源发声,室内任一点听到的声音按照到达听点的时间先后分为:直达声(又称主达声)、反射次数较少的早期反射声和多次反射形成的混响声。
直达声是指从声源直接传播到听音点的声音,它是接收声音的主体,直达声不受空间界面的影响。其声强基本与听点到声源之间的距离平方成反比衰减,即距离每增加1倍,声压级下降6dB。
早期反射声是指相对直达声延迟50ms以内到达的反射声。延迟时间较短的反射声来源于声源发出的声音经室内界面的一次、二次或少数三次反射。早期反射声会加强听点处的声强,或者说对直达声起着增强的作用,使听到的声音丰满、宏亮。
混响声是指声源发出的声波经过室内界面的多次反射,迟于只经一二次反射的早期反射声到达听点,由于每一次反射过程能量都有所减小,混响声声级较低,分布较密。所延迟的时间依据房间空间的大小不等,可长达数秒,但其衰减率的大小对音质有着重要影响,影响声音的清晰度或语言的可懂性,也对声音的亲切感起主要作用。
小型机的磁鼓较小,磁头、磁带相对速度较低,不能容纳高的载频,在这些录像机上唯一能满足的记录彩色信号的方法,是把付载波频率降低。
MPEG-2音频环绕立体声系统的扬声器布局如下图。MPEG-2还增加了一种任选的低频增强通道LFE(频带为15~120Hz),主要用于表现特殊效果。