郑州营销型网站制作策划,seo搜索引擎优化期末考试,导购网站模板免费下载,mi2设计公司网站MPEG-2 详解 MPEG-2 详解MPEG-2 的发展阶段MPEG-2 的特点MPEG-2 的应用MPEG-2 视频编码系统原理及关键技术MPEG-2 的编码码流具体介绍编码方法 MPEG-2 视频压缩关键技术环节余弦变换DCT量化器之型扫描与游程编码熵编码信道缓存运动估计运动补偿 MPEG-1 Audio Layer II 编码器框… MPEG-2 详解 MPEG-2 详解MPEG-2 的发展阶段MPEG-2 的特点MPEG-2 的应用MPEG-2 视频编码系统原理及关键技术MPEG-2 的编码码流具体介绍编码方法 MPEG-2 视频压缩关键技术环节余弦变换DCT量化器之型扫描与游程编码熵编码信道缓存运动估计运动补偿 MPEG-1 Audio Layer II 编码器框图多相滤波器心理声学模型量化编码帧比特流形成 参考 MPEG-2 详解
MPEG是活动图像组Moving Picture Exports Group的缩写。
MPEG-2是MPEGMoving Picture Experts Group运动图像专家组组织制定的视频和音频有损压缩标准之一它的正式名称为“基于数字存储媒体运动图像和语音的压缩标准”。与MPEG-1标准相比MPEG-2标准具有更高的图像质量、更多的图像格式和传输码率的图像压缩标准。MPEG-2标准不是MPEG-1的简单升级而是在传输和系统方面做了更加详细的规定和进一步的完善。它是针对标准数字电视和高清晰电视在各种应用下的压缩方案传输速率在 3 Mbit/s~10 Mbit/s 之间,其在NTSC制式下的分辨率可达720X486。
MPEG-2也可提供并能够提供广播级的视像和CD级的音质。MPEG-2的音频编码可提供左右中及两个环绕声道以及一个加重低音声道和多达7个伴音声道DVD可有8种语言配音的原因。由于MPEG-2在设计时的巧妙处理使得大多数MPEG-2解码器也可播放MPEG-1格式的数据如VCD。
MPEG-2 的发展阶段
对MPEG-1增加了低采样频率有16KHZ22.05KHZ以及24KHZ。对MPEG-1实施了向后兼容的多声道扩展将其称为MPEG-2 BC。支持单声道双声道多声道等编码。并附加“低频加重”扩展声道从而达到五声道编码。向后不兼容将其称为MPEG-2 AAC先进音频编码。采样频率可以低至8KHZ而高至96KHZ范围内的1-48个通道可选的高音质音频编码。
MPEG-2 的特点
MPEG-2 可提供一个较广的范围改变压缩比以适应不同画面质量存储容量以及带宽的要求。MPEG-2的音频编码可提供左右中及两个环绕声道以及一个加重低音声道和多达7个伴音声道DVD可有8种语言配音的原因。
MPEG-2 的应用
MPEG-2标准特别适用于广播质量的数字电视的编码和传送被用于无线数字电视、DVBDigital Video Broadcasting数字视频广播、数字卫星电视、DVDDigital Video Disk数字化视频光盘等技术中。
数字化片库压缩比的提高对节目的存储所需要的资源大大降低。采用基于MPEG-2的数字化节目库可以以较小的成本取得很好的效益。节目传输高压缩比和可变的输出码率使得MPEG-2技术在节目传播应用上发展迅速。在低至1.5Mbit/s的码率下MPEG-2数据流仍然能提供相当的图象质量因此目前的模拟电影频道甚至可以传送四路电视节目。这在地面广播、有线电视和卫星广播上都很有吸引力可以节约大量的成本。高清晰度电视由于高清晰度电视的分辨率很高带来的问题是所需的节目传输带宽很高必须使用高压缩比才有可能传送高清晰度电视。在这一点上MPEG-2技术能够胜任。在数字化视频磁带、激光视盘、电视会议以及数字照相机等方面MPEG-2也具有很广的应用前景。
MPEG-2 视频编码系统原理及关键技术
概括地说MPEG-2图像压缩的原理是利用了图像中的两种特性空间相关性和时间相关性。一帧图像内的任何一个场景都是由若干像素点构成的因此一个像素通常与它周围的某些像素在亮度和色度上存在一定的关系这种关系叫作空间相关性一个节目中的一个情节常常由若干帧连续图像组成的图像序列构成一个图像序列中前后帧图像间也存在一定的关系这种关系叫作时间相关性。这两种相关性使得图像中存在大量的冗余信息。如果我们能将这些冗余信息去除只保留少量非相关信息进行传输就可以大大节省传输频带。而接收机利用这些非相关信息按照一定的解码算法可以在保证一定的图像质量的前提下恢复原始图像。一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。
MPEG-2中编码图像被分为三类分别称为I帧P帧和B帧。
I帧图像采用帧内编码方式即只利用了单帧图像内的空间相关性而没有利用时间相关性。I帧主要用于接收机的初始化和信道的获取以及节目的切换和插入I帧图像的压缩倍数相对较低。I帧图像是周期性出现在图像序列中的出现频率可由编码器选择。
P帧和B帧图像采用帧间编码方式即同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分即P帧中的每一个宏块可以是前向预测也可以是帧内编码。B帧图像采用双向时间预测可以大大提高压缩倍数。值得注意的是由于B帧图像采用了未来帧作为参考因此MPEG-2编码码流中图像帧的传输顺序和显示顺序是不同的。
MPEG-2 的编码码流
MPEG-2的编码码流分为六个层次。从上至下依次为视频序列层Sequence图像组层GOPGroup of Picture图像层Picture像条层Slice宏块层MacroBlock和像块层Block。
具体介绍
序列指构成某路节目的图像序列序列起始码后的序列头中包含了图像尺寸宽高比图像速率等信息。序列扩展中包含了一些附加数据。为保证能随时进入图像序列序列头是重复发送的。
序列层下是图像组层一个图像组由相互间有预测和生成关系的一组I、P、B图像构成但头一帧图像总是I帧。GOP头中包含了时间信息。
图像组层下是图像层分为I、P、B三类。PIC头中包含了图像编码的类型和时间参考信息。
图像层下是像条层一个像条包括一定数量的宏块其顺序与扫描顺序一致。MPML中一个像条必须在同一宏块行内。
像条层下是宏块层。MPEG-2中定义了三种宏块结构4:2:0宏块4:2:2宏块和4:4:4宏块分别代表构成一个宏块的亮度像块和色差像块的数量关系。
4:2:0宏块中包含四个亮度像块一个Cb色差像块和一个Cr色差像块4:2:2宏块中包含四个亮度像块二个Cb色差像块和二个Cr色差像块4:4:4宏块中包含四个亮度像块四个Cb色差像块和四个Cr色差像块。这三种宏块结构实际上对应于三种亮度和色度的抽样方式。
编码方法
在进行视频编码前分量信号R、G、B被变换为亮度信号Y和色差信号Cb、Cr的形式。
4:2:2格式中亮度信号的抽样频率为13.5MHz两个色差信号的抽样频率均为6.75MHz这样空间的抽样结构中亮度信号为每帧720x576样值CbCr都为360x576样值即每行中每隔一个像素对色差信号抽一次样。
4:4:4格式中亮度和色差信号的抽样频率都是13.5MHz因此空间的抽样结构中亮度和色差信号都为每帧720x576样值。而4:2:0格式中亮度信号的抽样频率13.5MHz空间的抽样结构中亮度信号为每帧720x576样值CbCr都为360x288样值即每隔一行对两个色差信号抽一次样每抽样行中每隔一个像素对两个色差信号抽一次样。
通过上述分析不难计算出4:2:0格式中每四个Y信号的像块空间内的CbCr样值分别构成一个CbCr像块4:2:2格式中每四个Y信号的像块空间内的CbCr样值分别构成两个CbCr像块而4:4:4格式中每四个Y信号的像块空间内的CbCr样值分别构成四个CbCr像块。相应的宏块结构正是以此基础构成的。
宏块层之下是像块层像块是MPEG-2码流的最底层是DCT变换的基本单元。MPML中一个像块由8x8个抽样值构成同一像块内的抽样值必须全部是Y信号样值或全部是Cb信号样值或全部是Cr信号样值。另外像块也用于表示8x8个抽样值经DCT变换后所生成的8x8个DCT系数。
在帧内编码的情况下编码图像仅经过DCT量化器和比特流编码器即生成编码比特流而不经过预测环处理。DCT直接应用于原始的图像数据。
在帧间编码的情况下原始图像首先与帧存储器中的预测图像进行比较计算出运动矢量由此运动矢量和参考帧生成原始图像的预测图像。而后将原始图像与预测像素差值所生成的差分图像数据进行DCT变换再经过量化器和比特流编码器生成输出的编码比特流。
可见帧内编码与帧间编码流程的区别在于是否经过预测环的处理。
MPEG-2 视频压缩关键技术环节
余弦变换DCT
DCT是一种空间变换在MPEG-2中DCT以8x8的像块为单位进行生成的是8x8的DCT系数数据块。DCT变换的最大特点是对于一般的图像都能够将像块的能量集中于少数低频DCT系数上即生成8x8DCT系数块中仅左上角的少量低频系数数值较大其余系数的数值很小这样就可能只编码和传输少数系数而不严重影响图像质量。
DCT不能直接对图像产生压缩作用但对图像的能量具有很好的集中效果为压缩打下了基础。
量化器
量化是针对DCT变换系数进行的量化过程就是以某个量化步长去除DCT系数。量化步长的大小称为量化精度量化步长越小量化精度就越细包含的信息越多但所需的传输频带越高。不同的DCT变换系数对人类视觉感应的重要性是不同的因此编码器根据视觉感应准则对一个8x8的DCT变换块中的64个DCT变换系数采用不同的量化精度以保证尽可能多地包含特定的DCT空间频率信息又使量化精度不超过需要。DCT变换系数中低频系数对视觉感应的重要性较高因此分配的量化精度较细高频系数对视觉感应的重要性较低分配的量化精度较粗通常情况下一个DCT变换块中的大多数高频系数量化后都会变为零。
之型扫描与游程编码
DCT变换产生的是一8x8的二维数组为进行传输还须将其转换为一维排列方式。有两种二维到一维的转换方式或称扫描方式之型扫描Zig-Zag)和交替扫描其中之型扫描是最常用的一种。由于经量化后大多数非零DCT系数集中于8x8二维矩阵的左上角即低频分量区之型扫描后这些非零DCT系数就集中于一维排列数组的前部后面跟着长串的量化为零的DCT系数这些就为游程编码创造了条件。
游程编码中只有非零系数被编码。一个非零系数的编码由两部分组成前一部分表示非零系数前的连续零系数的数量称为游程后一部分是那个非零系数。这样就把之型扫描的优点体现出来了因为之型扫描在大多数情况下出现连零的机会比较多游程编码的效率就比较高。当一维序列中的后部剩余的DCT系数都为零时只要用一个“块结束”标志(EOB)来指示就可结束这一8x8变换块的编码产生的压缩效果是非常明显的。
熵编码
量化仅生成了DCT系数的一种有效的离散表示实际传输前还须对其进行比特流编码产生用于传输的数字比特流。简单的编码方法是采用定长码即每个量化值以同样数目的比特表示但这种方法的效率较低。而采用熵编码可以提高编码效率。熵编码是基于编码信号的统计特性使得平均比特率下降。游程和非零系数既可独立的也可联合的作熵编码。熵编码中使用较多的一种是霍夫曼编码MPEG-2视频压缩系统中采用的就是霍夫曼编码。霍夫曼编码中在确定了所有编码信号的概率后生产一个码表对经常发生的大概率信号分配较少的比特表示对不常发生的小概率信号分配较多的比特表示使得整个码流的平均长度趋于最短。
信道缓存
由于采用了熵编码产生的比特流的速率是变化的随着视频图像的统计特性变化。但大多数情况下传输系统分配的频带都是恒定的因此在编码比特流进入信道前需设置信道缓存。信道缓存是一缓存器以变比特率从熵编码器向里写入数据以传输系统标称的恒定比特率向外读出送入信道。缓存器的大小或称容量是设定好的但编码器的瞬时输出比特率常明显高于或低于传输系统的频带这就有可能造成缓存器的上溢出或下溢出。因此缓存器须带有控制机制通过反馈控制压缩算法调整编码器的比特率使得缓存器的写入数据速率与读出数据速率趋于平衡。缓存器对压缩算法的控制是通过控制量化器的量化步长实现的当编码器的瞬时输出速率过高缓存器将要上溢时就使量化步长增大以降低编码数据速率当然也相应增大了图像的损失当编码器的瞬时输出速率过低缓存器将要下溢出时就使量化步长减小以提高编码数据速率。
运动估计
运动估计使用于帧间编码方式时通过参考帧图像产生对被压缩图像的估计。运动估计的准确程度对帧间编码的压缩效果非常重要。如果估计作的好那么被压缩图像与估计图像相减后只留下很小的值用于传输。运动估计以宏块为单位进行计算被压缩图像与参考图像的对应位置上的宏块间的位置偏移。这种位置偏移是以运动矢量来描述的一个运动矢量代表水平和垂直两个方向上的位移。运动估计时P帧和B帧图像所使用的参考帧图像是不同的。P帧图像使用前面最近解码的I帧或P帧作参考图像称为前向预测而B帧图像使用两帧图像作为预测参考称为双向预测其中一个参考帧在显示顺序上先于编码帧前向预测另一帧在显示顺序上晚于编码帧后向预测B帧的参考帧在任何情况下都是I帧或P帧。
运动补偿
利用运动估计算出的运动矢量将参考帧图像中的宏块移至水平和垂直方向上的相对应位置即可生成对被压缩图像的预测。在绝大多数的自然场景中运动都是有序的。因此这种运动补偿生成的预测图像与被压缩图像的差分值是很小的。
MPEG-1 Audio Layer II 编码器框图 可以看到编码器具有两条脉络一是上方蓝色框内的子带编码部分这也是编码的主线二是下方的部分是MPEG音频编码的亮点。
多相滤波器
数字音频信号通过一个多相滤波器组变换成32个等宽频带子带使得信号具有较高的时间分辨率确保在短暂冲击信号的情况下编码的声音信号具有足够高的质量。
但需要说明的是高时域分辨率和高频域分辨率是不可兼得的我们需要做出权衡。
滤波器组的输出是临界频带经过量化的系数样值。若一个子带覆盖多个临界频带则选择具有最小NMR的临界频带来计算分配给子带的比特数。
心理声学模型
心理声学模型决定了各个子带中允许的最大量化噪声小于它的量化噪声都会被掩蔽。若子带内的信号功率小于掩蔽阈值则不进行编码否则确定要编码的系数所需的比特数使量化引起的噪声低于掩蔽效应。
量化编码 比特分配对每个子带计算 掩噪比MNR (dB) 信噪比SNR - 信掩比SMR。 然后找出其中具有最低MNR的子带并给该子带多分配一些比特然后重新计算MNR继续分配重复该步骤直至没有比特可以分配。这样可以使得在满足比特率和掩蔽要求的前提下使MNR最小。 计算比例因子对各个子带每36个样点Layer I为12个样点进行一次比例因子的计算先确定12个连续样值中的最大值查Layer II、Layer I比例因子表中比这它大的最小值作为量化比例因子。每12个样值计算出一个比例因子Layer II中将每个子带分为3组每组各有12个取样值因此36个样值具有3个比例因子。比例因子可以使得比较准确地计算出子带的声压级。一般比例因子从低频子带到高频子带连续下降。 子带样值量化将子带样值除以比例因子结果为X根据所分配的比特数查表得A、B量化结果为AXB。 颗粒形成对量化级别在3、5、9级时采用“颗粒” 优化。大量实验证明使用颗粒量化可将压缩比从4:1增加到6:1乃至8:1。
帧比特流形成
单个子带的连续36个样值3组12个样值组装成帧。 Layer II每帧包含1152个PCM样值为Layer I的三倍。若取样频率为48 kHz一帧相当于1152 / 48k 24 ms的声音样值因此Layer II的精确度为24 ms为Layer I的三倍因而更精确。 MPEG-1 Audio Layer II的帧结构 参考
https://baike.baidu.com/item/MPEG-2/214322?frge_alahttps://huifu.wondershare.cn/repair/10070867.htmlhttps://blog.csdn.net/yangzhiloveyou/article/details/17101803https://blog.csdn.net/szzheng/article/details/106692435