searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

H264 DCT变换简介

2024-05-20 07:56:30
9
0

在上一节简述了h264的宏块划分及预测方式
接下来简述DCT变换

1.DCT
即离散余弦变换,把图像信号从空间域变成频率域

2.哈德曼变换
系数只有1和-1的正交变换,比DCT更简单快速

3.为什么需要变换成频率域
一般图片的高频信息多但是幅值比较小。高频信息主要描述图片的边缘或者细节信息,对于快速空间变化的图像来说,比如充满沟壑的山脉,其高频成分会相对较强,低频则较弱。而低频主要是图像的整体轮廓信息。​由于人眼的视觉敏感度是有限的,有的时候我们去除了一部分高频信息之后,人眼看上去感觉区别并不大

4.H264的做法
a.16x16的亮度块
H264把一个1616的亮度宏块分成16个44的小块,对每一个小块做近似DCT的变换,再把变换后的左上角的DC系数抽出来组成一个4*4的块,对这个小块再做一次Hadamard变换。最后,整体进行量化操作

b.其他亮度块
直接划分成4*4的小块,进行近似的DCT变换,然后整体进行量化操作

c.88的色度块
与亮度块类似,对8
8的色度块,把它分成4个44的小块,对每一个小块做一个近似DCT的变换,再把每一个变换后的左上角的DC系数抽出来组成一个22的块,对这个小块再做一次Hadamard变换。最后对整体进行量化操作

由于DCT涉及浮点运算,因此H264是采用一种近似的DCT变换,只有加减及移位运算。由于变换后能量主要集中在DC系数中(也就是第一行第一列),因此再单独对DC系数做一次哈德曼变换,使能量更集中

5.量化
把图像数据除以一个量化步长,四舍五入向上取整,这个过程称为量化

进过DCT和哈德曼变换后,图像的低频信号主要集中在左上角,高频信号都集中在右下角,而且,由于高频信号都是一些较小的系数,因此,经过量化操作后,大部分的高频信号都变成了0,从而达到压缩的目的。当然,这个是个不可逆的过程

0条评论
0 / 1000
李****林
2文章数
0粉丝数
李****林
2 文章 | 0 粉丝
李****林
2文章数
0粉丝数
李****林
2 文章 | 0 粉丝
原创

H264 DCT变换简介

2024-05-20 07:56:30
9
0

在上一节简述了h264的宏块划分及预测方式
接下来简述DCT变换

1.DCT
即离散余弦变换,把图像信号从空间域变成频率域

2.哈德曼变换
系数只有1和-1的正交变换,比DCT更简单快速

3.为什么需要变换成频率域
一般图片的高频信息多但是幅值比较小。高频信息主要描述图片的边缘或者细节信息,对于快速空间变化的图像来说,比如充满沟壑的山脉,其高频成分会相对较强,低频则较弱。而低频主要是图像的整体轮廓信息。​由于人眼的视觉敏感度是有限的,有的时候我们去除了一部分高频信息之后,人眼看上去感觉区别并不大

4.H264的做法
a.16x16的亮度块
H264把一个1616的亮度宏块分成16个44的小块,对每一个小块做近似DCT的变换,再把变换后的左上角的DC系数抽出来组成一个4*4的块,对这个小块再做一次Hadamard变换。最后,整体进行量化操作

b.其他亮度块
直接划分成4*4的小块,进行近似的DCT变换,然后整体进行量化操作

c.88的色度块
与亮度块类似,对8
8的色度块,把它分成4个44的小块,对每一个小块做一个近似DCT的变换,再把每一个变换后的左上角的DC系数抽出来组成一个22的块,对这个小块再做一次Hadamard变换。最后对整体进行量化操作

由于DCT涉及浮点运算,因此H264是采用一种近似的DCT变换,只有加减及移位运算。由于变换后能量主要集中在DC系数中(也就是第一行第一列),因此再单独对DC系数做一次哈德曼变换,使能量更集中

5.量化
把图像数据除以一个量化步长,四舍五入向上取整,这个过程称为量化

进过DCT和哈德曼变换后,图像的低频信号主要集中在左上角,高频信号都集中在右下角,而且,由于高频信号都是一些较小的系数,因此,经过量化操作后,大部分的高频信号都变成了0,从而达到压缩的目的。当然,这个是个不可逆的过程

文章来自个人专栏
my音视频
2 文章 | 1 订阅
0条评论
0 / 1000
请输入你的评论
0
0