视频编码方式
编码方式(Codec)能够对数字视频进行压缩或者解压缩(视频解码)的程序或者设备。常见的编码方式包括:
- H.26X 系列,由 ITU(国际电信联盟)主导。该系列标准中,目前应用最广泛的是 H.264,其继任者为 H.265。同等画质下,H.265 的压缩率可以比 H.264 提高一倍,但受制于专利等因素,H.265 的应用尚未普及。
- MPEG 系列,由 ISO(国际标准组织机构)下属的 MPEG(运动图象专家组)主导。
- 其他系列,例如 Google 主导的 VP8、VP9,Real 公司主导的 RealVideo 等。
分辨率
分辨率(Resolution)是用以描述视频对细节的分辨能力,通常表示为每一个方向上的像素数量,如640 x 480等。
帧率
帧率(Frame Rate)是单位时间内视频显示帧数的量度单位,测量单位为“每秒显示帧数”(Frame Per Second,FPS)。
采样率
采样率(Sample Rate)是每秒从连续信号中提取并组成离散信号的采样个数,单位为赫兹(Hz)。
音频编码方式
音频编码方式(Codec)是将声音从模拟信号转换为数字信号(或反向转换)的方式。主要包括无损编码和有损编码两种方式。根据采样定理,音频编码只能“无限接近”自然信号,故而所有的音频编码方式实质上都是有损的。在计算机领域中,通常约定能够达到最高保真水平的 PCM 编码为无损编码。互联网中常见的音频编码均为有损编码,常见的编码格式有 MP3、AAC 等。
码率
码率(Bitrate)是单位时间播放连续媒体(如压缩后的音频或视频)所需的比特数量,测量单位为“比特每秒”(bit/s 或 bps)。一般来说在相同分辨率下,文件的码率越大,说明单位时间内取样率越大,数据流精度就越高,画面质量就越高,画质越清晰,要求播放设备的解码能力也越高。同样,码率越大,文件体积也越大,其计算公式是文件体积=时间×码率/8。
封装格式
封装格式(Format)是将已经编码压缩好的视频流和音频流按照一定的格式规范,放到一个文件中。对于网络点播而言,更加合适的术语应该叫“流媒体网络传输协议”。在互联网中使用最为广泛的协议为:
- MP4:非常经典的文件格式,对 iOS、Android、PC Web 端支持度都很好。但是 MP4 的视频文件头太大,结构复杂。如果视频较长(如长达数小时),则其文件头会过大,影响视频加载速度,所以其更适用于短视频场景。
- HLS(HTTP Live Streaming):苹果公司力推的标准,iOS、Android 端支持度较好,但 IE 的支持情况依赖 Flash 的二次开发工作。
- FLV:Adobe公司所推的标准,在 PC 端有 Flash 的强力支持,但在移动端只有App 实现播放器才有可能支持,大部分手机端浏览器均不支持。
视频转码
视频转码是指将一个视频文件从一种编码格式转换为另一种编码格式的过程。转码的目的可能是为了使视频文件在特定设备或软件上播放或编辑,或者为了减小视频文件的大小以节省存储空间或加快传输速度。在视频转码过程中,可以调整视频的分辨率、帧率、比特率、编码方式等参数,以适应不同的需求。
视频转封装
视频转封装是指在不改变视频编码的情况下,将一个视频文件的容器格式从一种类型转换为另一种类型的过程。容器格式是指视频文件中包含视频和音频流以及其他元数据的文件格式,常见的容器格式有MP4、AVI、MKV等。在视频转封装的过程中,视频和音频的编码格式不会改变,但是可以调整封装格式的参数,如封装方式、视频帧率、音频码率、字幕等。转封装可以帮助适应不同的播放设备和软件,提高视频的兼容性和播放效果。
GOP
GOP是视频编码中的一个重要概念,是Group of Pictures的缩写。在视频编码中,一帧画面经过压缩编码后会被分为I帧、P帧和B帧三种类型,I帧是关键帧,也是独立编码的帧,P帧和B帧是参前后的帧进行预测编码的帧。GOP是由一组连续的I帧、P帧和B帧组成的序列,整个序列被视为一个编码单元,用于提高视频编码效率和减小文件大小。
在一个GOP中,第一个I帧被称为GOP头,最后一个B帧被称为GOP尾,中间的P帧和B帧被称为B帧组或P帧组。GOP的大小可以根据需要进行调整,通常选择一个适当的GOP大小可以在保证视频质量的同时减小视频文件的大小。较小的GOP大小可以提高视频的编码效率,但同时也会增加编码延迟和视频文件的大小。
声道数
声道(Sound Channel)是指声音在录制(或播放)时,在不同空间位置采集(或播放)的相互独立的音频信号。所谓声道数,也就是声音录制时的音源数量或播放时的扬声器数量。