本文仅从工程和实施角度帮助用户理解视频压缩技术,不涉及过深的算法原理和代码实现。本文由裕瀚科技研发部原创,转载请注明出处。

1. 视频压缩概述

视频是由连续的图像帧序列组成,图像的连续播放呈现出连续的动态影像即为视频。所谓视频压缩即视频编码技术,是指通过压缩技术将原始的视频格式转化为另一种数字视频格式,其目的在于减少文件空间占用。比如摄像头经过采集后直接生成的原始视频,不考虑压缩的话,其视频数据量非常庞大,在网络传输和数据存储的过程中,带宽资源和存储设备无法支撑如此巨大的数据量,所以在进行传输或者存储前,需要将原始视频数据进行视频压缩处理。

2. 视频编解码器

视频编解码器是指一个能够针对数字视频文件或者视频流进行压缩和解压缩的程序或者设备。由于编解码实现路径和方式的不同,视频编解码器也分为硬件编解码器和软件编解码器。目前主流的视频编解码器分为5个系列:H.26X系列(H.264/HEVC/VVC)、AVS系列(AVS1/AVS2/AVS3)、SVAC系列(SVAC1.0/SVAC2.0)、VP8/VP9系列以及最新的AV1。其中AVS系列和SVAC系列均是我国具有独立知识产权的视频编解码标准。评价编解码器优劣的主要评价标准在于:压缩比的高低、编解码速度的快慢、编解码功耗以及解码兼容性。

3. 视频压缩的本质

视频可以被压缩是因为前后帧图像数据中存在大量的信息冗余,主要可以从以下四类进行探讨:

空间冗余: 同一图像帧内,相近像素之间的差别很小,具有较高的相似度;

时间冗余:视频中相邻的前后图像帧之间,其中发生变化的像素占整张图像像素的比例极其微小,存储运动关系,该特点在监控场景中尤为常见;

编码冗余:不同像素的出现概率不同,出现概率高的像素分配较少的字节,概率低的分配较多的字节;

视觉冗余: 人眼视觉系统对不同像素颜色敏感度不同,编码时可以丢弃这些冗余的信息,而几乎不影响人眼视觉效果。

4. 视频画质评价

谈到视频压缩,就免不了要谈到压缩后的视频画质。在监控领域常见问题就是压缩后视频画质和原始视频是否有区别,能否作为证据进行溯源,是否会影响AI智能分析精度等;在互联网领域大家就更关注压缩后视频画质是否会出现马赛克等而影响用户对视频美观程度和流畅度评价。

视频编码画质评价标准主要可以分为主观评价和客观评价,其中主观评价标准是通过人眼直观观察进行评分,是最为接近的用户对视频画质的整体反馈。但由于主观评价的完成需要耗费大量人力和时间,并且受人为的影响因素较大,这里暂时不深入进行讨论。

本文将从客观评价标准简要阐述下视频编码画质的评价标准,主要介绍目前主流的全参考视频质量评价模型的两种视频评价标准:PSNR(峰值信噪比)、MS-SSIM(结构相似度)。

PSNR:目前最主流的画质评价方法,被公安部相关机构和互联网企业引用最多的评价方式;PSNR取值20~40之间,数值越大,画质越好。

MS-SSIM:通过感知结构信息来评价画质,其结果更为接近肉眼感知效果;MS-SSIM取值0~1之间,数值越大,画质越好。


0 Comments

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注