编解码器
目前在尝试使用全新的技术对编码架构进行革新,比如人工智能,神经计算模型等。做编码的都了解,视频编码基本结构(波形混合编码)在过去几十年都没怎么变化,主要在于预算、变换和熵编码三大部件(及零件)的不断替换和完善。近期,学界已经提出了一些用深度学习对HEVC进行编码提升的研究工作,不过大多集中在环内滤波或后处理方面,还是属于模块级提升,没有结构突破,无End to End 学习能力。FVC和AV1阵营***普遍认为,短期内深度学习还是干不过人工fine tune的各种编码模式(算子),还得继续潜伏一阵。从易于编码的角度考虑,把每幅画面分成许多小方块,每个块由16像素×16像素点亮度块和两个8像素×8像素点的色差块组成,我们将它称为“宏块”MB(Macroblock)。
如需了解更多编解码器的相关内容,欢迎拨打图片上的热线电话!
编解码器处理能力和高画质的解决方案
当说到硬编码器时,脑海中default的应用场景是直播,并且是直连信号源(摄像机或者通过contribution编码器送过来的解码视频)。在这种应用中,受限于时延和线性快编,留给编码器时间窗口比较短,加之硬件编码器计算和buffer资源有限,像multipass、lookahead等一些复杂的编码优化手段就会disable掉,因此压缩效率会受限。软件编码器的应用场景更多的是点播或者延迟直播,并且可以部署在弹性的云上,如果并行扩展性设计的好的话,一些复杂编码模式都可以开启,压缩能力能够充分施展,压缩效率自然更好。编解码器处理能力和高画质的解决方案当说到硬编码器时,脑海中default的应用场景是直播,并且是直连信号源(摄像机或者通过contribution编码器送过来的解码视频)。
此外,当我们说到画质的时候,其实更多的说的是重建视频的主观感受,并不是我们优化编码器时通常使用的PSNR(或者SSIM等)。对于特定的视频帧,无论是那个metric,码率或者QP的变化,画质的相对变化都能直接反应出来。难在不同内容的视频,人对画质的感受是很implict的,从不好到好的刻度是不均匀和非线性的。这给编码器优化带来了较大的自由度,也是各位编码老铁们发挥的空间。窄带高清,per-title,感知编码、视觉优化、内容自适应等都是工作在这个区间。我们常说,编码既是技术(Tech)也是艺术(Art),这里面有很多know-how的tricks,有工匠精神的老司机们往往更胜一筹。视频编解码器设计一个典型的数字视频编解码器的首先是将从摄像机输入的视频从RGB色度空间转换到YCbCr色度空间,而且通常还伴有色度抽样来生成4:2:0格式的视频(有时候在隔行扫描的情况下会采用4:2:2的抽样方式)。举个例子,我们曾对国外一款商业编码器和 x265,HM进行过对比测试,单看PSNR,商业编码器比不过HM,甚至x265,但是在体育比赛,歌舞晚会等实际场景中,画面的均匀性和一致性等主观方面(如画面之间闪烁性低),商业编码器优势明显。
另外补充一点,画质的好坏不只取决于编解码本身,预处理和后处理也很十分重要,甚至带来的画质提升效果要大于编码优化本身。
想要了解更多编解码器的相关内容,请及时关注北京杰西艺网站。
视频编解码技术
视频编解码技术是网络发展的初条件。只有***的视频编码才能保证在现实的互联网环境下提供视频服务。H.264或称为MPEG-4第十部分(视频编码部分)是由ITU-T和ISO/IEC再次联手开发的新一代视频编码标准。由于它比以前的标准在设计结构、实现功能上作了进一步改进,使得在同等视频质量条件下,能够节省50%的码率,且提高了视频传输质量的可控性,并具有较强的差错处理能力,适用范围更广。在低码率情况下,32kbps的H.264图像质量相当于128kbps的MPEG-4图像质量。H.264可应用于网络、广播电视、数字影院、远程教育、会议电视等多个行业。除了ITU-T和ISO/IEC两个***化组织制定的视频编码标准以外,美国微软公司和Real Network公司都有自己的视频编码标准。[1]视频复合编码器数据视频信号经信源编码器进行压缩后变换成视频数据,然后送入视频复合编码器。事实上,他们也是常用的网络标准。
版权所有©2024 天助网