less than 1 minute read

视频相比图像来说信息更加丰富,但是一个序列里冗余信息太多,如何无监督的提取关键帧的信息对于很多任务都是至关重要的;
相关资源:关键帧提取资源汇总图片相似度度量概述

key frame extraction · bag of keyframes · key frame detection

1 动机

  1. 通用任务:视频中大部分 clip 都不包含所做的运动信息(静止),如果把这些 clip 也放入网络训练,会对网络的训练起到一个反向的作用;排除错误的 clip 的干扰(跟错)啥是跟错
  2. 视频检索:存在数据量大、 维度高的特点,在检索过程中需要消耗大量的内存与搜索时间;关键帧提取是重要的预处理步骤;
  3. 视频摘要

2 基于视频信息

什么是I帧,P帧,B帧
视频压缩中,每帧代表一幅静止的图像;而在实际压缩时,会采取各种算法减少数据的容量,其中 IPB 就是最常见的;

I 帧表示关键帧,你可以理解为这一帧画面的完整保留;解码时只需要本帧数据就可以完成(因为包含完整画面);
P 帧表示的是这一帧跟之前的一个关键帧(或P帧)的差别,解码时需要用之前缓存的画面叠加上本帧定义的差别,生成最终画面(也就是差别帧,P帧没有完整画面数据,只有与前一帧的画面差别的数据);
B 帧是双向差别帧,也就是B帧记录的是本帧与前后帧的差别(具体比较复杂,有4种情况),换言之,要解码B帧,不仅要取得之前的缓存画面,还要解码之后的画面,通过前后画面的与本帧数据的叠加取得最终的画面;B帧压缩率高,但是解码时 CPU 会比较累;

IPB 帧和我们所说的关键帧提取是不同的概念,生成的方式也不同,我们提取关键帧做视频特征提取,不能采用IPB帧的方式为啥

3 基于帧

图片检索

3.1 帧差法

背景:视频序列具有连续性的特点;如果场景内没有运动目标,则连续帧的变化很微弱,如果存在运动目标,则连续的帧和帧之间会有明显地变化;
流程:相邻帧做差分运算,不同帧对应的像素点相减的到灰度差,当差值的绝对值之和超过一定阈值时,即可判断为有运动目标,从而提取关键帧;
特点:原理简单,计算量小;

diff = cv.absdiff(frame,lastFrame)

颜色直方图可以看做是帧间差分法的一种,只不过用的是颜色直方图之间的差值,而非颜色编码之间的差值;

gray = cv.cvtColor(frame,cv.COLOR_BGR2GRAY)# 提取灰度图像
hist = cv.calcHist([gray],[0],None,[256],[0,256])
diff = cv.absdiff(hist,lastHist)

基于帧间差分的提取关键帧的方法:

  1. 使用差分强度的顺序,对所有帧按照平均差分强度进行排序,选择平均帧间差分强度最高的若干张图片作为视频的关键帧;
  2. 使用平均帧间差分强度高于阈值的帧作为视频的关键帧;AllenAnthony/Key-Frame
  3. 选择局部最大值,这种方法的提取结果在丰富度上表现更好一些,提取结果均匀分散在视频中;CSDN/随煜而安

也可应用于提取到运动目标:适用于目标运动较为缓慢的场景;当运动较快时,由于目标在相邻帧图像上的位置相差较大,两帧图像相减后并不能得到完整的运动目标,因此,人们在两帧差分法的基础上提出了三帧差分法;另外,针对运动目标检测,还有背景减弱法和光流场法
背景差分法:是当前运动目标检测技术中应用较为广泛的一类方法,它的基本思想和帧间差分法相类似,都是利用不同图像的差分运算提取目标区域;不过与帧间差分法不同的是,背景差分法不是将当前帧图像与相邻帧图像相减,而是将当前帧图像与一个不断更新的背景模型相减,在差分图像中提取运动目标;

3.2 聚类

对于视频中的各个图片,定义图片之间的相似度(如采用颜色直方图之间的差值)跟谁做差,然后用聚类算法,聚类的中心即为关键帧;
聚类算法中,需要预定一个阈值来控制聚类的密度;在聚类过程中也可以加入约束条件,如每个聚类中的图像帧数目不应该太少或太多,每个聚类的质心不应该相似,也就是这些聚类质心的距离要大,还可以采用模糊聚类方法实现关键帧的提取;
中国科学院大学-关键帧提取课件

3.3 深度特征

传统方法存在的问题:大多数的方案对镜头每帧进行相似性的度量,并与某个固定的阈值进行比较来选出关键帧,然而该阈值确实难以确定,并且难以适合每个镜头;

流程:取镜头中帧的平均值,然后取与均值最接近的帧作为关键帧,由此实现了自适应的关键帧提取;

4 基于序列特征

3.1 LSTM

使用 LSTM 处理视频,为每一帧打一个分数,取分值较高的为关键帧;


TOP

附录

A 参考资料

B 扩展知识

  1. 视频编码 关键帧,帧间和视频压缩视频编解码器视频编码与视频格式的区别和联系

封装格式及其对应的编码格式:
AVI:MPEG-2,DIVX,XVID,AC-1,H.264;
WMV:WMV,AC-1;
RM、RMVB:RV, RM;
MOV:MPEG-2,XVID,H.264;
TS/PS:MPEG-2,H.264,MPEG-4;

Comments