「VIDEO」 特征提取概述
实际工程中常使用抽帧及关键帧检测;在抽帧结果上再提取视频或者帧特征;
1 帧特征
低层特征:HOG, HOF, MBH, IDTF 等
1.1 全局特征
对图像内容的整体性描述;
优点:
- 能够应对视频在编码、帧分辨率、缩放等方面的变化;
- 检测速度比较快;
缺点:
- 对于平移等几何变化及复杂的编辑效果不佳;
1.1.1 顺序度量
Ordinal measure, OM;
步骤:
- 将图像分成 m×n 个块;
- 每个块取灰度均值,的到 m×n 的特征矩阵;
- 按顺序展开即的到 OM;
特点:OM 是效果最优的全局特征;其并不强调两个特征间的差异,而是强调它们之间的顺序关系;
优点:因此,对视频的亮度变换、尺寸变换等鲁棒性较好;
缺点:但图像局部变化容易造成整体顺序度量变化,对顺序度量特征的影响较大;
影响因素:分块方式——2x2 分块能抵抗加边框的拷贝攻击; 3x3 分块不行;但 2x2 的特征数太少,不同内容视频的区分能力较弱,检测精确度不高;为什么 2×2 可以抵抗加框,是因为偶数吗
1.2 局部特征
指具有局部不变性特性的局部兴趣点;
1.2.1 尺度不变特征变换
Scaleinvariant feature transform, SIFT;视频拷贝检测领域常用的局部特征;SIFT 特征提取方法在高斯差分尺度空间中寻找极值点,并提取出其位置、尺度、旋转不变量生成特征描述子;
步骤:
- 构建尺度空间;
- 检测尺度空间极值点;
- 抽取稳定的关键点;
- 为每个关键点指定一个或者多个方向;
- 生成特征点描述子;
特点:
稳定性、区分性强;
- 在多尺度空间采用高斯差分算子检测关键点,运算速度快;
- 特征点是以子区域的统计特性,而不是以单个像素作为操作对象,提高了对图像局部变形的适应能力;
- 匹配能力强,能提取稳定的特征;可应对仿射变换(平移(Translation)、缩放(Scale)、翻转(Flip)、旋转(Rotation)和剪切(Shear))、视角变换、光照变换等问题;甚至在某种程度上可以应对任意角度拍摄的图像;
- 为了保持旋转不变性,SIFT对每个关键点使用 4X4 个种子点来描述,每个种子点有 8 个方向向量,这样对于一个关键点就形成 128 维的特征值;
优点:
- 关键点的定位精度高,稳定性好;
- 在光照变化、图像几何变形、分辨率差异、旋转、模糊和图像压缩等6种情况下同类特征中鲁棒性最强;
缺点:
- 耗费巨大的存储空间;
- 使用欧氏距离来度量相似性,计算复杂度过高;
最大的缺陷在于未考虑视频时间维的信息,将帧与帧之间孤立起来了;
优点是对视频空间信息的特征描述的力度更细一些,在某些场景中,比如校验两个视频是否是重复视频,基于帧级别的特征反而更适用;
2 视频级特征
使用深度学习方法,如 iDT、或者 C3D 来提取视频级特征;直接计算余弦相似度或者欧式距离就可以;
缺点是海量视频处理起来资源消耗太大,而且无法满足实时性要求;
优点是考虑了时空维度信息,有利于表述整个视频发生的事件等全局信息,表达的特征更紧凑;
一般不会使用视频级特征,太耗时了;
3 方案
3.1 SIFT + OM
- 计算 SIFT;
- 应用 OM,以区域内 SIFT 个数排序;其中 OM 用 4×2 和 2×4 相结合;
只需存储 SIFT 的个数和位置即可;为什么要存储位置啊
4 分析
目前单一的全局特征或局部特征都难以兼顾准确度和速度;
Comments