《一种基于可变形部件模型的快速对象检测算法-李春伟.pdf》由会员分享,可在线阅读,更多相关《一种基于可变形部件模型的快速对象检测算法-李春伟.pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第 38卷 第 11期 电 子 与 信 息 学 报 Vol.38No.112016年 11月 JournalofElectronics&InformationTechnology Nov.2016一 种 基 于 可 变 形 部 件 模 型 的 快 速 对 象 检 测 算 法李春伟*于洪涛李邵梅卜佑军(国家数字交换系统工程技术研究中心郑州450002)摘 要 : 为 了 解 决 可 变 形 部 件 模 型 检 测 过 程 中 的 速 度 瓶 颈 问 题 , 该 文 针 对 模 型 的 检 测 流 程 , 提 出 一 种 结 合 快 速 特 征金 字 塔 计 算 的 级 联 可 变 形 部 件 模
2、 型 。 由 于 模 型 的 检 测 速 度 主 要 取 决 于 特 征 计 算 以 及 对 象 定 位 这 两 个 过 程 , 提 出 一 种两 阶 段 的 加 速 算 法 : 首 先 采 用 尺 度 上 稀 疏 采 样 的 特 征 金 字 塔 来 近 似 表 示 精 细 采 样 的 多 尺 度 图 像 特 征 , 以 加 快 特 征 计算 过 程 ; 然 后 在 定 位 过 程 中 结 合 级 联 算 法 , 以 一 个 序 列 模 型 顺 序 地 评 估 各 个 部 件 , 从 而 快 速 剪 除 大 部 分 可 能 性 较 小的 对 象 假 设 , 以 加 快 对 象 定 位 过 程
3、。 在 PASCALVOC2007和 INRIA数 据 集 上 的 实 验 结 果 表 明 , 该 算 法 可 以 明 显加 快 检 测 速 度 , 而 检 测 精 度 仅 略 有 下 降 。关 键 词 : 快 速 对 象 检 测 ; 可 变 形 部 件 模 型 ; 特 征 计 算 ; 级 联 检 测中 图 分 类 号 : TP391.4 文 献 标 识 码 : A 文 章 编 号 : 1009-5896(2016)11-2864-07DOI:10.11999/JEIT160080Rapid Object Detection Algorithm Based on Deformable Part
4、 ModelsLIChunwei YUHongtao LIShaomei BUYoujun(National Digital Switching System Engineering & Technological Research Center, Zhengzhou 450002, China)Abstract:Tosolvethespeedbottleneckofdeformablepartmodelsinthedetectionprocess,thispaperproposesacascadedeformablepartmodelwithrapidcomputationoffeature
5、pyramidsforthedetectionprocessofthemodel.Becausethespeedofthedetectionismainlydeterminedbythetwoprocessesofthefeaturecomputationandtheobjectlocation,atwo-stagespeedupalgorithmisproposed.Firstly,sparsely-sampledfeaturepyramidsonthescaleare utilized to approximate finely-sampled multi-scale image feat
6、ures to speed up the process of featurecomputation.Thencombinedwiththecascadealgorithminthelocation process,asequencemodelisutilizedtoevaluateindividualpartssequentiallysoastorapidlyprunemostobjecthypothesesofsmallpossibilitiesinordertospeeduptheprocessofobjectlocation.Theexperimentalresultson PASCA
7、LVOC2007dataset andINRIAdataset show that the algorithm in the paper apparently speeds up the speed of detection with minor loss indetectionprecision.Key words:Rapidobjectdetection;Deformablepartmodel;Featurecomputation;Cascadedetection1 引 言对 象 检 测 技 术 是 计 算 机 视 觉 的 关 键 技 术 和 研 究热 点 之 一 。 可 变 形 部 件
8、模 型 1(Deformable PartModel, DPM)作 为 现 今 最 流 行 的 对 象 检 测 算 法 之一 , 在 对 象 检 测 领 域 著 名 的 PASCALVOC竞 赛 中多 次 取 得 优 异 的 成 绩 , 目 前 已 经 扩 展 应 用 到 人 体 姿态 估 计 2, 行 人 检 测 3, 人 脸 检 测 4, 以 及 智 能 交 通 5等 诸 多 领 域 。 但 是 DPM模 型 中 涉 及 的 梯 度 方 向 直方 图6(HistogramofOrientedGradient,HOG)特 征金 字 塔 的 提 取 和 对 象 定 位 两 部 分 的 运 算
9、量 都 较 大 ,收 稿 日 期 : 2016-01-19; 改 回 日 期 : 2016-06-08; 网 络 出 版 : 2016-09-01*通 信 作 者 : 李 春 伟 基 金 项 目 : 国 家 自 然 科 学 基 金 (61572519,61521003)Foundation Items: The National Natural Science Foundation ofChina(61572519,61521003)导 致 在 单 机 上 处 理 单 张 PASCAL数 据 集 中 的 图 像时 , 运 行 时 间 在 10s左 右 , 无 法 满 足 实 际 应 用 需 求
10、 。为 此 , 近 年 来 研 究 学 者 针 对 DPM的 加 速 问 题 开 展了 系 列 研 究 。 现 有 的 DPM模 型 加 速 研 究 主 要 集 中在 以 下 两 个 方 面 :单 类 别 加 速 算 法 : 主 要 关 注 于 单 个 类 别 检 测 中DPM模 型 的 加 速 效 果 。 文 献 7,8通 过 较 早 地 剪 除 无望 的 对 象 假 设 来 减 少 计 算 量 , 前 者 根 据 部 件 滤 波 器的 得 分 , 使 用 中 间 阈 值 来 剪 除 得 分 较 低 的 部 件 假 设 。但 是 需 要 专 门 的 确 认 数 据 集 来 训 练 中 间 阈
11、 值 。 后 者通 过 使 用 多 分 辨 率 的 层 次 部 件 模 型 , 逐 次 对 目 标 假设 进 行 判 断 , 但 是 其 对 于 检 测 精 度 有 一 定 的 影 响 。文 献 9采 用 一 种 类 似 于 文 献 7中 的 加 速 策 略 , 通 过一 种 积 极 的 部 件 选 择 策 略 优 化 了 滤 波 器 评 估 的 顺序 。 文 献 10在 所 有 可 能 的 图 像 区 域 上 搜 索 全 局 最 优万方数据第 11期 李 春 伟 等 : 一 种 基 于 可 变 形 部 件 模 型 的 快 速 对 象 检 测 算 法 2865的 分 类 结 果 , 然 而 该
12、 方 法 使 用 最 大 响 应 的 上 确 界 进行 搜 索 窗 口 的 裁 剪 操 作 , 其 有 效 性 极 大 地 依 赖 于 边界 的 健 壮 性 。 文 献 11采 用 GPU实 现 并 行 计 算 , 但是 对 计 算 机 硬 件 提 出 了 较 高 的 要 求 ; 文 献 12使 用 快速 傅 里 叶 变 换 来 加 速 检 测 过 程 中 卷 积 计 算 过 程 。 文献 13通 过 多 种 加 速 方 法 间 的 组 合 来 构 建 完 整 的 加速 策 略 。多 类 别 加 速 算 法 : 文 献 14使 用 大 量 部 件 集 合 中的 稀 疏 线 性 组 合 来 对
13、可 变 形 部 件 进 行 编 码 , 以 此 来压 缩 模 型 中 所 使 用 的 有 效 部 件 数 ; 文 献 15使 用 少 量基 本 的 部 件 集 合 的 线 性 组 合 来 近 似 表 示 模 板 中 视角 、 形 变 、 尺 度 等 方 面 的 变 化 。 类 似 的 方 法 在 文 献 16中 也 进 行 了 相 关 研 究 。 这 两 种 方 法 都 是 通 过 学 习 得到 一 组 共 享 的 基 元 部 件 , 来 获 取 类 别 层 次 的 检 测 效果 。 文 献 17提 出 了 基 于 局 部 敏 感 的 哈 希 算 法 来 近 似DPM中 的 卷 积 计 算 ,
14、 处 理 的 对 象 类 别 达 到 了 100000种 , 但 是 对 于 检 测 精 度 的 影 响 较 大 。综 上 , 可 以 看 出 已 有 研 究 中 主 要 关 注 对 象 定 位加 速 , 并 且 取 得 了 一 些 成 果 , 但 是 对 于 特 征 计 算 加速 关 注 较 少 。 所 以 想 要 进 一 步 提 高 DPM模 型 的 处理 速 度 , 就 不 得 不 考 虑 特 征 计 算 部 分 的 加 速 问 题 。由 此 , 本 文 提 出 了 一 种 针 对 可 变 形 部 件 模 型 的 两 阶段 加 速 算 法 : 首 先 , 采 用 尺 度 上 稀 疏 采
15、样 的 特 征 金字 塔 近 似 表 示 精 细 采 样 的 多 尺 度 特 征 金 字 塔 , 以 此来 加 快 特 征 计 算 过 程 ; 然 后 , 采 用 级 联 算 法 来 加 速对 象 定 位 过 程 。 为 了 便 于 叙 述 , 后 续 将 本 文 提 出 的方 法 称 之 为 结 合 快 速 特 征 金 字 塔 的 级 联 可 变 形 部 件模 型 (Cascade Deformable Part Model with Fastfeaturepyramid,FCDPM)。2 基 于 幂 指 定 律 的 快 速 特 征 金 字 塔 计 算在 基 于 多 尺 度 特 征 金 字
16、塔 的 滑 动 窗 口 模 型 中 为了 解 决 模 板 尺 寸 与 对 象 尺 寸 不 一 致 的 问 题 , 需 要 对目 标 图 像 多 次 进 行 下 采 样 得 到 不 同 尺 度 下 的 图 像 ,然 后 再 在 逐 个 尺 度 的 图 像 上 逐 个 位 置 上 计 算 图 像 特征 , 从 而 生 成 精 细 的 特 征 金 字 塔 , 该 方 法 得 到 的 特征 精 度 高 , 但 是 相 应 的 时 间 开 销 也 较 大 。 已 有 研 究人 员 对 特 征 金 字 塔 进 行 研 究 , 发 现 多 尺 度 金 字 塔 尺度 间 的 特 征 存 在 一 定 的 关 系
17、 , 且 满 足 幂 指 定 律 18,19。由 此 , 本 文 提 出 在 特 征 金 字 塔 的 计 算 过 程 中 , 利 用多 尺 度 特 征 中 的 幂 指 定 律 有 选 择 地 计 算 部 分 尺 度 图像 的 特 征 , 然 后 基 于 这 些 尺 度 图 像 的 特 征 对 临 近 尺度 图 像 的 特 征 进 行 近 似 计 算 , 从 而 减 少 特 征 计 算 的运 算 量 。2.1 多 尺 度 特 征 间 的 幂 指 定 律为 了 便 于 描 述 , 本 节 先 简 要 介 绍 一 下 多 尺 度 图像 间 的 幂 指 定 律 。 对 于 给 定 的 输 入 图 像
18、I , 定 义 其对 应 的 通 道 特 征 为 图 像 像 素 的 某 种 线 性 或 是 非 线 性变 换 的 输 出 响 应 : ( )W=C I 。 其 中 W 表 示 某 种 计 算函 数 , C 表 示 输 出 响 应 。 定 义 fW 为 C 的 权 值 加 和 :( ) ( ), , , , ,i j si j sf w i j sW =I C , sI 为 图 像 I 在 尺 度 s 上的 重 采 样 图 像 , 其 中 sI 的 维 数 ( = ,s s sh g h sh)sg sg= 是 图 像 I 维 数 h g 的 s 倍 。 那 么 ( )fW sI 就被 定 义
19、 为 ( ) ( )1 , ,s ss s ijsf i j sh g sW I C (1)其 中 , ( )=s sWC I 。 由 此 , ( )fW sI 说 明 了 图 像 在 位 置( ),i j 以 及 尺 度 s 上 计 算 得 到 的 sC 的 全 局 平 均 值 。 在DPM模 型 中 , W 表 示 HOG特 征 映 射 函 数 。 最 终 目的 是 为 了 得 出 ( )fW I 与 尺 度 s 之 间 的 函 数 关 系 。 由 此设 ( )F I 定 义 了 图 像 I 的 统 计 信 息 , E 定 义 了 其 在图 片 集 中 的 数 学 期 望 。 由 文 献
20、19可 知 , 1 ( )/sE F I2 ( )sE F I 之 值 仅 与 尺 度 比 1/ 2s s 相 关 , 独 立 于 尺 度 值1s 以 及 2s 。 由 此 得 到( ) ( ) ( )1 2 1 2s sE E s s FF F -=I I (2)其 中 , F 表 示 对 应 的 拟 合 参 数 。 针 对 HOG特 征 计算 , 使 用 ( ) ( ),s sfW F WF = =I I , 由 此 期 望 得 出 图像 特 征 期 望 与 图 像 尺 度 之 间 的 关 系 。将 一 幅 图 像 I 视 为 K 幅 较 小 的 图 像 1 2, , , KI I I的
21、并 集 , 可 以 得 到 1 2= , , , KI I I I 。 由 于 HOG特 征对 于 旋 转 以 及 平 移 并 不 敏 感 , 因 此 ( ) 1( ,W W=I I2 1 2, , ) ( ), ( ), , ( )K KW W WI I I I I , 将 结 果 代 入式 (1)中 得 到 ( ) ( )kf f KW WI I (3)此 时 , 如 果 将 1 2, , , KI I I 视 为 一 个 较 小 的 图 像 集合 , 那 么 ( ) ( )kf E fW WI I 就 表 示 在 这 个 集 合 中 的 数学 期 望 , 即 图 像 的 全 局 特 征
22、均 值 ( )fW I 是 子 图 像 集 样本 特 征 均 值 ( )kfW I 的 数 学 期 望 。 由 于 ( )kfW I 可 以 视为 较 小 图 像 的 统 计 信 息 并 且 ( )kE fW I 表 示 了 在 这 一较 小 的 图 像 集 合 中 的 期 望 , 那 么 根 据 式 (2)可 以 得出 , 1 2 ( )/ ( ) ( 1/ 2)k ks sE f E f s s WW W -=I I 。 由 于 1( )sfW I1 ( )ksE fW I 并 且 ( ) ( )2 2ks sf E fW WI I , 进 而 推 断 出 :( ) ( ) ( )1 2
23、1 2s sf f s sWW W -I I (4)2.2 基 于 幂 指 定 律 的 尺 度 间 HOG 特 征 近 似 计 算本 节 将 上 述 定 律 应 用 到 DPM模 型 中 的 HOG特征 计 算 中 。 在 传 统 DPM模 型 中 , 计 算 尺 度 图 像 sI 的特 征 = ( )s sWC I 的 方 法 为 ( ( , )s R sW=C I , 其 中 R表示 采 样 函 数 , 即 需 要 首 先 将 图 像 I 缩 放 至 尺 度 s ,然 后 再 计 算 图 像 sI 的 HOG特 征 。 根 据 上 述 定 律 ,( )fW I 和 ( )sfW I 之 间
24、 存 在 对 应 关 系 , 为 此 在 已 知 原 始万方数据2866 电 子 与 信 息 学 报 第 38卷尺 寸 图 像 I 的 特 征 ( )W=C I 的 情 况 下 , 可 以 根 据 其对 sC 进 行 近 似 计 算 , 从 而 提 高 特 征 计 算 的 速 度 。具 体 过 程 为 , 对 于 式 (4)中 设 置 1 , 2 1s s s= = ,由 此 得 到 ( ) ( )sf f s WW W -I I 。 这 一 结 论 不 仅 适 用 于原 始 图 像 , 对 于 图 像 I 中 的 采 样 窗 口 w 以 及 重 采 样图 像 sI 中 的 sw 都 是 适
25、用 的 。 由 此 得 到 : ( )ssfW wI( )f s WW -wI 。 将 这 一 结 果 代 入 式 (1)中 , 得 到( ) ( ), ,1 1, ,s ss i j i ji j i j s W-w wC Cw w (5)因 为 s s w wC w C w 得 到 ( ), R sC C , 继而 得 出 : ( ),s R s s W-C C (6)2.3 基 于 幂 指 定 律 的 HOG 特 征 金 字 塔 计 算在 DPM模 型 中 , 常 规 的 特 征 金 字 塔 计 算 方 法是 在 每 一 个 尺 度 s 上 计 算 ( )( ),s R sW=C I ,
26、 从 原 始图 像 开 始 , 在 每 一 个 倍 频 程 中 相 对 于 上 一 步 以 12 t 的倍 数 进 行 下 采 样 , 直 至 经 历 t 次 迭 代 操 作 达 到 原 图 像的 12为 止 , 不 断 重 复 上 述 步 骤 直 至 检 测 图 像 缩 小 至5 5 个 HOG特 征 块 为 止 。 模 型 中 每 一 个 倍 频 程 有10(即 10t = )个 尺 度 , 那 么 在 一 个 倍 频 程 中 为 了 计 算多 尺 度 特 征 , 尺 度 特 征 需 要 重 复 计 算 10次 之 多 。 将上 一 小 节 提 出 的 尺 度 间 HOG特 征 近 似 计
27、 算 推 广 到HOG特 征 金 字 塔 的 计 算 之 中 , 首 先 计 算 尺 度 上 稀 疏采 样 的 特 征 金 字 塔 , 依 据 平 均 间 隔 选 择 若 干 个 基 准尺 度 (例 如 在 每 一 个 倍 频 程 , 即 在 每 10个 尺 度 中 选择 一 个 基 准 尺 度 1,1/2,1/4, s )计 算 s =C( ( , )R sW I , 余 下 的 中 间 尺 度 则 使 用 s C( , / )( / ) sR s s s s W-C 近 似 计 算 得 到 。3 结 合 级 联 算 法 的 可 变 形 部 件 模 型 对 象 定位3.1 可 变 形 部 件
28、 模 型 中 对 象 定 位 流 程本 节 首 先 简 要 介 绍 可 变 形 部 件 模 型 中 对 象 定 位的 处 理 流 程 。 DPM模 型 为 一 个 两 层 模 型 , 其 中 根 滤波 器 0w 用 于 检 测 对 象 的 整 体 轮 廓 , n 个 部 件 相 对 于根 滤 波 器 允 许 有 一 定 的 位 移 , 用 于 描 述 目 标 对 象 的细 节 特 征 及 其 位 置 偏 移 导 致 的 形 变 特 征 , 从 而 模 型在 处 理 大 尺 度 外 观 变 化 时 有 优 势 。 第 i 个 部 件 由 滤 波器 ( )1,2, ,i i = nw 以 及 形
29、变 模 型 ( )1,2, ,i i = nd 进行 参 数 化 表 示 。 一 个 对 象 假 设 由 0 1, , , np p p 进 行 定义 。 其 中 0p 表 示 根 滤 波 器 的 位 置 , tp 表 示 第 t 个 部件 的 位 置 。 根 滤 波 器 以 及 部 件 滤 波 器 之 间 通 过 图 结构 模 型 进 行 连 接 , 形 变 模 型 用 于 描 述 两 者 之 间 的 形变 特 征 。 为 了 检 测 出 图 像 中 目 标 对 象 的 位 置 , 在 每一 个 根 位 置 上 根 据 最 有 可 能 的 部 件 配 置 来 计 算 对 象假 设 的 整 体
30、 得 分 ( )0score p :( ) ( )10 0 1, ,score maxscore , , ,n np pp p p p= (7)( )( ) ( )( )0 1T T0 0 =1T 0score , , , , , ,n n i iii d ip p p= p pp p b f ff +- +w H w Hd (8)其 中 , H 表 示 计 算 得 到 的 目 标 图 像 的 HOG特 征 金字 塔 , f 表 示 相 应 位 置 的 HOG特 征 , df 表 示 部 件与 根 滤 波 器 之 间 的 形 变 特 征 。 b 是 为 了 区 分 不 同 的组 件 , 混 合
31、 组 件 的 引 入 是 用 于 表 示 对 象 不 同 的 姿 态或 是 形 变 情 况 。对 于 检 测 过 程 中 的 一 个 对 象 假 设 0 1 , , ,p p np , 由 于 其 中 仅 根 位 置 0p 是 已 知 的 , 部 件 位 置 tp 是由 最 大 化 部 件 表 现 得 分 减 去 其 相 对 于 根 位 置 发 生 位移 导 致 的 形 变 开 销 得 到 。 ( ) ( )T T 0argmax , ,i i i dpp p p pf f= -w H d (9)其 中 , p表 示 部 件 可 能 存 在 的 位 置 。 在 可 能 的 根 位置 中 根 据
32、 部 件 相 对 于 根 位 置 的 最 佳 位 置 找 出 总 体 得分 最 高 的 结 果 , 从 而 得 到 一 个 完 整 的 对 象 检 测 结 果 。3.2 结 合 级 联 的 快 速 对 象 定 位从 上 述 描 述 中 可 以 看 出 , 基 于 计 算 出 的 多 尺 度HOG特 征 , 在 DPM模 型 的 对 象 定 位 过 程 中 , 需 要逐 尺 度 层 采 用 滑 窗 搜 索 进 行 匹 配 检 测 。 但 是 , 事 实上 对 象 通 常 仅 出 现 在 图 像 场 景 中 的 有 限 位 置 , 图 像尺 度 空 间 上 的 绝 大 部 分 窗 口 对 于 视
33、觉 对 象 检 测 而 言是 无 效 的 , 如 果 在 每 个 尺 度 、 每 个 位 置 都 进 行 完 整的 匹 配 操 作 , 这 就 导 致 了 计 算 复 杂 度 的 增 加 。 由 此提 出 在 对 象 定 位 过 程 中 结 合 级 联 检 测 , 迅 速 减 除 大部 分 可 能 性 较 小 的 对 象 假 设 , 以 此 来 提 高 定 位 过 程的 速 度 。首 先 对 原 模 型 中 部 件 进 行 排 序 来 构 建 层 次 结 构的 新 模 型 。 在 拥 有 1n + 个 部 件 (其 中 包 括 根 滤 波 器 )的 DPM模 型 中 , 采 用 一 个 全 局
34、 阈 值 T 和 1 12 ( , ,n t t2 2, , , , ) n nt t t t 个 中 间 阈 值 的 序 列 , 从 而 得 到 一 个 长度 为 1n + 的 序 列 模 型 。 在 计 算 匹 配 得 分 时 , 部 件 得分 是 按 照 一 定 的 次 序 逐 个 匹 配 , 在 计 算 每 一 个 部 件表 现 得 分 以 及 相 应 的 变 形 开 销 时 都 要 与 中 间 阈 值 进行 判 别 , 如 果 小 于 预 设 的 中 间 阈 值 , 相 应 的 目 标 假设 就 被 剪 除 。在 每 一 个 根 位 置 0p H , 其 中 进 行 n 个 阶 段
35、(即需 要 对 n 个 部 件 进 行 评 估 )评 估 得 分 ( )0score p , 其 中我 们 所 感 兴 趣 的 仅 是 ( )0score p T 的 根 位 置 。 在 每个 阶 段 评 估 ( )0score p 时 会 有 两 次 剪 除 机 会 :假 设 剪 除 : 如 果 在 位 置 0p 处 前 ( )1,2, ,l l n= 个部 件 的 得 分 小 于 lt 时 , 即万方数据第 11期 李 春 伟 等 : 一 种 基 于 可 变 形 部 件 模 型 的 快 速 对 象 检 测 算 法 2867( ) ( ) ( )1T T T0 0 01, , ,l i i
36、i d i lip p p p t f f f-=+ - w H w H d (10)算 法 将 会 直 接 剪 除 在 0p 处 的 对 象 假 设 , 而 不 再 继 续评 估 l nw w 部 件 的 得 分 响 应 。形 变 剪 除 : 在 计 算 部 件 lw 的 得 分 时 , 即 确 定 部件 lw 的 位 置 lp 时 , 需 要 在 其 相 对 于 根 位 置 0p 的 可 能位 置 pd 进 行 搜 索 。 如 果 前 l 个 部 件 的 得 分 减 去 部件 lw 相 对 应 的 形 变 开 销 之 后 小 于 中 间 阈 值 lt , 即( ) ( ) ( )( )1T
37、 T T0 0 01T0, , , , l i i i d ii l d lp p p pp t f f ff d -= + - - w H w H dd (11)算 法 就 会 跳 过 位 置 d 。 对 于 给 定 的 全 局 阈 值 T , 当最 终 得 到 的 ( )0score p 大 于 T 时 , 即 得 到 一 次 成 功 的对 象 检 测 结 果 , 相 应 的 部 件 配 置 结 果 即 为 部 件 位 置 。4 结 合 快 速 特 征 金 字 塔 的 级 联 可 变 形 部 件模 型本 文 提 出 的 FCDPM算 法 流 程 如 表 1所 示 , 其中 变 量 g 表
38、示 每 个 阶 段 处 理 过 程 中 的 累 计 得 分 , q 表示 第 lw 个 部 件 的 得 分 , m 表 示 基 准 尺 度 的 数 目 , r 表示 由 基 准 尺 度 近 似 计 算 的 尺 度 数 , 检 测 示 意 图 如 图1所 示 。表 1 FCDPM 算 法输 入 : 检 测 图 像 I ; 滤 波 器 0 1, , , nw w w ;形 变 模 型 0 1, , , nd d d ; 全 局 阈 值 T ;中 间 阈 值 ( )1 1 2 2, , , , , , n nt t t t t t 。输 出 : 目 标 对 象 的 位 置 集 合 D 。(1)FOR
39、 ( )1, ,is s i m= = (2) ( )( ),is iR sW=C I(3) FOR ( )1, ,iks s k r= = (4) ( ) -,ik is s ik ikR s s WC C(5) ENDFOR(6)ENDFOR(7) ( ) ( ) 1 11 1 1, , , , , , , ,r m m mrs s s s s sH C C C C C C (8)D(9)FOR 0p H(10) ( )T0 0,g pf=w H(11) FOR 1, ,i n= (12) IF ig t THENPRUNE 0p(13) FOR pd (14) IF ( )T i d 0
40、 lg ,p tf d- d THENPRUNE d(15) ( ) ( )T T 0max ,p i i dq p, p pf f= -w H d(16) ENDFOR(17) g g q= +(18) ENDFOR(19) IF g T THEN 0pD D U(20) ENDFOR(21) RETURN D图 1 FCDPM算 法 的 示 例5 实 验 结 果5.1 实 验 准 备为 了 评 估 所 提 算 法 的 性 能 , 本 文 采 用 平 均 精 度(AveragePrecision,AP)值 作 为 评 价 指 标 , 分 别 在PASCALVOC2007数 据 集 以 及 I
41、NRIA数 据 集 上 进行 了 测 试 , 并 且 与 初 始 的 DPM模 型 以 及 相 关 算 法进 行 了 比 较 , AP值 定 义 如 下 :( )AP= PRE RE dRE (12)其 中 , RE表 示 召 回 率 , 说 明 了 算 法 的 查 全 性 能 ;PRE表 示 精 度 , 说 明 了 算 法 的 检 测 准 确 性 能 。 算 法的 AP值 通 过 以 下 步 骤 计 算 得 到 : (1)设 定 不 同 的 检测 得 分 阈 值 , 绘 出 随 着 精 度 递 减 的 召 回 率 /精 度 曲 线 ;(2)对 曲 线 下 方 的 区 域 进 行 数 值 积
42、分 , 得 到 相 应 的 AP值 。 AP 0,1的 数 值 越 大 , 表 示 算 法 的 性 能 越 好 。5.2 在 PASCAL VOC 2007 数 据 集 上 的 实 验 结 果PASCALVOC2007是 一 个 通 用 的 对 象 检 测 数据 集 , 其 测 试 集 中 包 含 20种 类 别 的 图 像 , 共 有 4952张 测 试 图 片 以 及 14976个 人 工 标 注 的 目 标 对 象 。 通过 上 面 的 叙 述 , 设 nApp为 在 特 征 金 字 塔 计 算 中 , 由每 一 个 基 准 尺 度 所 外 推 计 算 的 尺 度 数 , 当 nApp=
43、0时 , 即 表 示 精 细 采 样 的 特 征 金 子 塔 。 nApp的 取 值 会影 响 特 征 金 字 塔 的 计 算 速 度 , 取 值 越 大 , 计 算 速 度万方数据2868 电 子 与 信 息 学 报 第 38卷越 快 , 但 是 这 也 会 在 一 定 程 度 上 影 响 特 征 金 字 塔 的计 算 精 度 , 首 先 讨 论 了 不 同 的 nApp取 值 对 于 AP值以 及 相 对 于 DPM模 型 检 测 速 度 的 影 响 , 相 应 的 结果 如 图 2所 示 。从 图 2可 以 发 现 , 随 着 nApp值 的 加 大 , AP值总 体 趋 势 是 不 断
44、 下 降 , 而 相 对 于 DPM模 型 的 加 速倍 数 的 总 体 趋 势 是 不 断 上 升 。 这 说 明 随 着 nApp取 值越 大 , 速 度 越 快 , 但 是 相 应 特 征 金 字 塔 的 精 度 也 在下 降 , 从 而 导 致 检 测 精 度 的 下 降 , 这 就 可 以 使 算 法在 检 测 精 度 和 速 度 之 间 取 得 一 定 的 平 衡 。表 2比 较 了 FCDPM算 法 , 与 初 始 的 DPM模型 以 及 若 干 种 加 速 算 法 , 其 中 包 括 CSC算 法 7, CF算 法 8, BB算 法 10, 在 PASCAL2007数 据 集
45、上 的实 验 结 果 , 其 中 FCDPM旁 的 数 字 表 示 nApp的 取值 。 每 一 种 算 法 在 20种 类 别 检 测 过 程 中 的 平 均 特 征计 算 时 间 、 对 象 定 位 时 间 以 及 完 整 检 测 时 间 如 表 3所 示 。 从 表 3可 以 发 现 , CSC算 法 、 CF算 法 、 BB算法 相 比 于 初 始 的 DPM模 型 在 PASCAL2007数 据 集上 取 得 了 10倍 左 右 的 加 速 效 果 , 本 文 算 法 与 之 相比 , 可 以 3倍 快 于 这 些 改 进 算 法 , 但 是 平 均 的 AP值 有 一 定 的 下
46、降 (特 别 是 与 CSC算 法 相 比 较 )。 即 当nApp=9时 , 可 以 取 得 最 快 的 加 速 效 果 , 相 应 的 精度 下 降 也 最 多 , 但 是 与 CF算 法 和 BB算 法 相 比 ,综 合 考 虑 精 度 以 及 速 度 , 具 有 较 大 的 优 势 ; 而 且 可以 通 过 调 整 这 一 参 数 , 从 而 在 检 测 精 度 和 速 度 之 间取 得 一 定 的 平 衡 。 当 nApp=5时 , 平 均 的 AP值 为31.3%, 当 nApp=1时 , 平 均 的 AP值 上 升 到 32.4%,此 时 与 CSC算 法 仅 相 差 0.4%,
47、 检 测 速 度 为 CSC算法 的 1.6倍 。5.3 在 INRIA 数 据 集 上 的 实 验 结 果INRIA数 据 集 是 一 个 常 用 的 行 人 检 测 数 据 集 ,其 中 包 含 614幅 图 像 , 共 有 1237个 正 样 本 和 1218个 负 样 本 。 表 4说 明 了 上 述 算 法 在 该 数 据 集 上 的 实图 2nApp的 取 值 对 于 检 测 速 度 以 及 精 度 的 影 响表 2 不 同 算 法 在 PASCAL2007 数 据 集 中 20 个 类 别 的 AP 值 结 果 (%)算 法 Aero Bicycle Bird Boat Bott
48、le Bus Car Cat Chair CowDPM 32.1 59.9 10.6 13.5 24.9 47.7 48.9 27.5 17.4 27.0CSC7 33.6 58.5 10.2 13.4 25.0 44.7 49.2 28.0 17.1 27.2CF8 27.6 58.6 10.5 10.6 16.5 52.7 42.1 27.6 12.9 29.1BB10 30.6 53.9 8.7 10.4 22.5 43.2 38.9 17.5 13.5 22.6FCDPM9 35.9 57.6 8.4 11.8 26.9 44.3 48.1 18.0 14.7 22.8FCDPM5 3
49、5.5 58.6 10.2 11.6 27.4 46.5 50.6 19.4 16.4 23.4FCDPM1 37.0 59.6 10.3 11.2 27.4 44.3 50.8 20.6 17.9 23.0Dog Horse Mbike Person Plant Sheep Sofa Table Train Tv 平 均14.4 57.4 50.0 38.4 13.3 21.0 36.8 31.1 47.5 42.3 33.013.5 57.7 50.0 38.5 14.1 21.6 36.8 28.6 47.4 42.0 32.815.3 55.2 44.6 26.3 12.4 22.7 38.6 32.8 44.8 32