博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
论文阅读之: Hierarchical Object Detection with Deep Reinforcement Learning
阅读量:6842 次
发布时间:2019-06-26

本文共 1779 字,大约阅读时间需要 5 分钟。

 

Hierarchical Object Detection with Deep Reinforcement Learning

NIPS 2016 WorkShop 

 

  Paper : https://arxiv.org/pdf/1611.03718v1.pdf

  Project Page : https://github.com/imatge-upc/detection-2016-nipsws  

  摘要我们提出一种基于深度强化学习的等级物体检测方法 (Hierarchical Object  Detection). 关键点在于: 专注于图像的含有更多信息量的区域, 并且放大该区域. 我们训练一个 intelligent  agent, 给定一个图像窗口, 能够确定将注意力集中于预先设定的五个区域中的哪一个. 这个过程迭代的提供了一个等级的图像分析. 我们对比了两个不同的候选 proposal 策略来引导图像搜索: with and without overlap. 此外, 我们的方法对比了两种不同的策略来提取特征: 第一种是对每一个 region proposal 计算新的 feature map ; 另一种方法是对于整幅图像计算 feature maps 并为后续的每一个 region proposal 提供 crop 的feature map.   

 

  模型   Hierarchical Object Detection Model

  我们定义了物体检测问题当做是序列决策过程 (the sequential decision process). 每一个时间步骤, agent 应该决定图像的哪个区域应该集中注意力, 以便于少量的步骤内找到物体. 我们将这个问题看作是 Markov Decision Process , 提供了一个框架来建模 decision making. 

 

  MDP formulation :

  作者首先定义了 MDP 的大致过程 : state, actions, reward

  State :  当前区域 和 记忆向量 构成, 即: the current region and a memory vector. 描述符定义了两个模型: the Image-Zooms model and the Pool45-Crops model . 状态的记忆向量(memory vector)捕获了agent 搜索物体当中,已经选择的过去 4  个 actions. 由于 agent 是学习一个 bounding box 的 refinement procedure, 一个记忆向量编码了这个 refinement procedure 的状态 用来稳定搜索轨迹. 我们将过去的 4 个 actions 编码成一个 one-shot vector. 由于本文定义了 6 个 actions, 所以向量的维度是 24.

 

 

  Actions : 跟 ICCV 2015 年的那个检测的方法一样, 这里的action 也是定义成了图像变换的操作 和 停止操作.

 

 

  Rewards : 此处的设计 与 ICCV 2015 仍然是一致的.       

  

 

  Model :  

  

  我们讨论了两种提取特征的方法, 上面就是所用的大致网络框架. Image-Zooms model and the Pool45-Crops model. 

  对于 Image-Zooms model 来说, 每一个区域都 resize 成 224*224 的大小, 然后抽取 VGG-16 的 Pool 5 layer 的特征. 

  对于 Pool45-Crops model, 图像是 full-resolution 传给 VGG-16 的 Pool 5  layer. 

  

  像 Faster RCNN 的 ROI Pooling 的方法一样, 本文也是采用这种思路, 只是抽取 ROI 的 feature . 像 SSD 一样, 我们根据 ROI 的尺寸来选择 feature map. 对于较大的物体, 本文的方法就选择较深的 feature map, 而较小的物体, 本文就选择较浅的 feature map . 

   

  


  

转载地址:http://aqbul.baihongyu.com/

你可能感兴趣的文章
PostgreSQL 10.1 手册_部分 II. SQL 语言_第 7 章 查询_7.3. 选择列表
查看>>
Intel 收购 Vertex.AI,打造开源深度学习引擎 PlaidML
查看>>
独家 | 用Python Featuretools库实现自动化特征工程(附链接)
查看>>
Thrift源码解析--transport
查看>>
百度竞价账户托管,屏蔽账户恶意点击的2种策略,非常规。
查看>>
JavaScript面向对象编程简明教程
查看>>
[译] 5 个有趣的 Linux 命令行技巧
查看>>
Core Data的基本使用简介
查看>>
ECCV 2018 最佳论文名单公布,何恺明再添一项论文奖
查看>>
JAVA模板方法设计模式——Java设计模式,写漂亮的代码——
查看>>
Debian 包维护者不满 Debian 开发流程,宣布退出
查看>>
有趣的Tensorflow游乐场以及有趣的思考
查看>>
spring源码-bean之初始化-1
查看>>
不为人知的网络编程(七):如何让不可靠的UDP变的可靠?
查看>>
Android--面试题整理(五)
查看>>
php continue break 用例
查看>>
Scrapy小解
查看>>
移动端小项目的小总结~
查看>>
【新知】 量子技术初探
查看>>
CentOS 6.9关闭NetworkManager服务
查看>>