Sleep like a pillow

Deep Learning関係の話。

論文読み Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

arxiv.org

どんなもの?

  • Intersection over Union (IoU)は物体検出タスクにおいて、もっともよく使われる評価指標。
  • bounding box推定の学習によく用いられるregression lossの最適化と、IoUの最大化の間にはギャップがある。
  • そのため、IoUをlossとして使う先行研究もあるが、IoUは二つの領域が全く重なっていない場合には領域の位置関係に関わらず全て0となるため、IoU lossは多くの鞍点(勾配が0の点)を持ち、学習が進まない場合がある。
  • この論文では、IoU lossの問題点を解決した Generalized IoU (GIoU) loss を提案。

技術や手法のキモ

Generalized Intersection over Union

  • IoUは二つの領域の積(intersection)Aと和(union)Bから以下のように計算される。
 \displaystyle IoU = \frac{|A \cap B|}{|A \cup B|}
  • IoUの持つ大きな問題点は、二つの領域が全くoverlapしていない場合は全て値が0となるため、二つの領域が近くにあるのか遠くにあるのかというのを反映させることができないという点。
  • GIoUは二つの領域の積(intersection)Aと和(union)Bに加えて、二つの領域を囲む最小かつ同じ形状の領域Cを用いて下式のように計算される。
 \displaystyle GIoU = \frac{|A \cap B|}{|A \cup B|} - \frac{|C \setminus (A \cup B)|}{|C|}
  • GIoU lossは
 \displaystyle L_{GIoU} = 1 - GIoU

GIoU as Loss for Bounding Box Regression

  • 任意の形状についてのGIoUを解析的に求めるのは難しいが、Bounding Boxについては以下のように簡単に求めることができる。 f:id:uiiurz1:20190430091148p:plain

有効性の検証

  • YOLOv3のMSE loss, Faster R-CNNとMask R-CNNのl1-smooth lossをGIoU lossに置き換えて学習を行う。
  • GIoU lossを用いることでAPとAP75が向上することを確認。
  • 定性評価においても、GIoUが最も優れている。 f:id:uiiurz1:20190430091219p:plain

議論や改善点

  • 直方体のGIoUの解析的な導出のフィージビリティについて調査する予定。
    • GIoUの導出が可能であれば、3Dの物体検出についてもGIoUを適用できる。