Sleep like a pillow

Deep Learning関係の話。

2019-01-01から1年間の記事一覧

Kaggle APTOS 2019 Blindness Detection まとめ

はじめに 2019年6月の終わりごろから先日まで、KaggleのAPTOS 2019 Blindness Detectionに参加していました。 最終的な順位は11位でゴールドメダルを獲得するとともに、Kaggle Masterになりました。 以下、取り組みなどのまとめです。 www.kaggle.com github…

MixConv: Mixed Depthwise Convolutional Kernels

arxiv.org どんなもの? Depthwise Convolutionは近年の軽量なCNNでよく使われているが、カーネルサイズについては深く議論されていない。 本論文では、異なるカーネルサイズ(3x3以外も)を用いることによる影響を体系的に調査し、複数のカーネルサイズを組み…

論文読み EXTD: Extremely Tiny Face Detector via Iterative Filter Reuse

どんなもの? パラメータ数が0.1M以下の非常に軽量なmulti-scale face detectorのEXTDを提案。精度も大規模なdetectorに匹敵。 multi-scale detectorはbackbone network中のマルチスケールの特徴マップを必要とするが、EXTDでは異なるスケール間でパラメータ…

論文読み EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

著者による実装 github.com どんなもの? CNNモデルをスケーリングするにはdepth, width, resolution(入力画像サイズ)の3つをチューニングする必要があるが、単純にどれか一つを大きくしても計算コストが増えるだけで精度はサチってしまう(ResNet-1000がRes…

論文読み Objects as Points (CenterNet)

arxiv.org 著者による実装 github.com 3D detectionとポーズ推定についても追々まとめます。 どんなもの? 従来の物体検出手法では、潜在的な物体位置を網羅的に列挙しそれぞれを分類することで検出を行うが、無駄が多く非効率でNMSなどの後処理を必要とする…

論文読み Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

arxiv.org どんなもの? Intersection over Union (IoU)は物体検出タスクにおいて、もっともよく使われる評価指標。 bounding box推定の学習によく用いられるregression lossの最適化と、IoUの最大化の間にはギャップがある。 そのため、IoUをlossとして使う…

論文読み SSD: Single Shot Multi Box Detector

とても有名な物体検出アルゴリズムなので読んでみました。 arxiv.org 2 The Single Shot Detector (SSD) 2.1 Model SSDでは固定数のbounding boxとclass scoreを推定し、最後にNMSをかける。 SSDの最初の方の層には、画像分類タスクにおいて高い性能を持つネ…

論文読み&Keras実装 ArcFace: Additive Angular Margin Loss for Deep Face Recognition

metric learningやfeature learningと呼ばれる学習手法は、クラス内のサンプル間の距離を近く、クラス間のサンプル間の距離を遠くするような特徴量を学習によって獲得するものです。 代表的なmetric learning手法のSiamese NetworkやTriplet lossはもう古く…

論文読み M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network

M2Det 今年発表されたone-stage detectorのSOTAで、構造がとてもエレガントです。 arxiv.org 著者によるPyTorch実装 github.com M2Detとは? 既存のone-stage detectorで用いられているfeature pyramidは、分類タスク用のモデルの特徴マップから構成されてい…

論文読み OCNet: Object Context Network for Scene Parsing

OCNet: Object Context Network for Scene Parsing PSPNetのPyramid PoolingやDeepLabのASPといったsegemntationで強いモジュールと、Non-local Neural Networksを組み合わせたモジュールを提案した論文です。 arxiv.org 著者によるPyTorch実装: github.com …