論文リンク https://arxiv.org/abs/2103.00112 リポジトリリンク https://github.com/huawei-noah/noah-research/tree/master/TNT どんなもの? ViTは画像をパッチのシーケンスとして扱うが、各パッチ内の本質的な構造情報(局所的な特徴)を使えていない。 本…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。