Deep Metric Learning サーベイ

whey
2019/02/21 08:17

## TL;DR

- インターンシップで2週間metric learningをやったのでサーベイ結果をまとめます．

- 論文と手法紹介をこの記事でして，実験はまた別記事で行います

- N-pair SamplingとAngular LossによるMetric Learningがおそらくもっとも安定位していて良い

## 論文・手法

- Triplet Sampling

- Triplet Loss

- N-pair Sampling, N-pair Loss

- L2-constrained Softmax Loss

- Angular Loss

## Metric LearningとDeep Metric Learning

- Metric Learningは類似度や距離を定義し，それらが近いものでクラスタリングする手法です．

- Deep Metric Learningは，距離の定義と抽出をDNNによって行おうというものです．

- 画像データだとPretrainedのCNNを用いて特徴抽出をし，その後ろにfc層を置き，任意の次元に出力するような設計が一般的になると思われます．

- 詳しくはこちらを参照してくださいhttps://techblog.zozo.com/entry/metric_learning

## Triplet Sampling, Triplet Loss

この手法は，ランダムに取得したデータx，xと同じラベルのデータx_p，xと異なるラベルのデータx_nの3つをセットにして学習を行います．

以下のlossを最小化するよう学習します．このf(x)は，DNNによって抽出された任意の次元の出力です．

この式から同じラベル同士のペアの距離を近づけ，異なるラベル同士を離すような学習をすることがわかります．また，αはハイパーパラメータで論文中の実験ではα=0.2と設定されていました．このαは，2つのラベルをどの程度離すかを設定するパラメータです．

## N-pair Sampling, N-pair Loss

先ほどのTripletを改良したものがこのN-pairです．

TripletにおけるnegativeサンプルをN個(ハイパーパラメータで分類したいクラス数にもよるが比較的多めにとると良さそう)にしたバージョンです．

N個の異なるラベルのnegativeサンプルを用いることで，ひとつのpositiveサンプルに対して，各negativeクラス間の相対的な位置関係がわかりやすくなり，学習が安定するのかなと思われます．

今回のインターンシップでは犬猫の2値分類であり，異常とするデータが非常に少なかったため，さしてうまく作用すると思えなかったため使用しませんでした．

## L2-constrained Softmax Loss

これは抽出されたmetricをnormalizeし，そのmetrciを用いて分類問題を解き，そのlossを流して学習する手法です．

L2正則化を加えることで超球面上にmetricを配置することになり，通常の学習よりも安定するということだと思われます．

## Angular Loss

論文：https://arxiv.org/abs/1708.01682

anchorとpositiveとnegativeの3点を角度の視点から距離を離すように設計されたlossです．文章だけで説明するのが難しいのと，論文が非常に読みやすいわかりやすい良い論文なので，ぜひ論文をよでみてください．

実装自体は非常に簡単なのでウルトラおすすめです．

結果だけ言うと，以下の式を最小化するよう学習します．

それによって，各微分にanchor, positive, negativeが存在するので，学習が効率よく精度よく進むよと言うことにも言及されています．

以上です◎

公開日：2019/02/21

獲得ALIS：14.51

whey
@whey

Kobe Univ. / Otafuku-Lab, Machine Learning Engineer / Twitter @whey_yooguruto

投稿者の人気記事

コメントする

ドラクエで学ぶオーバフロー

keiju togashi 2020/03/12

0.00 ALIS 30.10 ALIS

クリプト

NFT解体新書・デジタルデータをNFTで販売するときのすべて【実証実験・共有レポート】

otakucoin 2021/03/29

681.47 ALIS 121.79 ALIS

クリプト

ジョークコインとして出発したDogecoin（ドージコイン）の誕生から現在まで。注目される非証券性🐶

昆布森ちゃん 2021/01/19

1.44k ALIS 38.31 ALIS

クリプト

Uniswap v3を完全に理解した

池田らいく 2021/04/04

488.96 ALIS 18.92 ALIS

クリプト

Bitcoinの価値の源泉は、PoWによる電気代ではなくて"競争原理"だった。

CryptoChick 2020/03/07

144.63 ALIS 159.32 ALIS

テクノロジー

iOS15 配信開始!!

IMAKARA 2021/09/23

393.67 ALIS 7.20 ALIS

テクノロジー

なぜ、素人エンジニアの私が60日間でブロックチェーンゲームを制作できたのか、について語ってみた

ゆうき 2020/08/12

463.31 ALIS 270.93 ALIS

他カテゴリ

ALISのシステム概観

ALISブロックチェーンブログ 2018/07/03

0.00 ALIS 5.00 ALIS

テクノロジー

オープンソースプロジェクトに参加して自己肯定感を高める

おはぐろ氏 2020/02/15

174.64 ALIS 85.05 ALIS

他カテゴリ

機械学習を体験してみよう！（難易度低）

nonstop-iida 2020/03/04

454.56 ALIS 124.82 ALIS

クリプト

Bitcoin史〜0.00076ドルから6万ドルへの歩み〜

大田コウキ 2021/04/06

799.98 ALIS 947.13 ALIS

テクノロジー

彼女でも分かるように解説：ディープフェイク

Jimmy 2020/03/17

0.00 ALIS 32.10 ALIS

Deep Metric Learning サーベイ

## TL;DR

## 論文・手法

## Metric LearningとDeep Metric Learning

## Triplet Sampling, Triplet Loss

## N-pair Sampling, N-pair Loss

## L2-constrained Softmax Loss

## Angular Loss

以上です◎

ドラクエで学ぶオーバフロー

NFT解体新書・デジタルデータをNFTで販売するときのすべて【実証実験・共有レポート】

ジョークコインとして出発したDogecoin（ドージコイン）の誕生から現在まで。注目される非証券性🐶

Uniswap v3を完全に理解した

Bitcoinの価値の源泉は、PoWによる電気代ではなくて"競争原理"だった。

iOS15 配信開始!!

なぜ、素人エンジニアの私が60日間でブロックチェーンゲームを制作できたのか、について語ってみた

ALISのシステム概観

オープンソースプロジェクトに参加して自己肯定感を高める

機械学習を体験してみよう！（難易度低）

Bitcoin史 〜0.00076ドルから6万ドルへの歩み〜

彼女でも分かるように解説：ディープフェイク

Bitcoin史〜0.00076ドルから6万ドルへの歩み〜