論文紹介
Tensor Networks for Medical Image Classification
テンソルネットワークを用いた医療画像分類について。
テンソルネットワークは量子系を古典計算で効率良く近似し、シミュレーションする手段として広く用いられています。
このようなテンソルネットワークの性質、ポテンシャルを、機械学習に活用しようという研究が近年増えています。
ただしほとんどは従来手法、特にディープラーニング(DL)系と比較して超えるのは難しく、competitive にとどまっている印象です。
また、扱うデータもテーブルデータやFasionMNISTなど、割と軽量なものでした。
本論文ではCTスキャン画像を集めたPCamと呼ばれるデータセットを用いており、その点で一歩前進してます。
また、DL手法(DenseNet)と比較して10分の1以下のGPUメモリリソースしか用いないにもかかわらず、その分類AUCスコアで上回る軽量なテンソルネットワークモデル(LoTeNet)を提案しています。
LoTeNetは論文の図を見るに、MPS構造のピラミッドツリー型ネットワークのような構造をとっています。
各MPS構造が、Convolutional Neural Network の各畳み込み層のような位置づけと言って良いかもしれません。
またMPS構造へのデータの埋め込み方においても、画像のグローバルな構造をモデルが捕らえられるような、工夫がなされています。
というのも、MPSは1次元構造のため、単純に2次元画像をflattenすると離れたピクセル同士の相関はあっという間に失われてしまいます。
これを防ぎ、なるべく画像の大域的な構造、相関をMPS構造に反映させる必要があったということです。
MPS自体が1つのよく知られたテンソルネットワーク構造ですが、それを複数用意してさらにネットワーク構造にする点が個人的に面白いと思いました。