Classifier Chains for Multi-label Classification

March 22, 2022

scikit-learnのClassifier Chainで実装されたClassifier Chainsは、ラベルの相関関係を特徴につかうマルチラベル分類のモデルで、既存の相関関係をもちいる手法よりも計算量がすくない。 より細かくみれば、Classifier Chainsは、Classifier Chain Model(CC)とCCのアンサンブル学習であるEnsembles of Classifier Chains(ECC)の2つにわかれる。

CCは、one vs restとおなじく、ラベルの種類数だけの2値分類のモデルをつかい、モデルを順番に学習する。 One vs restとの違いは、\(i\)番目のモデルをするときに、すでに学習したモデル\(0,\dots i-1\)の出力を特徴に加えることである。 先に学習するモデルほど別のモデルの出力を特徴につかえないので、CCは学習するモデルの順番に影響されやすい。

ECCは、アンサンブル学習により、CCの順番への依存を解決する。 ECCは、複数のCCをランダムサンプルした訓練データの一部で学習する。 推定するときは、すべてのCCの出力の和をもちいる。

論文をこちらからダウンロードできます。