Coda

メモ Training Complex Models with Multi-Task Weak Supervision

September 28, 2019

論文の表題は、ソース間の粒度や精度が揃っていることを前提とせず、LohとWainwrightらの手法でソースの精度を推定し、ソースのラベルよりも精度が高いラベルをデータに与えるWeak supervsionの手法である。

論文で紹介される手法は、MeTaLという名のフレームワークとして実装され、公開されている。 ただし、Projectの状況にあるように、MeTaLプロジェクトは、Snorkelに吸収されることになり、今はメンテナンスモードにある。

ソースとは、データに対して必ずしも正しいとは限らないラベルを付与するための知識源を示す。 MeTaLが対象にする状況は、ソース同士が粒度の異なるラベルを割りあてる場合である。 固有表現抽出の例をあげれば、作りたいラベルが医者や弁護士のような職業や組織のとき、あるソースは参照表現が人か組織を判別する一方で、別のソースが職業を判別する場合がある。 MetTaLは、各ソースのラベル付けをサブタスクとみなし、ソースがつけるラベルの種類のグラフ構造とソースがつけるラベルからソースの精度を予測し、ソースよりも高い精度でデータにラベルを与える。


論文はこちらからダウンロードできます。