論文メモ Character-level Convolutional Networks for Text Classification

September 25, 2020

文字単位のCNNによる文書の分類を、ほかのモデルと比較して評価した。 先行研究より、CNNを訓練するときは大量の教師データが必要になると分かっている。 のため、比較のためのデータセットは大きく、訓練データの事例数は最低でも12万件におよぶ。 文字単位のCNNに大量の訓練データをあたえれば、別途単語の意味をモデルにあたえずとも性能を発揮することを示した。

実験にもちいたCNNのアーキテクチャは、1次元の畳込みで、6つの畳込み層と3つの全結合層からなる。次の図は、アーキテクチャの全体像を示す。

model

比較したモデルは、bag of words, n-grams, TF-IDF, 単語単位のCNN, 回帰結合型モデルである。 評価指標はテストエラー率で、比較に使われたデータセットと結果は次のとおり。 データセットによって性能の良いモデルは異なっている。

datasets

results