論文メモ Character-level Convolutional Networks for Text Classification
September 25, 2020文字単位のCNNによる文書の分類を、ほかのモデルと比較して評価した。 先行研究より、CNNを訓練するときは大量の教師データが必要になると分かっている。 のため、比較のためのデータセットは大きく、訓練データの事例数は最低でも12万件におよぶ。 文字単位のCNNに大量の訓練データをあたえれば、別途単語の意味をモデルにあたえずとも性能を発揮することを示した。
実験にもちいたCNNのアーキテクチャは、1次元の畳込みで、6つの畳込み層と3つの全結合層からなる。次の図は、アーキテクチャの全体像を示す。
比較したモデルは、bag of words, n-grams, TF-IDF, 単語単位のCNN, 回帰結合型モデルである。 評価指標はテストエラー率で、比較に使われたデータセットと結果は次のとおり。 データセットによって性能の良いモデルは異なっている。
- 論文をこちらからダウンロードできます。
- 画像はすべて論文から引用しました。