Posts

要約 Applying Conditional Random Fields to Japanese Morphological Analysis

Mecabの中の人の資料で紹介でされている、Mecabのアルゴリズムを提案・評価した論文。

概要 Text Classification from Labeled and Unlabeled Documents using EM

アルゴリズム

提案手法は、Naive BayesとEMアルゴリズムを組み合わせたもの。 ラベル付きデータが\(D^l\)でラベルなしデータが\(D^u\)で表されるとき、対数尤度\(\log P(D^l)P(D^u)\)を最大化する問題を解く。