リアルタイム形態素解析 morph-websocket / kawasaki.rb #004
- 3. 形態素解析とは
• 文字列を形態素(単語)の
単位に分割して、品詞を
推定する基本的なテキ
スト解析
• MeCabが有名
裏庭
名詞,一般,*,*,*,*,裏庭,ウラニワ,ウラニワ
に
助詞,格助詞,一般,*,*,*,に,ニ,ニ
は
助詞,係助詞,*,*,*,*,は,ハ,ワ
二
名詞,数,*,*,*,*,二,ニ,ニ
羽
名詞,接尾,助数詞,*,*,*,羽,ワ,ワ
鶏
名詞,一般,*,*,*,*,鶏,ニワトリ,ニワトリ
が
助詞,格助詞,一般,*,*,*,が,ガ,ガ
いる
動詞,自立,*,*,一段,基本形,いる,イル,イ
ル
EOS
13年9月25日水曜日
- 6. morph-websocket
• WebSocket + Kyteaでリアルタイム形態素解析
• KyteaをSWIGでbinding (MyKytea-ruby/python)
• NLTK本にあるがPythonからは使えなかった
• em-websocketでサーバ側の処理
13年9月25日水曜日