SlideShare a Scribd company logo
1 of 40
Download to read offline
mecab-ipadic-NEologd
の効果的な使い方
2015-04-23 LT at えびスタ!#2
佐藤敏紀 ( @overlast )
まとめ
- mecab-ipadic-NEologd は IPA 辞書を拡張した
mecab のシステム辞書
- 新語・固有表現などを160万語以上再録
- 読み仮名・原型付きで(異表記の重複込み)
- 最低月2回アップデート(初旬・中旬)
- Apache License 2.0 なOSSなので安心
- 辞書はタスクに応じて使い分けると効果UP !!
佐藤 敏紀 ( @overlast )
現職 : LINE 株式会社のエンジニア
- 自然言語処理、検索、機械学習まわり
前職 : ヤフー株式会社のエンジニア
- 検索エンジンのキーワードのスペル訂正等
学生 : 東京工業大学大学院 奥村研究室
- 比較表現抽出の研究
- blogWatcher の開発運用
その他
- DSIRNLP という勉強会を主催しています
- 初心者にもやさしく雰囲気も良いです^^
- YouTube で「DSIRNLP」を検索
- 夏に開催されるNLP若手の会 第10回シンポジ
ウムに是非ご参加ください(まだ詳細未定)
http://yans.anlp.jp/
- 僕の現職や前職について何か聞きたい方は、
お気軽にお声がけください
Neologism
dictionary based on
the language
resources on the
Web for mecab-
ipadic
mecab-ipadic-NEologd
メカブ アイピーエーディック ネオログディー
Avg 10 unique cloners / day で普及
mecab-ipadic と併用することが常識にな
ることが一番最初の目標である
mecab-ipadic-NEologd を使うと
IPA 辞書を使っている際の「新語が辞書に登録されて
いなくて困る問題」を大幅に軽減できる
- その例をインストール時に確認できる
新語が「名詞,固有表現,一般,*,*,*」と
して認識されている
初回インストール (例: OSX)
Step.1 : 必要なライブラリをインストール
- $ brew install mecab mecab-ipadic git curl xz
Step.2 : git clone する
- $ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
Step.3 : インストールする
- $ cd mecab-ipadic-neologd; ./bin/install-mecab-ipadic-neologd -n
インストールが超簡単!!
https://www.flickr.com/photos/kit4na/6385016345/
使用例 : コマンドラインの場合
[overlast@]$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
iQONのアプリ内のデータ分析基盤の紹介や分析手法について紹介します。
iQON 名詞,固有名詞,一般,*,*,*,iQON,アイコン,アイコン
の 助詞,連体化,*,*,*,*,の,ノ,ノ
アプリ 名詞,固有名詞,一般,*,*,*,アプリ,アプリ,アプリ
内 名詞,接尾,一般,*,*,*,内,ナイ,ナイ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
データ 名詞,一般,*,*,*,*,データ,データ,データ
分析 名詞,サ変接続,*,*,*,*,分析,ブンセキ,ブンセキ
基盤 名詞,一般,*,*,*,*,基盤,キバン,キバン
の 助詞,連体化,*,*,*,*,の,ノ,ノ
紹介 名詞,サ変接続,*,*,*,*,紹介,ショウカイ,ショーカイ
や 助詞,並立助詞,*,*,*,*,や,ヤ,ヤ
分析 名詞,サ変接続,*,*,*,*,分析,ブンセキ,ブンセキ
手法 名詞,一般,*,*,*,*,手法,シュホウ,シュホー
について 助詞,格助詞,連語,*,*,*,について,ニツイテ,ニツイテ
紹介 名詞,サ変接続,*,*,*,*,紹介,ショウカイ,ショーカイ
既存の IPA 辞書には登録されていない
固有表現を認識できるようになった !!
うまくいかない場合の例
一般名詞の固有表現化
- 「デート」が一般名詞だから、ドラマのタイトルに固有表現な
品詞情報を付与できない
↑↑↑ 今後の固有表現抽出で解くべき問題の一つ
便利そうですね!!
事実とても便利
些細なエラーは忘れたい
可能になったことが大切
文書分類やレコメンドの
結果も当然改善される
https://www.flickr.com/photos/span112/2245983695/
たまにアップデートしましょう
以下のコマンドでサクっと更新できます
 $ ./bin/install-mecab-ipadic-neologd -n
-h オプションで機能を確認してみましょう !!!
辞書のバージョンを固定したい場合
 => tag から任意のバージョンを選ぶ
- 機能が大幅に更新された時に作っている
- 現在は v0.0.1 のみ存在している
LT の本題
5種類の典型的なタスクにおける
オススメな形態素解析辞書の選択例
1. 【検索】index を 1 つだけ使って検索する
2. 【検索】形態素 index を 1 つだけ作成
3. 【一般】特殊なジャンルの文書を解析する
4. 【テキストマイニング】さくっと分析
5. 【機械学習】テキストから特徴ベクトル作成
番外編1 :文字列正規化は形態素解析前にする
例題 :
 Tweet を API から取得して text 部分をそのまま
MeCab で解析してます。とくに新語は含まれてい
ないのに結果がボロボロになります
解 :
 新語の有無はさておき、仕事や研究で形態素解
析をする場合は一番最初に正規化をします。以下
の記事が参考になるかもしれません。
- mecab-ipadic-NEologd の辞書作成時の正規化ルール 
例: 最初はこんな風に正規化したい
“LINE” => “LINE”
- 英数字はギリギリまで小文字化しない
“  PRML  副 読 本  ”  => “PRML副読本”
- 日本語と英数字の間のスペースは削減する
- 全角文字は一部の記号を除いて半角にする
“Coding the Matrix”  => “Coding the Matrix”
“南アルプスの 天然水 Sparking Lemon レモン一絞り”
=> “南アルプスの天然水Sparking Lemonレモン一絞り”
番外編2 : 異表記・表記ゆれは最初に解消する
例題 :
 形態素解析辞書に「ノンフライワンタン」は登録済
みだけど「ノンフライわんたん」が未登録で「ノンフ
ライ / わんたん」に区切られる
解 :
 同義語・表記ゆれ辞書を作り、形態素解析前に、
より一般的な表記に変換しましょう
- 読み仮名付きの表記ゆれ辞書はとても大切です
- NEologd にご提供頂けますとかなり嬉しいです
【検索】index を 1 つだけ使用できる
解1 : 文字 2gram な 転置 index が良さそう
- 例 : LINEの辞書
=>「LI:1, IN:1, NE:1, Eの:1,の辞:1, 辞書:1」
- 形態素解析を使わない方が良い時がある
- 検索では文字区切りに高い再現率が必要
 
解2 : 対象データが少量なら Suffix Array も可
- 任意長の文字列で漏れ無く検索できる
- 転置 index と違う長所・短所がある
【検索】形態素 index を 1 つだけ作成
解1 : MeCab と IPA 辞書で作成すると良さそう
- MeCab は速いし、問題や罠が少ない
- UniDic は名詞を細かく区切りすぎる
- mecab-ipadic-NEologd では長すぎる
- naist-jdic は IPA 辞書より精度が下がる
- JUMAN は付与される情報を使うなら有用
解2 : 意味があるなら何個でも index を作る
- 個人的に最初は文字 2gram 、文字 3gramと
形態素 1gram の 3 つを使うことを試す
【一般】特殊なジャンルの文書を解析する
例題1. 自分の専門分野の文書を正確に解析したい
 解 : あなたがユーザ辞書を作るのが最も良さそう
- 専門分野のプロが解析結果を見ると、
沢山の解析エラーを見つけられるはず
- そのユーザ辞書を欲しがる人もいるはず
例題2. 古典・古文・近代文語文を検索する
 解 : 最初は中古和文/近代文語 UniDic を使う
- 専門分野の辞書がすでにある場合もある
【テキストマイニング】さくっと分析したい
解 : MeCab と mecab-ipadic-NEologd を使う
- 頻度集計では名詞の過分割が一番の課題
- 異表記によるノイズよりも割合が大きい
- チャンキングは多くの人にとって難しい
- Wikipedia に乗るような語は分割しなくて良い
- 現代はメモリを沢山使えるので、仕事や研究では
辞書サイズをそれほど気にする必要がない
例 :「辛そうで辛くない少し辛いラー油」の分割
- IPA辞書「辛い:3,そう:1,だ:1,ない:1,少し:1,ラー油:1」
- ipadic-NEologd「辛そうで辛くない少し辛いラー油:1」
【機械学習】テキストから特徴ベクトル作成
解 : MeCab + mecab-ipadic と MeCab + mecab-
ipadic-NEologd の結果を任意にマージ
 => 漏れを削減しつつ、固有表現で次元数を増や
したい 。必要なら文字 Ngram を足す。
200万人の佐藤さんノイズ問題 : 例「佐藤琢磨」
- mecab-ipadicのみだと「佐藤:1, 琢磨:1」
- “佐藤:1” は後で重みを正規化するけど、
日本全国の佐藤さんとつながるので辛い
- “佐藤琢磨:1” があると結果が大分変わる
まとめ
- mecab-ipadic-NEologd は IPA 辞書を拡張した
mecab のシステム辞書
- 新語・固有表現などを160万語以上再録
- 読み仮名・原型付きで(異表記の重複込み)
- 最低月2回アップデート(初旬・中旬)
- Apache License 2.0 なOSSなので安心
- 辞書はタスクに応じて使い分けると効果UP !!
- 5種類のタスク向けの選択例 + 2つの前処理をご紹介
- NEologd は特徴量作成とテキストマイニングに最適
以降は付録
Q&A
Q. 他の勉強会での発表資料は ?
- slideshare
- 2015-03-28 / R 勉強会 @ 東京
- 形態素解析器 MeCab の新語・固有表現辞
書 mecab-ipadic-NEologd のご紹介
今後も開発の進行具合に合わせて、少しづつ新し
い内容を足しながら各所で発表する予定です
Q. 採録しているエントリの収集方法は?
エントリの元になる言語資源は2種類ある
- Web上からクロールして収集した資源
- 手元で人手で作成した資源
言語資源から作成した辞書エントリは、著作権やライセンスの
観点から2種類ある
- そのまま採録しても問題がない
- そのまま採録するのは問題がある
mecab-ipadic-NEologd では
 =>「 Web 上から収集した資源」から「そのまま採録するのは
問題がある」エントリを除く様に努めている
Q. どんなエントリを採録してるの?
以下の様なエントリを採録している
- IPA辞書を使った時に
- 複数の形態素に分割されてしまう固有表現
- 分割は正しいが読み仮名を付与できない固有表現
- 開発者が必要だと考えたエントリ
逆に以下の様なエントリは積極的には採録しない
- 特殊なドメインの単語(医学・特許用語など)
- 一般性の低い固有表現(TwitterのIDなど)
今後は製品名や作品名などをとくに充実させたい
- 採録して欲しい資源をお持ちの方はご相談ください
Q. 品詞情報の決定方法は?
現在は以下の4パターン以外については、とくに精査せずに「名
詞,固有名詞,一般,*,*,*」を付与している
- 「郵便番号データ」のから得た住所を構成する文字列
- 「日本全国駅名一覧」から得た駅名を示す文字列
- 「人名(姓/名)エントリデータ」から得た文字列
- 既知の姓・名の組み合わせ
今後もかなり高精度に品詞情報を决定できる場合以外は、なる
べく単純に品詞情報を付与するつもり
- この辞書の価値は正しく品詞情報を付与することでは、まだ
無い、ので気楽にやっていきます
Q. なぜ IPADIC を拡張したの?
Web上には長単位な辞書エントリに変換しやすい言語資源が多い
既存の形態素解析辞書に対して長単位なエントリを追加する作業は、短単
位なエントリを追加する作業よりも難易度が低いと感じられた
- 人間の目視による検査は最小化したい
用言や副詞など、体言以外のエントリについて自分でも考えたかった
- 今後、人手で確実に対処したい
既知の固有表現の単語境界に関してチャンキングを不要にしたかった
- 固有表現の内部構造が必要なときは別の辞書による結果を混ぜる
固有表現の読み仮名を推定なしで取得したかった
Q. なぜ読み仮名が必要なの?
僕が取り組む課題では、形態素解析器を使って日本語の文字
列に読みを付与することが必須な場合がとても多い
- 日本語な検索キーワードのスペル訂正
- 読み仮名や読み仮名のローマ字表記が必要
読み仮名の推定は計算量が多いタスク
- 読み仮名が既知で推定が不要ならそれが最良である
固有表現に読み仮名を付与できると自然言語処理だけでなく、
音声認識・合成においても未知語の解決に貢献できる
- 未知語が原因であるエラーを削減できる
Q. 今後 UNIDIC には対応しないの?
mecab-unidic-NEologd をリリースする予定がある
- 先に mecab-ipadic-NEologd に体言以外のエントリを追加する
対応する理由
- NEologd で生成する辞書の性能や性質を評価するため
- 副作用に関する評価を中心におこないたい
追加するエントリの単位
- 短単位エントリの追加作業は個人的に利益とコストが見合わない
- 短単位以上で長単位以下のエントリを追加することになるはず
対応時期は
- 年内
Q. なぜ Apache Licence 2.0 なの?
mecab-ipadic-NEologd に関連する著作権周りの
ことに関して悩むのは僕だけで十分だから
Apache Licence 2.0な OSS をどう取り扱うべきか
は、ググれば分かるはずだから
Q. 開発の経緯は?
2014年1月、2月 :  形態素解析処理後のチャンキング処理の正解率の向上に限界を感じる
2014年3月
- NLP2014 に参加して意識が高まり、本質的な解決方法に取り組むことに
- 15年前から「未知語が辞書に登録されていない」という問題に変化が無いことに着目
- 単語境界が既知ならチャンキングせず辞書引きすれば良い、という方針を選択
2014年4月9日  : 社内で新語辞書のシードデータ生成器の試作を開始
2014年7月9日  : 社内で新語辞書パッケージ first commit
2014年7月16日  : 社内で新語辞書パッケージ を初めてアップデート
2014年8月〜2015年1月
- (他の開発作業と並行して )粛々と機能改良とパッケージの更新とバグ修正を続ける
2015年2月1日  : 社内で開発した成果物を社外に出していくことになる
2015年2月24日  : 辞書のライセンスを Apache Licence 2.0 に決定
2015年3月9日  : 社外で mecab-ipadic-NEologd を first commit
2015年3月11日  : 友人・知人に試用を依頼。動作確認と修正を繰り返す
2015年3月13日  : 社外でリリースした後の広報を開始
2015年3月14日〜19日 : 致命的なバグの修正や利便性を高める機能の追加をする
2015年3月24日 : tag / v0.0.1 をリリース
今後の発展
- tag / v0.0.2 : 副詞などの追加
- 追加のための作業に着手しました
- mecab-unidic-NEologd の生成
- 定量的な評価とその結果の発表
Q. 最新情報の集め方は?
1. Twitter で @overlast をフォロー
2. たまに #neologd を検索する
3. neologd、形態素解析器、固有表現抽
出などに対する関する不満を Twitter
上で言ってみる
参考資料
MeCab 用の新語辞書 mecab-ipadic-NEologd を公開しました
- http://diary.overlasting.net/2015-03-13-1.html
日本語のREADME
- https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md#
日本語で詳細な説明を書いたWiki
- https://github.com/neologd/mecab-ipadic-neologd/wiki#
解析前に行うことが望ましい文字列の正規化処理
- https://github.com/neologd/mecab-ipadic-neologd/wiki/Regexp.ja

More Related Content

What's hot

リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介Recruit Technologies
 
NumPyが物足りない人へのCython入門
NumPyが物足りない人へのCython入門NumPyが物足りない人へのCython入門
NumPyが物足りない人へのCython入門Shiqiao Du
 
言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyoShuyo Nakatani
 
BASE_プレゼン用サービス説明資料
BASE_プレゼン用サービス説明資料BASE_プレゼン用サービス説明資料
BASE_プレゼン用サービス説明資料Find Job Startup
 
運用してわかったLookerの本質的メリット : Data Engineering Study #8
運用してわかったLookerの本質的メリット : Data Engineering Study #8運用してわかったLookerの本質的メリット : Data Engineering Study #8
運用してわかったLookerの本質的メリット : Data Engineering Study #8Masatoshi Abe
 
研究法(Claimとは)
研究法(Claimとは)研究法(Claimとは)
研究法(Claimとは)Jun Rekimoto
 
工学系大学4年生のための論文の読み方
工学系大学4年生のための論文の読み方工学系大学4年生のための論文の読み方
工学系大学4年生のための論文の読み方ychtanaka
 
形態素解析器 MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介
形態素解析器 MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介形態素解析器 MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介
形態素解析器 MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介Toshinori Sato
 
深層学習時代の 自然言語処理ビジネス
深層学習時代の自然言語処理ビジネス深層学習時代の自然言語処理ビジネス
深層学習時代の 自然言語処理ビジネスYuya Unno
 
cvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper. challenge
 
Prophet入門【理論編】Facebookの時系列予測ツール
Prophet入門【理論編】Facebookの時系列予測ツールProphet入門【理論編】Facebookの時系列予測ツール
Prophet入門【理論編】Facebookの時系列予測ツールhoxo_m
 
異常検知と変化検知 7章方向データの異常検知
異常検知と変化検知 7章方向データの異常検知異常検知と変化検知 7章方向データの異常検知
異常検知と変化検知 7章方向データの異常検知智文 中野
 
グラフ構造のデータモデルをPower BIで可視化してみた
グラフ構造のデータモデルをPower BIで可視化してみたグラフ構造のデータモデルをPower BIで可視化してみた
グラフ構造のデータモデルをPower BIで可視化してみたCData Software Japan
 
【企画書】omiai:IVS_LAUNCH PAD用資料
【企画書】omiai:IVS_LAUNCH PAD用資料【企画書】omiai:IVS_LAUNCH PAD用資料
【企画書】omiai:IVS_LAUNCH PAD用資料Find Job Startup
 
レコメンドシステムの社会実装
レコメンドシステムの社会実装レコメンドシステムの社会実装
レコメンドシステムの社会実装西岡 賢一郎
 
落合陽一 筑波大 講演資料 10月17日
落合陽一 筑波大 講演資料 10月17日落合陽一 筑波大 講演資料 10月17日
落合陽一 筑波大 講演資料 10月17日Yoichi Ochiai
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII
 

What's hot (20)

Rの高速化
Rの高速化Rの高速化
Rの高速化
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
 
NumPyが物足りない人へのCython入門
NumPyが物足りない人へのCython入門NumPyが物足りない人へのCython入門
NumPyが物足りない人へのCython入門
 
言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo
 
BASE_プレゼン用サービス説明資料
BASE_プレゼン用サービス説明資料BASE_プレゼン用サービス説明資料
BASE_プレゼン用サービス説明資料
 
AdaFace(CVPR2022)
AdaFace(CVPR2022)AdaFace(CVPR2022)
AdaFace(CVPR2022)
 
運用してわかったLookerの本質的メリット : Data Engineering Study #8
運用してわかったLookerの本質的メリット : Data Engineering Study #8運用してわかったLookerの本質的メリット : Data Engineering Study #8
運用してわかったLookerの本質的メリット : Data Engineering Study #8
 
時系列分析入門
時系列分析入門時系列分析入門
時系列分析入門
 
研究法(Claimとは)
研究法(Claimとは)研究法(Claimとは)
研究法(Claimとは)
 
工学系大学4年生のための論文の読み方
工学系大学4年生のための論文の読み方工学系大学4年生のための論文の読み方
工学系大学4年生のための論文の読み方
 
形態素解析器 MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介
形態素解析器 MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介形態素解析器 MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介
形態素解析器 MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介
 
深層学習時代の 自然言語処理ビジネス
深層学習時代の自然言語処理ビジネス深層学習時代の自然言語処理ビジネス
深層学習時代の 自然言語処理ビジネス
 
cvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tips
 
Prophet入門【理論編】Facebookの時系列予測ツール
Prophet入門【理論編】Facebookの時系列予測ツールProphet入門【理論編】Facebookの時系列予測ツール
Prophet入門【理論編】Facebookの時系列予測ツール
 
異常検知と変化検知 7章方向データの異常検知
異常検知と変化検知 7章方向データの異常検知異常検知と変化検知 7章方向データの異常検知
異常検知と変化検知 7章方向データの異常検知
 
グラフ構造のデータモデルをPower BIで可視化してみた
グラフ構造のデータモデルをPower BIで可視化してみたグラフ構造のデータモデルをPower BIで可視化してみた
グラフ構造のデータモデルをPower BIで可視化してみた
 
【企画書】omiai:IVS_LAUNCH PAD用資料
【企画書】omiai:IVS_LAUNCH PAD用資料【企画書】omiai:IVS_LAUNCH PAD用資料
【企画書】omiai:IVS_LAUNCH PAD用資料
 
レコメンドシステムの社会実装
レコメンドシステムの社会実装レコメンドシステムの社会実装
レコメンドシステムの社会実装
 
落合陽一 筑波大 講演資料 10月17日
落合陽一 筑波大 講演資料 10月17日落合陽一 筑波大 講演資料 10月17日
落合陽一 筑波大 講演資料 10月17日
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
 

Similar to mecab-ipadic-NEologd の効果的な使い方

サポーターズ勉強会スライド 2018/2/27
サポーターズ勉強会スライド 2018/2/27サポーターズ勉強会スライド 2018/2/27
サポーターズ勉強会スライド 2018/2/27Kensuke Mitsuzawa
 
Pythonで入門するApache Spark at PyCon2016
Pythonで入門するApache Spark at PyCon2016Pythonで入門するApache Spark at PyCon2016
Pythonで入門するApache Spark at PyCon2016Tatsuya Atsumi
 
Scala Daysに行ってみて
Scala Daysに行ってみてScala Daysに行ってみて
Scala Daysに行ってみてKota Mizushima
 
Japan.r ver1.2 20171202_ota
Japan.r ver1.2 20171202_otaJapan.r ver1.2 20171202_ota
Japan.r ver1.2 20171202_ota博三 太田
 
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by  ホットリンク 公開用2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by  ホットリンク 公開用
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用Takeshi Sakaki
 
おとなのテキストマイニング
おとなのテキストマイニングおとなのテキストマイニング
おとなのテキストマイニングMunenori Sugimura
 
Eguchi web techstudy_01
Eguchi web techstudy_01Eguchi web techstudy_01
Eguchi web techstudy_01yueguchi
 
クライアントサイドjavascript簡単紹介
クライアントサイドjavascript簡単紹介クライアントサイドjavascript簡単紹介
クライアントサイドjavascript簡単紹介しくみ製作所
 
jQueryの先に行こう!最先端のWeb開発トレンドを学ぶ
jQueryの先に行こう!最先端のWeb開発トレンドを学ぶjQueryの先に行こう!最先端のWeb開発トレンドを学ぶ
jQueryの先に行こう!最先端のWeb開発トレンドを学ぶShumpei Shiraishi
 
Start!! Ruby
Start!! RubyStart!! Ruby
Start!! Rubymitim
 
Chainer with natural language processing hands on
Chainer with natural language processing hands onChainer with natural language processing hands on
Chainer with natural language processing hands onOgushi Masaya
 
Amazon DynamoDB 初心者が理解した事
Amazon DynamoDB 初心者が理解した事Amazon DynamoDB 初心者が理解した事
Amazon DynamoDB 初心者が理解した事Hirokazu Tokuno
 
2019-04-17 「不適切コンテンツ検出」の機械化と安定運用
2019-04-17 「不適切コンテンツ検出」の機械化と安定運用2019-04-17 「不適切コンテンツ検出」の機械化と安定運用
2019-04-17 「不適切コンテンツ検出」の機械化と安定運用Yasuhiko Iwase
 
fastTextの実装を見てみた
fastTextの実装を見てみたfastTextの実装を見てみた
fastTextの実装を見てみたYoshihiko Shiraki
 
new Objctive-C literal syntax
new Objctive-C literal syntaxnew Objctive-C literal syntax
new Objctive-C literal syntaxWataru Kimura
 
PerlでKyTea
PerlでKyTeaPerlでKyTea
PerlでKyTeapawa_
 

Similar to mecab-ipadic-NEologd の効果的な使い方 (20)

サポーターズ勉強会スライド 2018/2/27
サポーターズ勉強会スライド 2018/2/27サポーターズ勉強会スライド 2018/2/27
サポーターズ勉強会スライド 2018/2/27
 
Pythonで入門するApache Spark at PyCon2016
Pythonで入門するApache Spark at PyCon2016Pythonで入門するApache Spark at PyCon2016
Pythonで入門するApache Spark at PyCon2016
 
全文検索入門
全文検索入門全文検索入門
全文検索入門
 
Scala Daysに行ってみて
Scala Daysに行ってみてScala Daysに行ってみて
Scala Daysに行ってみて
 
Japan.r ver1.2 20171202_ota
Japan.r ver1.2 20171202_otaJapan.r ver1.2 20171202_ota
Japan.r ver1.2 20171202_ota
 
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by  ホットリンク 公開用2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by  ホットリンク 公開用
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用
 
TogoRecipes 120907
TogoRecipes 120907TogoRecipes 120907
TogoRecipes 120907
 
おとなのテキストマイニング
おとなのテキストマイニングおとなのテキストマイニング
おとなのテキストマイニング
 
ゆるかわPhp
ゆるかわPhpゆるかわPhp
ゆるかわPhp
 
Eguchi web techstudy_01
Eguchi web techstudy_01Eguchi web techstudy_01
Eguchi web techstudy_01
 
クライアントサイドjavascript簡単紹介
クライアントサイドjavascript簡単紹介クライアントサイドjavascript簡単紹介
クライアントサイドjavascript簡単紹介
 
jQueryの先に行こう!最先端のWeb開発トレンドを学ぶ
jQueryの先に行こう!最先端のWeb開発トレンドを学ぶjQueryの先に行こう!最先端のWeb開発トレンドを学ぶ
jQueryの先に行こう!最先端のWeb開発トレンドを学ぶ
 
Start!! Ruby
Start!! RubyStart!! Ruby
Start!! Ruby
 
Chainer with natural language processing hands on
Chainer with natural language processing hands onChainer with natural language processing hands on
Chainer with natural language processing hands on
 
Amazon DynamoDB 初心者が理解した事
Amazon DynamoDB 初心者が理解した事Amazon DynamoDB 初心者が理解した事
Amazon DynamoDB 初心者が理解した事
 
JAWSUG20171220
JAWSUG20171220JAWSUG20171220
JAWSUG20171220
 
2019-04-17 「不適切コンテンツ検出」の機械化と安定運用
2019-04-17 「不適切コンテンツ検出」の機械化と安定運用2019-04-17 「不適切コンテンツ検出」の機械化と安定運用
2019-04-17 「不適切コンテンツ検出」の機械化と安定運用
 
fastTextの実装を見てみた
fastTextの実装を見てみたfastTextの実装を見てみた
fastTextの実装を見てみた
 
new Objctive-C literal syntax
new Objctive-C literal syntaxnew Objctive-C literal syntax
new Objctive-C literal syntax
 
PerlでKyTea
PerlでKyTeaPerlでKyTea
PerlでKyTea
 

Recently uploaded

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 

Recently uploaded (9)

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 

mecab-ipadic-NEologd の効果的な使い方