Submit Search
Upload
小町のレス数が予測できるか試してみた
•
Download as ODP, PDF
•
0 likes
•
10,616 views
J
JubatusOfficial
Follow
小町のレス数が予測できるか試してみた
Read less
Read more
Engineering
Report
Share
Report
Share
1 of 10
Download now
Recommended
単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)
JubatusOfficial
jubabanditの紹介
jubabanditの紹介
JubatusOfficial
JubaQLご紹介
JubaQLご紹介
JubatusOfficial
"アレ"からJubatusを使う
"アレ"からJubatusを使う
JubatusOfficial
捗るリコメンドシステムの裏事情(ハッカドール)
捗るリコメンドシステムの裏事情(ハッカドール)
mosa siru
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
JubatusOfficial
超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)
超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)
mametter
TranslimitにおけるAWS活用術
TranslimitにおけるAWS活用術
Masakazu Matsushita
Recommended
単語コレクター(文章自動校正器)
単語コレクター(文章自動校正器)
JubatusOfficial
jubabanditの紹介
jubabanditの紹介
JubatusOfficial
JubaQLご紹介
JubaQLご紹介
JubatusOfficial
"アレ"からJubatusを使う
"アレ"からJubatusを使う
JubatusOfficial
捗るリコメンドシステムの裏事情(ハッカドール)
捗るリコメンドシステムの裏事情(ハッカドール)
mosa siru
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
データ圧縮アルゴリズムを用いたマルウェア感染通信ログの判定
JubatusOfficial
超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)
超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)
mametter
TranslimitにおけるAWS活用術
TranslimitにおけるAWS活用術
Masakazu Matsushita
PythonによるWebスクレイピング入門
PythonによるWebスクレイピング入門
Hironori Sekine
Brain Dots at dots. - Brain Dotsのアーキテクチャ -
Brain Dots at dots. - Brain Dotsのアーキテクチャ -
Masakazu Matsushita
MySQL Casual Talks Vol.4 「MySQL-5.6で始める全文検索 〜InnoDB FTS編〜」
MySQL Casual Talks Vol.4 「MySQL-5.6で始める全文検索 〜InnoDB FTS編〜」
Kentaro Yoshida
資料
資料
Bob_Mk2
10分でわかるPythonの開発環境
10分でわかるPythonの開発環境
Hisao Soyama
1000万DL突破!BrainWarsのアーキテクチャ
1000万DL突破!BrainWarsのアーキテクチャ
Masakazu Matsushita
Sphinxを用いたBiopythonチュートリアル翻訳
Sphinxを用いたBiopythonチュートリアル翻訳
Kozo Nishida
(Pythonで作って学ぶ) Youtube の動画リストを作るアプリの開発 第4回
(Pythonで作って学ぶ) Youtube の動画リストを作るアプリの開発 第4回
Project Samurai
T4使ってみた
T4使ってみた
Ryota Murohoshi
OSS についてあれこれ
OSS についてあれこれ
Takuto Wada
テスト用ライブラリ power-assert
テスト用ライブラリ power-assert
Takuto Wada
Chainerで学ぶdeep learning
Chainerで学ぶdeep learning
Retrieva inc.
IPython notebookを使おう
IPython notebookを使おう
Kazufumi Ohkawa
scikit-learnを用いた機械学習チュートリアル
scikit-learnを用いた機械学習チュートリアル
敦志 金谷
【Hpcstudy】みんな、ベンチマークどうやってるの?
【Hpcstudy】みんな、ベンチマークどうやってるの?
Seiichiro Ishida
NSHashTableでDelegatesパターン
NSHashTableでDelegatesパターン
Masaki Oshikawa
Python と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめる
Shuhei Iitsuka
UnityでのLINQ活用例
UnityでのLINQ活用例
Ryota Murohoshi
Django learning Part2
Django learning Part2
Yusuke Muraoka
PHPカンファレンス2013 今ドキのPHPの書き方 ~PHP逆引きレシピ改訂版~
PHPカンファレンス2013 今ドキのPHPの書き方 ~PHP逆引きレシピ改訂版~
Yuta Sakurai
かまってちゃん小町
かまってちゃん小町
JubatusOfficial
新機能紹介 1.0.6
新機能紹介 1.0.6
JubatusOfficial
More Related Content
What's hot
PythonによるWebスクレイピング入門
PythonによるWebスクレイピング入門
Hironori Sekine
Brain Dots at dots. - Brain Dotsのアーキテクチャ -
Brain Dots at dots. - Brain Dotsのアーキテクチャ -
Masakazu Matsushita
MySQL Casual Talks Vol.4 「MySQL-5.6で始める全文検索 〜InnoDB FTS編〜」
MySQL Casual Talks Vol.4 「MySQL-5.6で始める全文検索 〜InnoDB FTS編〜」
Kentaro Yoshida
資料
資料
Bob_Mk2
10分でわかるPythonの開発環境
10分でわかるPythonの開発環境
Hisao Soyama
1000万DL突破!BrainWarsのアーキテクチャ
1000万DL突破!BrainWarsのアーキテクチャ
Masakazu Matsushita
Sphinxを用いたBiopythonチュートリアル翻訳
Sphinxを用いたBiopythonチュートリアル翻訳
Kozo Nishida
(Pythonで作って学ぶ) Youtube の動画リストを作るアプリの開発 第4回
(Pythonで作って学ぶ) Youtube の動画リストを作るアプリの開発 第4回
Project Samurai
T4使ってみた
T4使ってみた
Ryota Murohoshi
OSS についてあれこれ
OSS についてあれこれ
Takuto Wada
テスト用ライブラリ power-assert
テスト用ライブラリ power-assert
Takuto Wada
Chainerで学ぶdeep learning
Chainerで学ぶdeep learning
Retrieva inc.
IPython notebookを使おう
IPython notebookを使おう
Kazufumi Ohkawa
scikit-learnを用いた機械学習チュートリアル
scikit-learnを用いた機械学習チュートリアル
敦志 金谷
【Hpcstudy】みんな、ベンチマークどうやってるの?
【Hpcstudy】みんな、ベンチマークどうやってるの?
Seiichiro Ishida
NSHashTableでDelegatesパターン
NSHashTableでDelegatesパターン
Masaki Oshikawa
Python と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめる
Shuhei Iitsuka
UnityでのLINQ活用例
UnityでのLINQ活用例
Ryota Murohoshi
Django learning Part2
Django learning Part2
Yusuke Muraoka
PHPカンファレンス2013 今ドキのPHPの書き方 ~PHP逆引きレシピ改訂版~
PHPカンファレンス2013 今ドキのPHPの書き方 ~PHP逆引きレシピ改訂版~
Yuta Sakurai
What's hot
(20)
PythonによるWebスクレイピング入門
PythonによるWebスクレイピング入門
Brain Dots at dots. - Brain Dotsのアーキテクチャ -
Brain Dots at dots. - Brain Dotsのアーキテクチャ -
MySQL Casual Talks Vol.4 「MySQL-5.6で始める全文検索 〜InnoDB FTS編〜」
MySQL Casual Talks Vol.4 「MySQL-5.6で始める全文検索 〜InnoDB FTS編〜」
資料
資料
10分でわかるPythonの開発環境
10分でわかるPythonの開発環境
1000万DL突破!BrainWarsのアーキテクチャ
1000万DL突破!BrainWarsのアーキテクチャ
Sphinxを用いたBiopythonチュートリアル翻訳
Sphinxを用いたBiopythonチュートリアル翻訳
(Pythonで作って学ぶ) Youtube の動画リストを作るアプリの開発 第4回
(Pythonで作って学ぶ) Youtube の動画リストを作るアプリの開発 第4回
T4使ってみた
T4使ってみた
OSS についてあれこれ
OSS についてあれこれ
テスト用ライブラリ power-assert
テスト用ライブラリ power-assert
Chainerで学ぶdeep learning
Chainerで学ぶdeep learning
IPython notebookを使おう
IPython notebookを使おう
scikit-learnを用いた機械学習チュートリアル
scikit-learnを用いた機械学習チュートリアル
【Hpcstudy】みんな、ベンチマークどうやってるの?
【Hpcstudy】みんな、ベンチマークどうやってるの?
NSHashTableでDelegatesパターン
NSHashTableでDelegatesパターン
Python と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめる
UnityでのLINQ活用例
UnityでのLINQ活用例
Django learning Part2
Django learning Part2
PHPカンファレンス2013 今ドキのPHPの書き方 ~PHP逆引きレシピ改訂版~
PHPカンファレンス2013 今ドキのPHPの書き方 ~PHP逆引きレシピ改訂版~
Viewers also liked
かまってちゃん小町
かまってちゃん小町
JubatusOfficial
新機能紹介 1.0.6
新機能紹介 1.0.6
JubatusOfficial
Jubatus 1.0 の紹介
Jubatus 1.0 の紹介
JubatusOfficial
新聞から今年の漢字を予測する
新聞から今年の漢字を予測する
JubatusOfficial
発言小町からのプロファイリング
発言小町からのプロファイリング
JubatusOfficial
Jubakitの解説
Jubakitの解説
JubatusOfficial
Jubatus解説本の紹介
Jubatus解説本の紹介
JubatusOfficial
Python 特徴抽出プラグイン
Python 特徴抽出プラグイン
JubatusOfficial
JUBARHYME
JUBARHYME
JubatusOfficial
銀座のママ
銀座のママ
JubatusOfficial
小町の溜息
小町の溜息
JubatusOfficial
地域の魅力を伝えるツアーガイドAI
地域の魅力を伝えるツアーガイドAI
JubatusOfficial
gRPCをちょこっと調べた話
gRPCをちょこっと調べた話
Shuzo Kashihara
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
JubatusOfficial
FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」
Shohei Hido
Jubatusハンズオン 機械学習はじめてみた
Jubatusハンズオン 機械学習はじめてみた
JubatusOfficial
もくもく成果 IMAMASU
もくもく成果 IMAMASU
JubatusOfficial
もくもくしたこと
もくもくしたこと
k_oi
Jubaanomalyについて
Jubaanomalyについて
JubatusOfficial
jubarecommenderの紹介
jubarecommenderの紹介
JubatusOfficial
Viewers also liked
(20)
かまってちゃん小町
かまってちゃん小町
新機能紹介 1.0.6
新機能紹介 1.0.6
Jubatus 1.0 の紹介
Jubatus 1.0 の紹介
新聞から今年の漢字を予測する
新聞から今年の漢字を予測する
発言小町からのプロファイリング
発言小町からのプロファイリング
Jubakitの解説
Jubakitの解説
Jubatus解説本の紹介
Jubatus解説本の紹介
Python 特徴抽出プラグイン
Python 特徴抽出プラグイン
JUBARHYME
JUBARHYME
銀座のママ
銀座のママ
小町の溜息
小町の溜息
地域の魅力を伝えるツアーガイドAI
地域の魅力を伝えるツアーガイドAI
gRPCをちょこっと調べた話
gRPCをちょこっと調べた話
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」
Jubatusハンズオン 機械学習はじめてみた
Jubatusハンズオン 機械学習はじめてみた
もくもく成果 IMAMASU
もくもく成果 IMAMASU
もくもくしたこと
もくもくしたこと
Jubaanomalyについて
Jubaanomalyについて
jubarecommenderの紹介
jubarecommenderの紹介
Similar to 小町のレス数が予測できるか試してみた
Nds#24 単体テスト
Nds#24 単体テスト
Kazumune Katagiri
XP movement In Japan
XP movement In Japan
Kenji Hiranabe
詳解!自動結合テスト #jasst
詳解!自動結合テスト #jasst
kyon mm
Spock's world
Spock's world
Takuma Watabiki
ユニットテスト 1日目
ユニットテスト 1日目
Yoshiki Shibukawa
C# から java へのプログラム移植で体験したtddの効果は?
C# から java へのプログラム移植で体験したtddの効果は?
Shinichi Hirauchi
20110519 okuyama tokyo_linuxstudy
20110519 okuyama tokyo_linuxstudy
Takahiro Iwase
Proxy War
Proxy War
zaki4649
Yuka
Yuka
show you
今日から始める Go言語 と appengine
今日から始める Go言語 と appengine
a know
GCSアジャイル開発を使ったゲームの作り方
GCSアジャイル開発を使ったゲームの作り方
Hiroyuki Tanaka
A Deep Reinforcement Learning Chatbot
A Deep Reinforcement Learning Chatbot
Takahiro Yoshinaga
JavaScript非同期処理 入門
JavaScript非同期処理 入門
Ishibashi Ryosuke
Programming camp 2010 debug hacks
Programming camp 2010 debug hacks
Hiro Yoshioka
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
infinite_loop
Ruby でつくる型付き Ruby
Ruby でつくる型付き Ruby
mametter
つぶLT20121215
つぶLT20121215
遼一 杉浦
Casper導入資料
Casper導入資料
Yuuki Tan-nai
Extract and edit
Extract and edit
禎晃 山崎
20120721_ishkawa
20120721_ishkawa
Yosuke Ishikawa
Similar to 小町のレス数が予測できるか試してみた
(20)
Nds#24 単体テスト
Nds#24 単体テスト
XP movement In Japan
XP movement In Japan
詳解!自動結合テスト #jasst
詳解!自動結合テスト #jasst
Spock's world
Spock's world
ユニットテスト 1日目
ユニットテスト 1日目
C# から java へのプログラム移植で体験したtddの効果は?
C# から java へのプログラム移植で体験したtddの効果は?
20110519 okuyama tokyo_linuxstudy
20110519 okuyama tokyo_linuxstudy
Proxy War
Proxy War
Yuka
Yuka
今日から始める Go言語 と appengine
今日から始める Go言語 と appengine
GCSアジャイル開発を使ったゲームの作り方
GCSアジャイル開発を使ったゲームの作り方
A Deep Reinforcement Learning Chatbot
A Deep Reinforcement Learning Chatbot
JavaScript非同期処理 入門
JavaScript非同期処理 入門
Programming camp 2010 debug hacks
Programming camp 2010 debug hacks
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
Ruby でつくる型付き Ruby
Ruby でつくる型付き Ruby
つぶLT20121215
つぶLT20121215
Casper導入資料
Casper導入資料
Extract and edit
Extract and edit
20120721_ishkawa
20120721_ishkawa
More from JubatusOfficial
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
JubatusOfficial
Jubakitの紹介
Jubakitの紹介
JubatusOfficial
Jubatus 新機能ハイライト
Jubatus 新機能ハイライト
JubatusOfficial
Jubatusでuserとbrandのレコメンドを試してみた話
Jubatusでuserとbrandのレコメンドを試してみた話
JubatusOfficial
相撲
相撲
JubatusOfficial
興味ありそうなもの検索
興味ありそうなもの検索
JubatusOfficial
チーム:大杉さんの壮大な夢
チーム:大杉さんの壮大な夢
JubatusOfficial
Jubatus使ってみた 作ってみたJubatus
Jubatus使ってみた 作ってみたJubatus
JubatusOfficial
More from JubatusOfficial
(8)
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
Jubakitの紹介
Jubakitの紹介
Jubatus 新機能ハイライト
Jubatus 新機能ハイライト
Jubatusでuserとbrandのレコメンドを試してみた話
Jubatusでuserとbrandのレコメンドを試してみた話
相撲
相撲
興味ありそうなもの検索
興味ありそうなもの検索
チーム:大杉さんの壮大な夢
チーム:大杉さんの壮大な夢
Jubatus使ってみた 作ってみたJubatus
Jubatus使ってみた 作ってみたJubatus
小町のレス数が予測できるか試してみた
1.
発言小町のレス数は予測できるか 試してみた Team 朝寝坊
2.
レス数? ● 発言に対する返信の数
3.
これができると? ● レスがもらいやすい文章かどうかをチェックできるサービ ス – (炎上回避の側面も?) ● ●
盛り上がる文章の特徴認の確認 – 単語? – 文体?
4.
どうやって? ● 対象:発言小町の全データ (all.json) –
特徴量候補 ● タイトル ● 発言者名 ● 本文 ● アイコン ● ● 分析 – JubatusのRegressionを利用 ● サーバー建てるのを面倒だったのでembeddedを利用
5.
結果1 ● 未加工で投入→今ひとつ 予 測 正解
6.
試行錯誤の始まり ● 追加した特徴量 – 品詞によるフィルタ(MeCabを使用) –
品詞の出現頻度 – 係り受け情報 (CaboCha:https://taku910.github.io/cabocha/ を使用) – ● 収束してない?10回繰り返し学習
7.
結果2 ● 結果1とあまり変わらず 予 測 正解
8.
他考えたこと ● その時のテーマみたいなものがあるか? – →直近(2016/9・10)の最レスポンス数トピックを見るとそうでもない ●
「新築の家に2人の子供がいる友達が子連れで来ます」 ● ● 近傍探索を用いて、レスがつきやすいテーマがあるかの調査 – →そもそも近傍のトピックとテーマに関連性が見えなかった ● (↑のトピックスの近傍トピック) ● 【PR】あなたのイチオシ紅葉スポット、オススメの楽しみ方を教えてくださ い! (レス24件) ● 結婚前提なのに忙しいと会って貰えません。 (レス223件) ● 女一人旅の楽しみ方を教えてください (レス56件) ● 文系博士の民間就職と研究の継続 (レス59件) ● ペットの葬儀とお悔やみのメッセージ (レス15件) ● 発表者寝坊のためここまで!
9.
現状の結論 ● 現時点でレス数を決定づける要素は文中に見つけられませ んでした ● ● 仮説1:結局どれだけ露出されるか次第で決まる –
Twitter等でURLの言及量を特徴量として使う ● 仮説2:文としては問題がないが全体的な構成で決まる – 文の関連情報(文と文の関連性)
10.
おまけ ● 投票数も同様にやってみました(画像は「びっくり」のも の)
Download now