SlideShare a Scribd company logo
1 of 20
Download to read offline
あんちべの
 すべらない話
~俺のツイートがこんなにウケないはずがない~
目的
twitter
 渾身のネタが
スルーされたり
何気ない呟きが
めっちゃウケたり
滑ったときの
恥ずかしさ
マジパネェ
tweetする前に
ウケルかどうか
予測できれば!
それ、Rなら
簡単ですよ!
発表の目的

Rで自分のtweetが
 ウケるかどうか
 予測をしよう!
自己紹介
●   ID:AntiBayesian
●   あんちべ!とお呼び下さい

●   専門:テキストマイニング、自然言語処理
●   職業:某ATMが○○な銀行で金融工学研究員とか
    いう胡散臭い素敵なことしてる
●   自然言語処理職大絶賛募集中!!!!
●   math.empress@gmail.com
なんで急にLTすることに???


↑今日の0時くらいの話です
分析手順
1.訓練データ(正例、負例)を用意する
2.訓練データから予測モデルを立てる
3.自分のtweetを予測モデルに放り込んで判定
訓練データを集めよう
●   正例:favstarから人気tweetを取得
●   負例:twitter Streaming APIから適当にサンプリン
    グ
●   6月中のtweetを各々約1500件ずつチョイス
●   正例にはfav、負例にはnonタグを付ける
※Tweetを取得するツール作ったよ!
http://d.hatena.ne.jp/AntiBayesian/20110702
さくさくツイートマイニング


こんな感じ→
訓練データの加工
               ttmの紹介
●   TinyTextMiner
●   テキストを形態素解析に掛け、さらに分析ツールに
    投げやすいよう整形してくれるフリーソフト
●   ここからDL http://mtmr.jp/ttm/
※MeCabもインストールしてね
加工済みデータ


●   1行目が各単語。2行目以降は、各文章から表頭
    の単語が何回出現したか
●   右端のTAG列がクラス。fav=正例、non=負
    例、test=検証するtweet。
●   要するに、testテキストがfav、nonどちらに分類さ
    れるか知りたい
予測モデルを立てよう
●   RandomForestを使おう!
●   精度高いし汚いデータにも強い!Googleも利用!
●  詳細は下記ブログを参考に
http://d.hatena.ne.jp/hamadakoichi/20110130/
Rのコード
twit <- read.csv(file="twit.csv")
library(randomForest)
train.data <- twit[1:2877,]#訓練データが2877ある
test.data <- twit[2878:2911,]#テストデータは33
rf.model <- randomForest(TAG~., data=train.data,
na.a="na.omit", ntree=10)
精度はどう???
rf.predict <- predict(rf.model, train.data)
(result <- table(train.data$TAG, rf.predict))
● 緑色のセル=正しく分類
● 行:予測


● 列:実際


2*result[2,2] / (2*result[2,2]+result[1,2]+result[2,1])
●   F値:0.9019064
※訓練データで高精度は当たり前。ただの目安
学習結果
rf.predict <- predict(rf.model, test.data)




●   2878行目のデータはfav、2879行目はnonと予測
●   favと予測されたtweetはウケルのでは???
まとめ
●   人気tweetを収集し、人気tweetを判別するモデル
    を作る
●   自分のtweetをモデルで評価して、ウケル内容だ
    けtweetする
●   これで広瀬香美や孫正義を超える人気ついっ
    たったーになれる!

More Related Content

Similar to あんちべのすべらない話~俺のツイートがこんなにウケないはずがない~

teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhook
teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhookteratailで秒速回答を目指す - GoogleAppsScript + SlackWebhook
teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhookShohei Tai
 
Uec.R#3 YjdnJlpを使ってみた
Uec.R#3 YjdnJlpを使ってみたUec.R#3 YjdnJlpを使ってみた
Uec.R#3 YjdnJlpを使ってみたAtsushi Hayakawa
 
はじめてのテスト技法
はじめてのテスト技法はじめてのテスト技法
はじめてのテスト技法Tatsuya Saito
 
Kpt×ナース(公開版)
Kpt×ナース(公開版)Kpt×ナース(公開版)
Kpt×ナース(公開版)Noriyuki Nemoto
 
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処” WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処” Hajime Sasaki
 
情シスオフ 2nd Lt 20090620
情シスオフ 2nd Lt 20090620情シスオフ 2nd Lt 20090620
情シスオフ 2nd Lt 20090620atsuizo
 

Similar to あんちべのすべらない話~俺のツイートがこんなにウケないはずがない~ (8)

teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhook
teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhookteratailで秒速回答を目指す - GoogleAppsScript + SlackWebhook
teratailで秒速回答を目指す - GoogleAppsScript + SlackWebhook
 
Uec.R#3 YjdnJlpを使ってみた
Uec.R#3 YjdnJlpを使ってみたUec.R#3 YjdnJlpを使ってみた
Uec.R#3 YjdnJlpを使ってみた
 
はじめてのテスト技法
はじめてのテスト技法はじめてのテスト技法
はじめてのテスト技法
 
Frequency with nltk
Frequency with nltkFrequency with nltk
Frequency with nltk
 
Kpt×ナース(公開版)
Kpt×ナース(公開版)Kpt×ナース(公開版)
Kpt×ナース(公開版)
 
Machine Learning Fundamentals IEEE
Machine Learning Fundamentals IEEEMachine Learning Fundamentals IEEE
Machine Learning Fundamentals IEEE
 
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処” WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
 
情シスオフ 2nd Lt 20090620
情シスオフ 2nd Lt 20090620情シスオフ 2nd Lt 20090620
情シスオフ 2nd Lt 20090620
 

More from antibayesian 俺がS式だ

More from antibayesian 俺がS式だ (9)

企業における統計学入門
企業における統計学入門企業における統計学入門
企業における統計学入門
 
SPSSで簡単テキストマイニング
SPSSで簡単テキストマイニングSPSSで簡単テキストマイニング
SPSSで簡単テキストマイニング
 
ガチャとは心の所作
ガチャとは心の所作ガチャとは心の所作
ガチャとは心の所作
 
チームラボ忘年会
チームラボ忘年会チームラボ忘年会
チームラボ忘年会
 
テキストマイニングのイメージと実際
テキストマイニングのイメージと実際テキストマイニングのイメージと実際
テキストマイニングのイメージと実際
 
さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッションさくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッション
 
神の言語による自然言語処理
神の言語による自然言語処理神の言語による自然言語処理
神の言語による自然言語処理
 
Pythonで簡単ネットワーク分析
Pythonで簡単ネットワーク分析Pythonで簡単ネットワーク分析
Pythonで簡単ネットワーク分析
 
第三回さくさくテキストマイニング勉強会 入門セッション
第三回さくさくテキストマイニング勉強会 入門セッション第三回さくさくテキストマイニング勉強会 入門セッション
第三回さくさくテキストマイニング勉強会 入門セッション
 

Recently uploaded

[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 

Recently uploaded (10)

[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 

あんちべのすべらない話~俺のツイートがこんなにウケないはずがない~