CakePHP + Twitter API + MeCab = ご当地ロボ

2010/06/17 木曜日 17:35 投稿者 zon

以前書いた記事2つのつづきで Twitter Bot を作った話。
Xrea + CakePHP + MeCab で日本語形態素解析
CakePHP + OAuth + Twitter API で Bot を作る

上記のことがクリアできれば、あとは自分の好みの Bot を作るだけ。という状態。

今回作ったのが、ご当地ロボ (gotohchi) on Twitter

ご当地ロボのツイートまでの流れ

ツイートは下記のような処理で行っている。
処理のトリガーは、Cron を使用している。

1.API を利用して ご当地ロボ (gotohchi) on Twitter がフォローしているご当地キャラの直近のツイート(20件)を取得。

2.取得したツイートから不要なキーワードを抽出削除。(@**** とか RT の単語など)

3.整形した文を MeCab で形態素解析。

4.形態素解析の結果から参照テーブルを作成し、マルコフ連鎖で要約する。
※参照
分かち書きとマルコフ連鎖でカオスな文章を生成するまで | oitake blog

5.Twitter API を利用して要約した文章を ご当地ロボ (gotohchi) on Twitter へツイート。

という流れ。

ご当地ロボのツイート何点か

記念すべき最初のツイート

Twitter / ご当地ロボ: チェックしてくれました
あんまり面白くないけど、自然なツイートなので上々のスタート。

思わず噴いたツイート

Twitter / ご当地ロボ: 今のどしゃぶりの鐘くんが1時の様な気持ちでフォトショ強制終了
こういうカオスな文章を待ってた。

Twitter / ご当地ロボ: 三女はサイパンじゃないんね
噴いたってほどではないけど、じわじわきた。

お気に入りツイート

気が向いたらお気に入りに追加していくつもり。
Twitter / gotohchi’s Favorites

メモ

以前書いた記事では、Xrea が セーフモードのため CGI モードで動かす必要があると書いた。
それでもいいが、テスト中にエラーが出たので形態素解析は Cron から直接シェルコマンドで動かすことにした。
※エラーの内容はプロセスが残っているので MeCab のコマンドが実行できないといったような内容だった。エラーメッセージが手元に残ってないのでその辺はあいまい。
 現在は CGI モードでも動くが、念のため CGI モードで動かすことはやめた。

流れ的には下記の用になる。
1.PHP でフォローのツイートを取得、ファイルに保存。
2.シェルコマンドでツイートのファイルを読み込み日本語態素解析、ファイルに保存。
3.PHP で形態素解析したファイルを読み込み、マルコフ連鎖で要約し、ツイート。

今後

ご当地ロボがかわいくなってきたので、アイコンは用意してあげたいなー。とか。

他にもロボ作ってみようかなー。とか。新しく作ったら Twitter Bot-zontheworld Labs に追加していく予定。

この記事のトラックバックURL

トラックバック一覧

この記事にはトラックバックがついていません。

コメント一覧

この記事にはコメントがついていません。

RSS feed for comments on this post.

コメント投稿

:b-ok: :b-ng: :b-heart: :b-heartbreak: :b-note: :b-idea: :b-!: :b-?: :b-sleep: :b-up: :b-down: :b-run: :b-tear: :b-sweat: :b-cat: :b-star: :b-glitter: :b-silent: :b-anger: :b-black: :b-neutral: :b-weep: :b-cry: :b-grin: :b-shock: :b-shy: :b-smile: :b-angry: :b-redangry: :b-depress: :b-glad: :b-relieve: :b-surprised: :b-tired: :b-fascinated: :b-oops: :b-amazed: :b-absent: :b-happy: :b-discouraged:

zontheworld
うまい焼肉が喰いたい。
HTML convert time: 0.342 sec. ( Login )