CakePHP + Twitter API + MeCab = ご当地ロボ

2010/06/17 木曜日 17:35 投稿者 zon

以前書いた記事2つのつづきで Twitter Bot を作った話。
Xrea + CakePHP + MeCab で日本語形態素解析
CakePHP + OAuth + Twitter API で Bot を作る

上記のことがクリアできれば、あとは自分の好みの Bot を作るだけ。という状態。

今回作ったのが、ご当地ロボ (gotohchi) on Twitter

ご当地ロボのツイートまでの流れ

ツイートは下記のような処理で行っている。
処理のトリガーは、Cron を使用している。

1.API を利用して ご当地ロボ (gotohchi) on Twitter がフォローしているご当地キャラの直近のツイート(20件)を取得。

2.取得したツイートから不要なキーワードを抽出削除。(@**** とか RT の単語など)

3.整形した文を MeCab で形態素解析。

4.形態素解析の結果から参照テーブルを作成し、マルコフ連鎖で要約する。
※参照
分かち書きとマルコフ連鎖でカオスな文章を生成するまで | oitake blog

5.Twitter API を利用して要約した文章を ご当地ロボ (gotohchi) on Twitter へツイート。

という流れ。

ご当地ロボのツイート何点か

記念すべき最初のツイート

Twitter / ご当地ロボ: チェックしてくれました
あんまり面白くないけど、自然なツイートなので上々のスタート。

思わず噴いたツイート

Twitter / ご当地ロボ: 今のどしゃぶりの鐘くんが1時の様な気持ちでフォトショ強制終了
こういうカオスな文章を待ってた。

Twitter / ご当地ロボ: 三女はサイパンじゃないんね
噴いたってほどではないけど、じわじわきた。

お気に入りツイート

気が向いたらお気に入りに追加していくつもり。
Twitter / gotohchi’s Favorites

メモ

以前書いた記事では、Xrea が セーフモードのため CGI モードで動かす必要があると書いた。
それでもいいが、テスト中にエラーが出たので形態素解析は Cron から直接シェルコマンドで動かすことにした。
※エラーの内容はプロセスが残っているので MeCab のコマンドが実行できないといったような内容だった。エラーメッセージが手元に残ってないのでその辺はあいまい。
 現在は CGI モードでも動くが、念のため CGI モードで動かすことはやめた。

流れ的には下記の用になる。
1.PHP でフォローのツイートを取得、ファイルに保存。
2.シェルコマンドでツイートのファイルを読み込み日本語態素解析、ファイルに保存。
3.PHP で形態素解析したファイルを読み込み、マルコフ連鎖で要約し、ツイート。

今後

ご当地ロボがかわいくなってきたので、アイコンは用意してあげたいなー。とか。

他にもロボ作ってみようかなー。とか。新しく作ったら Twitter Bot-zontheworld Labs に追加していく予定。

トラックバック一覧

この記事にはトラックバックがついていません。

コメント一覧

この記事にはコメントがついていません。

RSS feed for comments on this post.

コメント投稿

Sorry, the comment form is closed at this time.