以前書いた記事2つのつづきで Twitter Bot を作った話。
Xrea + CakePHP + MeCab で日本語形態素解析
CakePHP + OAuth + Twitter API で Bot を作る
上記のことがクリアできれば、あとは自分の好みの Bot を作るだけ。という状態。
今回作ったのが、ご当地ロボ (gotohchi) on Twitter。
ご当地ロボのツイートまでの流れ
ツイートは下記のような処理で行っている。
処理のトリガーは、Cron を使用している。
1.API を利用して ご当地ロボ (gotohchi) on Twitter がフォローしているご当地キャラの直近のツイート(20件)を取得。
2.取得したツイートから不要なキーワードを抽出削除。(@**** とか RT の単語など)
3.整形した文を MeCab で形態素解析。
4.形態素解析の結果から参照テーブルを作成し、マルコフ連鎖で要約する。
※参照
分かち書きとマルコフ連鎖でカオスな文章を生成するまで | oitake blog
5.Twitter API を利用して要約した文章を ご当地ロボ (gotohchi) on Twitter へツイート。
という流れ。
ご当地ロボのツイート何点か
記念すべき最初のツイート
Twitter / ご当地ロボ: チェックしてくれました
あんまり面白くないけど、自然なツイートなので上々のスタート。
思わず噴いたツイート
Twitter / ご当地ロボ: 今のどしゃぶりの鐘くんが1時の様な気持ちでフォトショ強制終了
こういうカオスな文章を待ってた。
Twitter / ご当地ロボ: 三女はサイパンじゃないんね
噴いたってほどではないけど、じわじわきた。
お気に入りツイート
気が向いたらお気に入りに追加していくつもり。
Twitter / gotohchi’s Favorites
メモ
以前書いた記事では、Xrea が セーフモードのため CGI モードで動かす必要があると書いた。
それでもいいが、テスト中にエラーが出たので形態素解析は Cron から直接シェルコマンドで動かすことにした。
※エラーの内容はプロセスが残っているので MeCab のコマンドが実行できないといったような内容だった。エラーメッセージが手元に残ってないのでその辺はあいまい。
現在は CGI モードでも動くが、念のため CGI モードで動かすことはやめた。
流れ的には下記の用になる。
1.PHP でフォローのツイートを取得、ファイルに保存。
2.シェルコマンドでツイートのファイルを読み込み日本語態素解析、ファイルに保存。
3.PHP で形態素解析したファイルを読み込み、マルコフ連鎖で要約し、ツイート。
今後
ご当地ロボがかわいくなってきたので、アイコンは用意してあげたいなー。とか。
他にもロボ作ってみようかなー。とか。新しく作ったら Twitter Bot-zontheworld Labs に追加していく予定。
トラックバック一覧
この記事にはトラックバックがついていません。