以前書いた記事2つのつづきで Twitter Bot を作った話。
Xrea + CakePHP + MeCab で日本語形態素解析
CakePHP + OAuth + Twitter API で Bot を作る
上記のことがクリアできれば、あとは自分の好みの Bot を作るだけ。という状態。
今回作ったのが、ご当地ロボ (gotohchi) on Twitter。
以前書いた記事2つのつづきで Twitter Bot を作った話。
Xrea + CakePHP + MeCab で日本語形態素解析
CakePHP + OAuth + Twitter API で Bot を作る
上記のことがクリアできれば、あとは自分の好みの Bot を作るだけ。という状態。
今回作ったのが、ご当地ロボ (gotohchi) on Twitter。
PHP で日本語形態素解析が使いたい。
Yahoo!デベロッパーネットワーク – テキスト解析 – 日本語形態素解析 は手軽に使えそうだけど登録しないと使えないというのが好みじゃない。
MeCab と chasen は、Xrea で使えた実績があるらしいことがわかって、そっちを使うことにする。
MeCab を使うだけなら、CakePHP を使う必要はないが、元文章は RSSなどの XML または、XHTML から自動的に取得 → マルコフ連鎖でカオスな文章を生成 → つぶやく。という圧縮新聞みたいなのを作ってみたいと思った。
XML または XHTML の取得、蓄積は CakePHP で過去に作ったことがあるので、それを流用することにするのが CakePHP を使う理由。
1.指定ファイルの文字コードを一括で変換する。
2.指定ファイル内の文字列を一括置換。
例)あるディレクトリ配下の HTML ファイルを Shift-JIS から UTF-8 に変換し、HTML 内のcharset を shift_jis から UTF-8 に一括で置換する。
1度にまとめてやるのは難しそうなので、文字コード変換と文字列置換とを2回に分けておこなう。
ファイルサーバを立てた後に、少しでも楽に運用するためにしたことメモ。
基本的に、どのような環境で、どのような人が、どんな使い方をしているかは以下。
VALUE DOMAIN でダイナミックDNSを利用するための更新スクリプト。
DiCE DynamicDNS Client (自宅でインターネットサーバー) などのDNS更新ツールを使えばいい話だけど、Linux にインストールする方法や使い方を覚えるよりも、シェルスクリプト + Cron で自作したほうが早そうだったので自作した。
以前、Xrea SSHホスト登録に シェルスクリプト + Cron で自作したのでそのとき参考にしたものを元に改造することにする。
SSHホスト登録用のスクリプトは下記を参考にした。
xrea(coreserver) SSHホスト登録スクリプト – Kerosoft : Modus Operandi
$ msgunfmt ja.mo -o js.po
mo ファイルでローカライズされている場合、メッセージの原文を知りたかったり、文字コードを変換したいが po ファイルがなくて困ったときなど、必要なケースは多そうだけど、調べてみたら意外となかなか見つからなかったのでメモ。
ちなみに、po や mo ファイルのことを、メッセージカタログと言うらしい。検索のときに使うかもしれないのでメモ。
お名前.comのVPSサーバを使うまで – Unix的なアレ
お名前.com は VPS のサービスをやってたのを知らなかった。半年ほど前に VPS を使いたくて調べたときには気づかなかったので最近始めた?
ファイルサーバの調子が悪い。ファイルのコピーや移動をしているとネットワークの遅延とかなんとかいうエラーが出てたまに失敗することがある。
サーバを立てたときから調子が悪かったし、やり直せばほぼ成功するので致命的というほどでもなしほったらかしていたけど、たまたま下記の記事を読んでネットワーク速度の調査をしてみた。
下記を.bashrc ファイルに記述しておく。
PATH="$PATH":[追加パス]
設定されているパスの確認は下記。
printenv PATH
csh/tcshシェルの場合は下記の通り。
setenv PATH "$PATH":[追加パス]
zontheworld HTML convert time: 0.100 sec. ( Login )