Rubyでウェブサイトのアクセスを自動化
Mechanizeというライブラリを使ってRubyで簡単Webアクセスです。
installはgemで。
途中で依存しているライブラリ、hpricotのinstallもたずねられるのでyesと入力。
gem install mechanize
さて、アクセスは下記のような手順で行います。
某サイトにアクセスして、ログインした結果の画面を表示します。
require 'mechanize'
agent = WWW::Mechanize.new
agent.user_agent_alias = 'お好きなAgentを設定'
page = agent.get("http://www.example.com/")form = page.forms.with.name("login").first
form.mail = "USER"
form.password = "PASSWORD"page = agent.submit(form)
puts page.body
うーん楽々。
じゃあこれを何に使うか?
mixiであしあとを解析したりだとか、Webの解析を行ったりだとか、
RSS対応していないサイトにアクセスして無理やりRSSを作ったりとか。
個人的にはニコニコ動画でごにょごにょしたいですね。
参考:
WWW::Mechanize による Webアクセスの自動化 ←めちゃ参考にしました!
http://diaspar.jp/node/146
リファレンスマニュアル
http://mono.kmc.gr.jp/~yhara/rubyscraping/?Mechanize