JavaScriptなどを多用しているような動きのあるページをスクレイピングしたい場合に使えるテクニックです。
Casper.jsは npm
で比較的簡単にインストールできそうですので、サーバ側でも簡単に実現できるのでオススメです^^
😎 Installation
casperjsのインストール方法はこちら。
npm install casperjs -g |
🐹 Source Code
Casper.jsを使ってページを取得するスクリプトはこちら。
今回は引数にURLとHTMLの保存先を指定できるようにしてみました。
// scrape.js |
あとは下のコマンドを呼び出せば対象URLのHTMLが保存されます。
casperjs scrape.js http://www.ugtop.com/spill.shtml /tmp/casper_scraped3.html |
Happy Hacking!
🚌 参考リンク
- http://takun71.hatenabl…
- scrape_5374/capture-5374.js at master · PharaohKJ/scrape_5374
- Using the command line — CasperJS 1.1.0-DEV documentation