- 2009-03-19 (木)
phpでhttpリクエストして,結果をpreg_match_allなど文字列関数を駆使すればどうにでもできることが分かりました。
以下PHPでHTML(に限らず)をhttp(多分)で取得する方法です。
1.file_get_contents(’url’)
単純明快。
(2011.11.28追記)PHPの設定で色々パラメータをいじることができます。
2.get_headers()
ヘッダーだけなら便利です
3.pearのHTTP_request
UAを偽装したりproxyサーバ経由で接続したりとシンプルながら便利です。
4.pearのHTTP_client
HTTP_clientのラッパークラスですがクッキーのやりとりも簡単にできるのでログイン後にページ変遷でセッション保持が必要なサイトなどもらくらくです,想像も尽きない色々な使い方がーーー!
ご利用は計画的に。
(2011.11.28追記)
追加します。
5.CakePHPの httpsocket
http://api.cakephp.org/class/http-socket
便利でーす!
6.curl
http://www.google.co.jp/search?gcx=c&sourceid=chrome&ie=UTF-8&q=php+curl
サーバに入っていないと使えないのですが高機能です。
インストール手順
PHP の cURL サポート機能を使用するには、–with-curl[=DIR] を付けて PHP をコンパイル しておく必要があります。
http://php.net/manual/ja/book.curl.php
なので共有サーバなどで入っていない場合は使えませんが,便利な関数がいっぱいです。
PEARもサーバ側で用意が必要ですがcurlと違い共有でもファイルさえアップすれば使えます。
7.Simpletest の webtestcase
番外編というか・・・。
ブラウザバック・フォワードまでエミュレートできます。
CakePHPで使うには少し気合とコツが入りますので調べてください。
(2.0からはphpunitになるようですが・・・)
公式。api。
http://www.simpletest.org/api/SimpleTest/WebTester/WebTestCase.html
使い方(英語)
http://www.lastcraft.com/web_tester_documentation.php
その他情報源 - google検索
http://www.google.co.jp/search?aq=f&gcx=c&sourceid=chrome&ie=UTF-8&q=simpletest+webtestcase
- 次の記事: よくものを無くす
- 前の記事: 自分のIPアドレスを調べる
Comments:0
Trackback+Pingback:0
- TrackBack URL for this entry
- http://reoto.com/archives/224/trackback/
- Listed below are links to weblogs that reference
- PHPでHTMLを解析する(その2 主にHTMLの取得方法) from ぼんずーず