別サーバからファイルを取得 ~ スクリーン・スクレイピング時に威力を発揮

他のサイトの画面情報 (HTML) を取ってきて、その画面の中身から情報を抽出することを、 ウェブ開発の現場では、スクリーン・スクレイピング (Screen Scraping) と呼びます。

screen は 「画面」。scrape は 「擦り取る」 とかそういう意味です。

例えば、他のサーバーにある RSS フィードを持ってきて、それをサーバー上で加工してコンテンツを作る場合。 あるいは、天気予報の情報や為替の情報を公開しているサイト上の情報を取得して、その中から必要な情報を抽出するような場合が、 スクリーン・スクレイピングにあたります。

スクリーン・スクレイピングを行うときは、まず第一に他のサーバーからデータを持ってこないといけません。

PHP ではそれを行うための非常に簡単な方法があります。

file_get_contents 関数に URL 等、ファイルの場所を指定すると、そのファイルを読み込み、 内容を返します。

$c = file_get_contents('http://www.foobar.com/');
echo $c;

自前のデータベースからデータを取得するのに比べて、外部からデータを取得すると、 処理は遅くなりますが、非常に柔軟にさまざまなことをやれるようになります。

他サーバーから情報を取ってくる場合は、著作権や利用規約に十分気をつけてください。

ここまでお読みいただき、誠にありがとうございます。SNS 等でこの記事をシェアしていただけますと、大変励みになります。どうぞよろしくお願いします。

© 2024 Web/DB プログラミング徹底解説