PHPでサイトのHTMLソースを取得する

PHPで外部サイトのHTMLを取得する方法を2つご紹介。

file_get_contents

こちらはとても簡単な方法♪

これだけ。

だけども、たまにこれでは取得ができない場合があります。そんな時は、次の方法↓

cURL

今度は少し複雑ですが、様々なオプションを指定できたり、パフォーマンス的にも良いとか。以下のコードをそのままコピペでいけます。

もし、そのままのコードで取得できない場合は、取得先のサイトに合わせて、オプション部分を工夫する必要があるかもしれません。

用意されているオプションが結構多いので、公式で確認して必要なものを実装してみてください。

 

取得したソースから特定の要素を取り出す方法は、下記の過去記事。

PHPでウェブスクレイピング