PHP抓取网页内容的技巧分享

开发 后端
PHP抓取网页内容的实现还是比较简单的。希望大家可以通过本文介绍的方法技巧,彻底掌握这一方法,提高自己的实际编码能力。

如何才能正确的实现PHP抓取网页内容呢?这个问题对于接触PHP语言不久的朋友来说有些难办。我们今天就为大家介绍了具体的解决办法。

首先,在C\windows里的php.ini中我打开了extension=php_curl.dll的功能,然后也重启了apapche,以下是我写的PHP抓取网页内容之抓取百度中PHP的信息:

  1. < ?php  
  2. //初始化curl  
  3. $ch = curl_init() or die (curl_error());  
  4. echo "测试一下";  
  5. //设置URL参数  
  6. curl_setopt($ch,CURLOPT_URL,"http:
    //www.baidu.com/s?
    wd=php");  
  7. //要求CURL返回数据  
  8. curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);  
  9. //执行请求  
  10. $result = curl_exec($ch) or die (curl_error());  
  11. //取得返回的结果,并显示  
  12. echo $result;  
  13. echo curl_error($ch);  
  14. //关闭CURL  
  15. curl_close($ch);  
  16. ?> 

#t#可为什么PHP抓取网页内容后没反应呢?连测试的文字都没有,要是我把echo "测试一下";放到第一行就可以输出,我估计是curl_init()函数还没有运行!

你看看PHP的phpinfo()中有没有CURL扩展支持!

把php_curl.dll拷到c:\windows\和c:\windows\system32里面 重启apache之后再试试看

不是php_curl.dll这个文件,是把php目录中的libeay32.dll,ssleay32.dll拷到c:\windows\system32里面 重启apache

为了服务器安全着想,所以把allow_url_fopen关掉了。

当服务器allow_url_fopen = Off 时,就不能用file_get_contents,只有设置ON时可以用。

 

  1. < ?php /*  
  2. $getstr=file_get_contents("http://www.
    163.com/weatherxml/54511.xml");  
  3. $qx=explode("\"",strstr($getstr,"qx="));  
  4. $wd=explode("\"",strstr($getstr,"wd="));  
  5. $qximg=explode("\"",strstr($getstr,"qximg="));  
  6. $qximg_=explode(",",$qximg[1]);  
  7. echo "北京&nbsp;".$qx[1]."";  
  8. echo $wd[1];*/  
  9. //echo "< img src='http://news.
    163.com/img/logo/".$qximg_[0]."'
    >
    < img src='http://news.163.com
    /img/logo/".$qximg_[1]."'
    >";  
  10. ?> 

以下PHP抓取网页内容的范例是通curl_init函数来获取163天气预报

把php.ini里( ;extension=php_curl.dll ) 前面的(;)去掉保存

把php_curl.dll,libeay32.dll,ssleay32.dll拷到c:\windows\system32里,重启IIS即可,没有装apache

 

  1. < ?php  
  2. //初始化curl  
  3. $ch = curl_init() or die (curl_error());  
  4. //设置URL参数  
  5. curl_setopt($ch,CURLOPT_URL,"http:
    //www.163.com/weatherxml/54511.xml");  
  6. //要求CURL返回数据  
  7. curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);  
  8. //执行请求  
  9. $result = curl_exec($ch) or die (curl_error());  
  10. //取得返回的结果,并显示  
  11. //echo $result;  
  12. // echo curl_error($ch);  
  13. $qx=explode("\"",strstr($result,"qx="));  
  14. $wd=explode("\"",strstr($result,"wd="));  
  15. $qximg=explode("\"",strstr($result,"qximg="));  
  16. $qximg_=explode(",",$qximg[1]);  
  17. echo "北京&nbsp;".$qx[1]."< br />";  
  18. echo $wd[1];  
  19. //关闭CURL  
  20. curl_close($ch);  
  21. ?> 

通过以上对PHP抓取网页内容的学习,大家可以自行实际操作一遍,加深对它的理解。

责任编辑:曹凯 来源: 百度博客
相关推荐

2010-03-03 15:39:50

Python抓取网页内

2009-07-31 10:34:41

ASP.NET抓取网页

2009-12-09 17:33:22

PHP性能优化

2009-11-25 17:28:26

PHP对话

2009-12-01 19:23:22

PHP缓存技术

2011-07-11 10:24:09

PHP

2009-12-10 17:27:39

PHP操作Cookie

2009-12-10 10:30:31

PHP删除复制文件

2009-12-08 14:00:11

PHP函数microt

2009-12-10 10:24:24

PHP写入文件

2009-12-04 14:41:11

PHP数组变成JSON

2009-12-02 10:01:04

PHP乱码问题

2009-12-01 10:50:45

PHP函数requir

2011-06-09 16:14:14

2009-04-28 10:03:35

PHPcURL抓取网页

2009-12-03 16:54:36

PHP获取中国IP段

2021-11-24 17:22:06

网络抓取网络爬虫数据收集

2009-12-10 17:20:00

PHP服务器架设

2009-12-04 16:49:33

PHP批量导出csv文

2009-12-11 13:16:04

PHP查询字符串
点赞
收藏

51CTO技术栈公众号