PHP抓取网页内容的技巧分享
创始人
2024-06-13 15:31:16
0

如何才能正确的实现PHP抓取网页内容呢?这个问题对于接触PHP语言不久的朋友来说有些难办。我们今天就为大家介绍了具体的解决办法。

首先,在C\windows里的php.ini中我打开了extension=php_curl.dll的功能,然后也重启了apapche,以下是我写的PHP抓取网页内容之抓取百度中PHP的信息:

  1. < ?php  
  2. //初始化curl  
  3. $ch = curl_init() or die (curl_error());  
  4. echo "测试一下";  
  5. //设置URL参数  
  6. curl_setopt($ch,CURLOPT_URL,"http:
    //www.baidu.com/s?wd=php");  
  7. //要求CURL返回数据  
  8. curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);  
  9. //执行请求  
  10. $result = curl_exec($ch) or die (curl_error());  
  11. //取得返回的结果,并显示  
  12. echo $result;  
  13. echo curl_error($ch);  
  14. //关闭CURL  
  15. curl_close($ch);  
  16. ?> 

#t#可为什么PHP抓取网页内容后没反应呢?连测试的文字都没有,要是我把echo "测试一下";放到第一行就可以输出,我估计是curl_init()函数还没有运行!

你看看PHP的phpinfo()中有没有CURL扩展支持!

把php_curl.dll拷到c:\windows\和c:\windows\system32里面 重启apache之后再试试看

不是php_curl.dll这个文件,是把php目录中的libeay32.dll,ssleay32.dll拷到c:\windows\system32里面 重启apache

为了服务器安全着想,所以把allow_url_fopen关掉了。

当服务器allow_url_fopen = Off 时,就不能用file_get_contents,只有设置ON时可以用。

 

  1. < ?php /*  
  2. $getstr=file_get_contents("http://www.
    163.com/weatherxml/54511.xml");  
  3. $qx=explode("\"",strstr($getstr,"qx="));  
  4. $wd=explode("\"",strstr($getstr,"wd="));  
  5. $qximg=explode("\"",strstr($getstr,"qximg="));  
  6. $qximg_=explode(",",$qximg[1]);  
  7. echo "北京 ".$qx[1]."";  
  8. echo $wd[1];*/  
  9. //echo "< img src='http://news.
    163.com/img/logo/".$qximg_[0]."'>
    < img src='http://news.163.com
    /img/logo/".$qximg_[1]."'>";  
  10. ?> 

以下PHP抓取网页内容的范例是通curl_init函数来获取163天气预报

把php.ini里( ;extension=php_curl.dll ) 前面的(;)去掉保存

把php_curl.dll,libeay32.dll,ssleay32.dll拷到c:\windows\system32里,重启IIS即可,没有装apache

 

  1. < ?php  
  2. //初始化curl  
  3. $ch = curl_init() or die (curl_error());  
  4. //设置URL参数  
  5. curl_setopt($ch,CURLOPT_URL,"http:
    //www.163.com/weatherxml/54511.xml");  
  6. //要求CURL返回数据  
  7. curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);  
  8. //执行请求  
  9. $result = curl_exec($ch) or die (curl_error());  
  10. //取得返回的结果,并显示  
  11. //echo $result;  
  12. // echo curl_error($ch);  
  13. $qx=explode("\"",strstr($result,"qx="));  
  14. $wd=explode("\"",strstr($result,"wd="));  
  15. $qximg=explode("\"",strstr($result,"qximg="));  
  16. $qximg_=explode(",",$qximg[1]);  
  17. echo "北京 ".$qx[1]."< br />";  
  18. echo $wd[1];  
  19. //关闭CURL  
  20. curl_close($ch);  
  21. ?> 

通过以上对PHP抓取网页内容的学习,大家可以自行实际操作一遍,加深对它的理解。

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...
2012年第四季度互联网状况报... [[71653]]  北京时间4月25日消息,据国外媒体报道,全球知名的云平台公司Akamai Te...