Tag: snoopy类预览模式: 普通 | 列表

PHP使用Snoopy类下载图片

 

PHP代码
  1. <?php  
  2.   
  3. set_time_limit(0);     //设置超时时间  
  4.   
  5. include_once'Snoopy.class.php' );  //调用Snoopy类  
  6.   
  7.    
  8.   
  9. function getImage($id,$url) {  
  10.   
  11. $filename = $id . ".jpg";  
  12.   
  13. $temp = new Snoopy;  
  14.   
  15. $temp -> fetch($url);  
  16.   
  17. if($temp->results != "") {  
  18.   
  19. $handle = fopen("images/" . $filename"w");  
  20.   
  21. fwrite($handle$temp->results);//写入抓得内容  
  22.   
  23. fclose($handle);  
  24.   
  25. }  
  26.   
  27. return $filename;  
  28.   
  29. }  
  30.   
  31. ?>  

 

Tags: php snoopy类

分类:技术文章 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 4404

使用PHP的Snoopy类抓取图片

 用了两天php的Snoopy这个类,发现很好用。获取请求网页里面的所有链接,直接使用fetchlinks就可以,获取所有文本信息使用fetchtext(其内部还是使用正则表达式在进行处理),还有其它较多的功能,如模拟提交表单等。

使用方法:

  1. 先下载Snoopy类,下载地址:http://sourceforge.net/projects/snoopy/
  2. 先实例化一个对象,然后调用相应的方法即可获取抓取的网页信息
PHP代码
  1. include 'snoopy/Snoopy.class.php';  
  2.       
  3. $snoopy = new Snoopy();  
  4.       
  5. $sourceURL = "http://xxxxxxxxx";  
  6. $snoopy->fetchlinks($sourceURL);  
  7.       
  8. $a = $snoopy->results;  

 它并没有提供获取网页中所有图片地址的方法,自己有个需求是要获取一个页面中所有文章列表中图片地址。然后自己就写了一个,主要还是正则那里匹配重要。

PHP代码
  1. //匹配图片的正则表达式  
  2.  $reTag = "/<img[^s]+src="(http://[^"]+).(jpg|png|gif|jpeg)"[^/]*/>/i";  

 

查看更多...

Tags: php snoopy类

分类:技术文章 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 5052

 广告位

↑返回顶部↑