php批量下载搜狗词库

 index.php:

PHP代码
  1. <?php  
  2.     /*//echo microtime(); 
  3.     echo $start=strtotime(date("Y-m-01"))."<br/>"; 
  4.     echo urlencode(iconv("UTF-8","GB2312//IGNORE","中国的") ); 
  5.     echo urlencode("/"); 
  6.     require_once "pinyin.php"; 
  7.     $pinyin=new PY_deal(); 
  8.     echo join($pinyin->pinyin("麦包包批发,[魅惑/微光摇曳/青春密语]三种款式,自由选择!现只需50元/款!"));*/  
  9.   
  10.     $fp=fopen("dictory.txt""a+");  
  11.     for($i=1;$i<=4;$i++){  
  12.         $curl=curl_init();  
  13.         $url="http://pinyin.sogou.com/dict/search.php?word=%B0%A2%C0%EF%B0%CD%B0%CD%B2%FA%C6%B7%B4%CA%BB%E3&type=0&personal=1&page={$i}";  
  14.         $options=array(CURLOPT_URL=>$url,CURLOPT_RETURNTRANSFER=>true,CURLOPT_HEADER=>false);  
  15.         curl_setopt_array($curl$options);  
  16.         $rs=curl_exec($curl);  
  17.         curl_close($curl);  
  18.         $pattern_list="/\<dl\s+class\=\"dictlist\"\>([\S\s]+)?\<\/dl\>/i";  
  19.         preg_match_all($pattern_list,$rs,$match);  
  20.         $rs=$match[1][0];  
  21.         $pattern="/\?id=(\d+?)\"/i";  
  22.         preg_match_all($pattern,$rs,$match);  
  23.         $rs=$match[1];  
  24.           
  25.         foreach($rs as $v){  
  26.             $link="http://pinyin.sogou.com/dict/download_txt.php?id={$v}";  
  27.             $curl=curl_init();  
  28.             $options=array(CURLOPT_URL=>$link,CURLOPT_FILE=>$fp,CURLOPT_HEADER=>false);  
  29.             curl_setopt_array($curl$options);  
  30.             curl_exec($curl);  
  31.             curl_close($curl);  
  32.               
  33.   
  34.         }  
  35.   
  36.     }  
  37.       
  38.   
  39.     fclose($fp);  
  40. ?>  

 



上一篇: WIN2003+IIS6+PHP5.3.8/PHP5.4.22的安装配置
下一篇: php合并图片,生成gif动态图片,保存到指定目录
文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags: php
相关日志:
评论: 0 | 引用: 0 | 查看次数: 1703
发表评论
昵 称:
密 码: 游客发言不需要密码.
邮 箱: 邮件地址支持Gravatar头像,邮箱地址不会公开.
网 址: 输入网址便于回访.
内 容:
验证码:
选 项:
虽然发表评论不用注册,但是为了保护您的发言权,建议您注册帐号.
字数限制 1000 字 | UBB代码 开启 | [img]标签 关闭

 广告位

↑返回顶部↑