• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

PHP小偷 关于抓取页面不同编码的解决方_php

php 搞代码 7年前 (2018-06-21) 163次浏览 已收录 0个评论
  1. <?
  2. function get_sub_content($str, $start, $end){      
  3.  if ( $start == ” $end == ” ){             
  4.   return "页面元素已经改变!";       
  5.   }       
  6.   $str = explode($start, $str);       
  7.   $str = explode($end, $str[1]);       
  8.   return $str[0];
  9.   }
  10.  
  11. function my_encoding($data,$to){
  12.  $encode_arr = array(‘UTF-8′,’ASCII’,’GBK’,’GB2312′,’BIG5′,’JIS’,’eucjp-win’,’sjis-win’,’EUC-JP’);
  13.  $encoded = mb_detect_encoding($data, $encode_arr);
  14.  $data = mb_convert_encoding($data,$to,$encoded);
  15.  return $data;
  16. }
  17. $doc = file_get_contents("http://video.baidu.com/v?ct=0&word=周杰伦%20site%3Awww%2Etudou%2Ecom&db=0&ty=0&rn=20&pn=0&fbl=1024&quot;);
  18. $doc = my_encoding($doc,"utf-8");
  19. $doc =get_sub_content($doc,"<div id=/"result/">","<br clear=");
  20. $str_replace = explode("<div class=x>",$doc);
  21. echo "<?xml version=/"1.0/" encoding=/"UTF-8/"?>";
  22. echo "<data>";
  23. for ($i=1; $i<=count($str_replace)-1; $i++){
  24. echo "<video>";
  25. echo "<name>";
  26. echo "<![CDATA[".get_sub_content($str_replace[$i],"title=/"","/"")."]]>";
  27. echo "</name>";
  28. echo "<pageurl>";
  29. echo "<![CDATA[".get_sub_content($str_replace[$i],"<a href=/"","/" onmousedown=")."]]>";
  30. echo "</pageurl>";
  31. echo "</video>";
  32. }
  33. echo "</data>";
  34. ?>

欢迎大家阅读php小偷 关于抓取页面不同编码的解决方_php》,跪求各位点评,若觉得好的话请收藏本文,by 搞代码


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:PHP小偷 关于抓取页面不同编码的解决方_php
喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址