php 获取数据乱码有关问题

php 获取数据乱码问题

本帖最后由 qq_25293153 于 2015-01-13 15:42:18 编辑

file_get_contents 采集一个页面的数据，获取的数据是乱码，已经使用了检测编码的方式，
检测的是utf-8,我的页面编码也是utf-8，但是还是显示乱码，不知道为什么

<br /><br />$url="xxx";<br />$opts = array( <br />  'http'=>array( <br />    'user_agent' => "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)",<br />  ) <br />); <br />$context = stream_context_create($opts); <br />$neirong = file_get_contents($url, false, $context);<br /><br /> header("content-Type: text/html; charset=Utf-8"); <br />	 ob_end_flush();<br />	 $encode = mb_detect_encoding($neirong, array("ASCII","UTF-8","GB2312","GBK","BIG5")); <br />	 <br />        echo $encode."<br>";<br />		<br />		if ($encode!="UTF-8")<br />		{<br />     $neirong=mb_convert_encoding($neirong, "UTF-8", $encode); <br />	  <br />	 } <br />	  <br />	 <br /><br />echo $neirong;<br /><br /><br /><br />

$encode 输出：utf-8
$neirong 输出是乱码
我的页面编码是utf-8
——解决思路———————-
你在輸出的html中加入
<meta http-equiv=”content-type” content=”text/html; charset=utf-8″>
它源數據是做了些轉換的，我那個程序已經是轉換過來了。

我把採集的也寫出來，直接運行就可以了。

<br /><?php  <br />//http://www.ziyouge.com/conbdhekbefiab<br />//http://www.ziyouge.com/zy/4/4980/1333249.html<br /><br />// 獲取程序<br /><br />$url = 'http://www.ziyouge.com/conbdhekbefiab';<br /><br />$headers['User-Agent'] = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36';<br />$headerArr = array();  <br />foreach( $headers as $n => $v ) {  <br />    $headerArr[] = $n .':' . $v;   <br />}<br /><br />$ch = curl_init();<br />curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);	<br />curl_setopt($ch, CURLOPT_URL, $url);<br />curl_setopt($ch, CURLOPT_HTTPHEADER , $headerArr );  //构造IP<br />curl_setopt($ch, CURLOPT_REFERER, 'http://www.ziyouge.com/');   //构造来路<br />$content = curl_exec($ch);<br />$content = substr($content,3);<br />if($error=curl_error($ch)){<br />	die($error);<br />}<br /><mark style="color:transparent">本文来源gaodaimacom搞#^代%!码&网*</mark><pre>搞代gaodaima码

curl_close($ch);

// 分析程序

$result = ”;
$str_length = mb_strlen($content);
$i=0;
while ($i<=$str_length)
{
$temp_str=mb_substr($content,$i,1);
$ascnum=Ord($temp_str);
if ($ascnum>=224){
$result .= change(mb_substr($content,$i,3));
$i=$i+3;
}else{
$result .= mb_substr($content,$i,1);
$i=$i+1;
}
}

echo ‘<meta http-equiv=”content-type” content=”text/html;charset=utf-8″>’;
echo $result;

// 處理
function change($str){

$ignore = array(‘“’,’”’,’！’,’…’,’：’,’，’,’，’);

if(in_array($str, $ignore)){
return $str;
}

$prefix = “%u”;
$postfix = “”;
$str = iconv(‘UTF-8’, ‘UCS-2’, $str);
$arrstr = str_split($str, 2);
$unistr = ”;
for($i = 0, $len = count($arrstr); $i < $len; $i++) {
$tmp = hexdec(bin2hex($arrstr[$i]));
$tmp = str_pad(dechex($tmp),4,’0′,STR_PAD_LEFT);
$tmp = decrypt(substr($tmp,2,2).substr($tmp,0,2));
$unistr .= $prefix . $tmp . $postfix;
}
return unescape($unistr);
}

// 解密
function decrypt($d){
$result = str_pad(dechex(hexdec($d)-100),4,’0′,STR_PAD_LEFT);
return $result;
}

// 轉中文
function unescape($str) {
$ret = ”;
$len = strlen ( $str );
for($i = 0; $i < $len; $i ++) {
if ($str [$i] == ‘%’ && $str [$i + 1] == ‘u’) {
$val = hexdec ( substr ( $str, $i + 2, 4 ) );
if ($val < 0x7f)
$ret .= chr ( $val );
else if ($val < 0x800)
$ret .= chr ( 0xc0
——解决思路———————-
($val >> 6) ) . chr ( 0x80
——解决思路———————-
($val & 0x3f) );
else
$ret .= chr ( 0xe0
——解决思路———————-
($val >> 12) ) . chr ( 0x80
——解决思路———————-
(($val >> 6) & 0x3f) ) . chr ( 0x80
——解决思路———————-
($val & 0x3f) );
$i += 5;
} else if ($str [$i] == ‘%’) {
$ret .= urldecode ( substr ( $str, $i, 3 ) );
$i += 2;
} else
$ret .= $str [$i];
}
return $ret;
}
?>

搞代码网（gaodaima.com）提供的所有资源部分来自互联网，如果有侵犯您的版权或其他权益，请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected]‍，我们会在看到邮件的第一时间内为您处理，或直接联系QQ：872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接：php 获取数据乱码有关问题

Hi，您需要填写昵称和邮箱！