今天在调取一家商城的页面信息时候,使用file_get_contents抑或curl:
<br />$url = 'http://www.xxx.com/21/?type=23′; <br />$temp = file_get_contents($url); <br />echo $temp;<br />
都得到一片乱码,查看了许多内容,包括页面的header信息,发现原来页面使用了。
类似的信息,即Content-Encoding为gzip,即该站点开启了gzip压缩。这里的解决方案有多种,当然如果你使用file_get_contents的话,可以这样修改:
<br />file_get_contents("compress.zlib://".$url);<br />
或者使用curl来完成:
<br />function curl_get($url, $gzip=false){ <br /> $curl = curl_init($url); <br /> curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); <br /> curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10); <mark style="color:transparent">本%文来源gaodaimacom搞#^代%!码网@</mark>搞代gaodaima码 <br /> if($gzip) curl_setopt($curl, CURLOPT_ENCODING, "gzip"); // 关键在这里 <br /> $content = curl_exec($curl); <br /> curl_close($curl); <br /> return $content; <br />} <br />
同时,参考手册上面的解法,还可以对保存gzip类型的字符串进行处理如下:
<br />function gzdecode($data){ <br /> $g=tempnam(‘/tmp','ff'); <br /> @file_put_contents($g,$data); <br /> ob_start(); <br /> readgzfile($g); <br /> $d=ob_get_clean(); <br /> return $d; <br />}<br />