奇怪的抓取结果
我想抓取http://www.sctport.com.cn/newsctsite/sct/cntrnoplan.jsp?ToPage=1这个页面的表格内容,但奇怪了,为什么只能抓取中文的部分,不能抓取英文的部分?太奇怪了。 用SNOOPY类,代码如下: 高手帮忙看看啊,我郁闷死了。
include(“Snoopy.class.php”);
$snoopy = new Snoopy;
$snoopy->fetch(“http://www.sctport.com.cn/newsctsite/sct/cntrnoplan.jsp?ToPage=1”);
preg_match_all(‘/(.*?)<\/font>/i’,$snoopy->results,$d);
for ($i=0;$i<40;$i++){
echo $i; echo “—-“;
ECHO $d[1][$i].”
“;
}
只抓取了中文的部分,英文的,日@本文来源gaodai$ma#com搞$代*码6网搞代gaodaima码期的,都没抓出来,不知道怎么回事?
——解决方案——————–
——解决方案——————–
preg_match_all(‘/(.*)<\/font>/isU’,$snoopy->results,$d);