• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

正则表达式 – php提取html中指定div下a标签的text和href问题

php 搞代码 4年前 (2022-01-25) 11次浏览 已收录 0个评论
文章目录[隐藏]

<body>

已解决,有点凌乱,速度就行。

<code><?phpheader('content-type:application/json;charset=utf8');$url='http://www.hkxy.edu.cn/'; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_NOBODY, 0); // remove body curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE); curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'); $response = curl_exec($ch); // 检查是否有错误发生 if(curl_errno($ch)) {     echo 'Curl error: ' . curl_error($ch); } else{     echo htmlspecialchars($response); } curl_close($ch);$response=iconv('gbk', 'utf-8', $response);$response=str_replace(' ','',$response);$pa = '%<div class="column4">(.*?)</div>%sim';preg_match_all($pa,$response,$arr);$pa = '%(.*?)%sim';preg_match_all($pa,$response,$arr);$result=array();$number=count($arr[1]);for($i=0;$i1000 ) {        die('possible deep recursion attack');    }    foreach ($array as $key => $value) {        if (is_array($value)) {            arrayRecursive($array[$key], $function, $apply_to_keys_also);        } else {            $array[$key] = $function($value);        }        if ($apply_to_keys_also && is_string($key)) {            $new_key = $function($key);            if ($new_key != $key) {                $array[$new_key] = $array[$key];                unset($array[$key]);            }        }    }    $recursive_counter--;}/************************************************************** * *  将数组转换为JSON字符串(兼容中文) * @param  array $array 要转换的数组 * @return string      转换得到的json字符串 * @access public * *************************************************************/function JSON($array){    arrayRecursive($array, 'urlencode', true);    $json = json_encode($array);    return urldecode($json);}</code>


URL:http://www.hkxy.edu.cn/

如图所示:
我想提取.offer_box_wide1下a元素的text和href怎么破?求教

回复内容:

<body>

已解决,有点凌乱,速度就行。

<code><?phpheader('content-type:<strong>*本文来@源gao@daima#com搞(%代@#码@网2</strong><pre>搞代gaodaima码

application/json;charset=utf8′);$url=’http://www.hkxy.edu.cn/&#8217;; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_NOBODY, 0); // remove body curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE); curl_setopt($ch, CURLOPT_USERAGENT, ‘Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36’); $response = curl_exec($ch); // 检查是否有错误发生 if(curl_errno($ch)) { echo ‘Curl error: ‘ . curl_error($ch); } else{ echo htmlspecialchars($response); } curl_close($ch);$response=iconv(‘gbk’, ‘utf-8’, $response);$response=str_replace(‘ ‘,”,$response);$pa = ‘%

(.*?)

%sim’;preg_match_all($pa,$response,$arr);$pa = ‘%(.*?)%sim’;preg_match_all($pa,$response,$arr);$result=array();$number=count($arr[1]);for($i=0;$i1000 ) { die(‘possible deep recursion attack’); } foreach ($array as $key => $value) { if (is_array($value)) { arrayRecursive($array[$key], $function, $apply_to_keys_also); } else { $array[$key] = $function($value); } if ($apply_to_keys_also && is_string($key)) { $new_key = $function($key); if ($new_key != $key) { $array[$new_key] = $array[$key]; unset($array[$key]); } } } $recursive_counter–;}/************************************************************** * * 将数组转换为JSON字符串(兼容中文) * @param array $array 要转换的数组 * @return string 转换得到的json字符串 * @access public * *************************************************************/function JSON($array){ arrayRecursive($array, ‘urlencode’, true); $json = json_encode($array); return urldecode($json);}



URL:http://www.hkxy.edu.cn/

如图所示:
我想提取.offer_box_wide1下a元素的text和href怎么破?求教

最简单的办法是phpQuery

参考PHP Simple HTML DOM Parser
http://simplehtmldom.sourceforge.net/
可以像jquery选择器一样灵活操作html。


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:正则表达式 – php提取html中指定div下a标签的text和href问题

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址