通过cURL抓一张带数据表的页面,只要得到TR下所有的单元格,用下面这种方法
<code>$content = 内容;preg_match_all('/<td>(.*?)<\/td>/',$content,$res);</code>
但是有两种情况无法匹配
<code><td> 内容 </td></code>
和
<code><td class="sorting_1"> 未付 </td></code>
不知道为什么多了很多空格的单元格和带class的单元格无法匹配出来?由于不会正则,求一个pattern能够完全匹配出TD。还有一个问题,页面上有两个table.一个用于各种条件筛选数据,一个盛放数据,如何只匹配盛放数据的那个table呢?
本文来源gaodaimacom搞#^代%!码&网*
搞代gaodaima码
回复内容:
通过cURL抓一张带数据表的页面,只要得到TR下所有的单元格,用下面这种方法
<code>$content = 内容;preg_match_all('/<td>(.*?)<\/td>/',$content,$res);</code>
但是有两种情况无法匹配
<code><td> 内容 </td></code>
和
<code><td class="sorting_1"> 未付 </td></code>
不知道为什么多了很多空格的单元格和带class的单元格无法匹配出来?由于不会正则,求一个pattern能够完全匹配出TD。还有一个问题,页面上有两个table.一个用于各种条件筛选数据,一个盛放数据,如何只匹配盛放数据的那个table呢?
.在单行模式下无法匹配换行。
你可以用
<code>\s匹配任意的空白符\S匹配任意不是空白符的字符</code>
举一反三啊,匹配带class的td
<code>/<td>([\s\S]+?)<\/td>/</code>
匹配其中某个table的,同样举一反三啊,先从所有内容中匹配出table到一个数组中.
<code>/<table>([\s\S]+?)<\/table>/</code>
然后看你要第几个,再用上面的正则匹配次不就好了。
还是那句话,举一反三啊!
<code>$pattern = "/<td>([\s\S]*?)<\/td>/";</code>
我也不太会,应该可以