文章目录[隐藏]
本帖最后由 ruiman 于 2014-02-08 11:04:14 编辑
PHP 字符串 正则表达式
才在学习PHP,现在遇到一个$contents变量里面的内容如下 document.write(‘
width=”60″ height=”21″ align=”absbottom” src=”Other%20web_files/slogo-news.gif”
border=”0″> target=”_blank” rel=”nofollow”>教育新闻
border=”0″> target=”_blank” rel=”nofollow”>教育新闻
href=”http://news.ycwb.com/2014-02/08/content_6034510.htm”
target=”_blank” rel=”nofollow”>川大教授张兴栋当选美国国家工程院外籍院士 金羊网 06:29
href=”http://news.xinhuanet.com/edu/2014-02/08/c_126099001.htm”
target=”_blank” rel=”nofollow”>北京推一本高招计划 定向投放生态涵养区 新华网 09:11
target=”_blank” rel=”nofollow”>肇庆:主要景区迎客221万人次 光明网 08:29
target=”_blank” rel=”nofollow”>把对故乡眷恋藏心里 春节后娃娃随父母出发 组图 新华网 08:47
href=”http://news.xinhuanet.com/edu/2014-02/08/c_119240720.htm”
target=”_blank” rel=”nofollow”>促进高校毕业生就业有哪些新的改革举措 新华网 10:18
target=”_blank” rel=”nofollow”>借力“适应性学习” Knewton演绎在线教育变革 搜狐 09:55
href=”http://www.sd.xinhuanet.com/news/2014-02/08/c_119235535.htm” target=”_blank” rel=”nofollow”>山东为自费留学中介上紧箍
严禁到中小学招生 新华网山东频道 08:03
target=”_blank” rel=”nofollow”>西汉“学术超男”策划“诗经秀”取功名 人民网 07:04
target=”_blank” rel=”nofollow”>李鸿章哥哥摆架子被下级痛骂 人民网 07:04
target=”_blank” rel=”nofollow”>江苏金坛教育系统工作“贴地行走”摸准基层脉 中国教育新闻网 08:50
‘); target=”_blank” rel=”nofollow”>川大教授张兴栋当选美国国家工程院外籍院士 金羊网 06:29
href=”http://news.xinhuanet.com/edu/2014-02/08/c_126099001.htm”
target=”_blank” rel=”nofollow”>北京推一本高招计划 定向投放生态涵养区 新华网 09:11
target=”_blank” rel=”nofollow”>肇庆:主要景区迎客221万人次 光明网 08:29
target=”_blank” rel=”nofollow”>把对故乡眷恋藏心里 春节后娃娃随父母出发 组图 新华网 08:47
href=”http://news.xinhuanet.com/edu/2014-02/08/c_119240720.htm”
target=”_blank” rel=”nofollow”>促进高校毕业生就业有哪些新的改革举措 新华网 10:18
target=”_blank” rel=”nofollow”>借力“适应性学习” Knewton演绎在线教育变革 搜狐 09:55
href=”http://www.sd.xinhuanet.com/news/2014-02/08/c_119235535.htm” target=”_blank” rel=”nofollow”>山东为自费留学中介上紧箍
严禁到中小学招生 新华网山东频道 08:03
target=”_blank” rel=”nofollow”>西汉“学术超男”策划“诗经秀”取功名 人民网 07:04
target=”_blank” rel=”nofollow”>李鸿章哥哥摆架子被下级痛骂 人民网 07:04
target=”_blank” rel=”nofollow”>江苏金坛教育系统工作“贴地行走”摸准基层脉 中国教育新闻网 08:50
target=”_blank” rel=”nofollow”>更多>>
现在想把里面的这样的内容 href=”http://news.ycwb.com/2014-02/08/content_6034510.htm”
target=”_blank” rel=”nofollow”>川大教授张兴栋当选美国国家工程院外籍院士 筛几条出来,请问应如何操作。
回复讨论(解决方案)
“筛几条” 是指哪几条?这个标准怎么定义?
$str="content";preg_match_all("#.*?#is", $str, $matches);print_r($matches);
$str="content";preg_match_all("#.*?#i", $str, $matches);print_r($matches);
$s =<<< TXTdocument.write('<DIV style="margin-bottom: 10px"> 教育新闻</DIV><DIV class="baidu" style="width: 100%;text-align: left">川大教授张兴栋当选美国国家工程院外籍院士 <SPAN>金羊网 06:29</SPAN><BR>北京推一本高招计划 定向投放生态涵养区 <SPAN>新华网 09:11</SPAN><BR>肇庆:主要景区迎客221万人次 <SPAN>光明网 08:29</SPAN><BR>把对故乡眷恋藏心里 春节后娃娃随父母出发 组图 <SPAN>新华网 08:47</SPAN><BR>促进高校毕业生就业有哪些新的改革举措 <SPAN>新华网 10:18</SPAN><BR>借力“适应性学习” Knewton演绎在线教育变革 <SPAN>搜狐 09:55</SPAN><BR>山东为自费留学中介上紧箍 严禁到中小学招生 <SPAN>新华网山东频道 08:03</SPAN><BR>西汉“学术超男”策划“诗经秀”取功名 <SPAN>人民网 07:04</SPAN><BR>李鸿章哥哥摆架子被下级痛骂 <SPAN>人民网 07:04</SPAN><BR>江苏金坛教育系统工作“贴地行走”摸准基层脉 <SPAN>中国教育新闻网 08:50</SPAN><BR><DIV style="font-size: 12px;margin-top: 5px">更多>></DIV></DIV>');TXT;//全部 A 标记preg_match_all('##isU', $s, $r);print_r($r[0]);//仅文字标题的 A 标记preg_match_all('##isU', $s, $r);print_r($r[0]);//仅包含指定词汇的 A 标记preg_match_all('##isU', $s, $r);print_r($r[0]);
Array( [0] => [1] => 教育新闻 [2] => 川大教授张兴栋当选美国国家工程院外籍院士 [3] => 北京推一本高招计划 定向投放生态涵养区 [4] => 肇庆:主要景区迎客221万人次 [5] => 把对故乡眷恋藏心里 春节后娃娃随父母出发 组图 [6] => 促进高校毕业生就业有哪些新的改革举措 [7] => 借力“适应性学习” Knewton演绎在线教育变革 [8] => 山东为自费留学中介上紧箍 严禁到中小学招生 [9] => 西汉“学术超男”策划“诗经秀”取功名 [10] => 李鸿章哥哥摆架子被下级痛骂 [11] => 江苏金坛教育系统工作“贴地行走”摸准基层脉 [12] => 更多>>)Array( [0] => 教育新闻 [1] => 川大教授张兴栋当选美国国家工程院外籍院士 [2] => 北京推一本高招计划 定向投放生态涵养区 [3] => 肇庆:主要景区迎客221万人次 [4] => 把对故乡眷恋藏心里 春节后娃娃随父母出发 组图 [5] => 促进高校毕业生就业有哪些新的改革举措 [6] => 借力“适应性学习” Knewton演绎在线教育变革 [7] => 山东为自费留学中介上紧箍 严禁到中小学招生 [8] => 西汉“学术超男”策划“诗经秀”取功名 [9] => 李鸿章哥哥摆架子被下级痛骂 [10] => 江苏金坛教育系统工作“贴地行走”摸准基层脉 [11] => 更多>>)Array( [0] => 川大教授张兴栋<div>……本2文来源gaodai.ma#com搞##代!^码@网3</div><code>搞代gaodaima码</code>当选美国国家工程院外籍院士 )
感谢版主的回答,正则表达式也看过,没想到能这么用,完全解决了我的问题,知道我的需求,大师就是大师哦