• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

PHP一段正则表达式匹配结果不一致的问题

php 搞代码 3年前 (2022-01-25) 22次浏览 已收录 0个评论
文章目录[隐藏]

我自定的函数如下,功能是匹配出特殊字符:

<code class="lang-PHP">function hasSpecialChar($subject) {    $pattern = "/[`~!@#$%^&*()+=|{}':;',\\[\\].\/?~!@#¥%……&*()——+|{}【】‘;:”\"“’。,、?]/";    if (preg_match($pattern, $subject)) {        return true;    }    return false;}</code>

我的结果:

<code>var_dump(hasSpecialChar('问答社区')); // boolean truevar_dump(hasSpecialChar('Segmentfault')); // boolean falsevar_dump(hasSpecialChar('@Segmentfault')); // boolean true</code>

可以从第一个结果中看出是'问答社区'这个中文字符串被匹配出了特殊字符,但是我在Rubular上匹配'问答社区'则匹不出特殊字符,请问是不是我哪里写错了?还是preg_match函数的为题呢?一直找不到原因。

路过的大哥们帮帮忙,谢谢。

回复内容:

¥本文来%源[email protected]搞@^&代*@码)网5搞gaodaima代码

我自定的函数如下,功能是匹配出特殊字符:

<code class="lang-PHP">function hasSpecialChar($subject) {    $pattern = "/[`~!@#$%^&*()+=|{}':;',\\[\\].\/?~!@#¥%……&*()——+|{}【】‘;:”\"“’。,、?]/";    if (preg_match($pattern, $subject)) {        return true;    }    return false;}</code>

我的结果:

<code>var_dump(hasSpecialChar('问答社区')); // boolean truevar_dump(hasSpecialChar('Segmentfault')); // boolean falsevar_dump(hasSpecialChar('@Segmentfault')); // boolean true</code>

可以从第一个结果中看出是'问答社区'这个中文字符串被匹配出了特殊字符,但是我在Rubular上匹配'问答社区'则匹不出特殊字符,请问是不是我哪里写错了?还是preg_match函数的为题呢?一直找不到原因。

路过的大哥们帮帮忙,谢谢。

但是我在Rubular上匹配’问答社区’则匹不出特殊字符

Rubular是基于Ruby的,Ruby 1.9以后对中文支持得很不错了。

请问是不是我哪里写错了?

需要加上u修饰符,开启UTF-8支持

<code class="lang-php">$pattern = "/[`~!@#$%^&*()+=|{}':;',\\[\\].\/?~!@#¥%……&*()——+|{}【】‘;:”\"“’。,、?]/u";</code>

一直找不到原因。

是PHP对中文支持不够好。

中文在PHP里是以16进制保存的,这就带来问题了。

比如,你的例子中,你匹配的那些特殊符号中包括中文的逗号,你告诉PHP的是,我要匹配一组特殊符号,其中包括中文的逗号,[,],但是PHP不认识中文,它听到的是,你要匹配一组数据,其中包括\xef\xbc\x8c(中文逗号转换成十六进制),然后你传给它的“问答社区”,其中“区”字转换成十六进制就是\xe5\x8c\xba。你可以看到,这里\x8c匹配上了,所以最后结果是true

同理,你可以尝试找一下字是因为和哪个特殊符号的十六进制匹配上了?

php汉字匹配可以考虑 mb_ 相应的函数,例如:mb_ereg(),虽然有些问题,但是大体上能比较省事的解决问题。
如果使用GBK字符集建议考虑转成UTF-8再处理。

PHP如果需要处理中文正则,请一定使用小写字母U
如把你的代码改成 这个即可

<code>$pattern = "/[`~!@#$%^&*()+=|{}':;',\\[\\].\/?~!@#¥%……&*()——+|{}【】‘;:”\"“’。,、?]/u";</code>

不过我经常这样干

<code>$pattern = "/[`~!@#$%^&*()+=|{}':;',\\[\\].\/?~!@#¥%……&*()——+|{}【】‘;:”\"“’。,、?]/isu";</code>

搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:PHP一段正则表达式匹配结果不一致的问题

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址