php中strpos函数判断字符存在误区

作者:袖梨 2022-06-24

修改主题comments-ajax.php文件

在主题目录下的comments-ajax.php文件中,大概60行左右的位置(刚取得用户提交的评论表单中的$_POST['author']等字段)。然后在该文件中加上下面的代码:

 代码如下 复制代码

    /*
    * @Author: vfhky 2013年09月21日22:13
    * @Variable string $word: 黑名单中的关键词,用户可自行按规律进行增加或减少
    * @Variable string $comment_author: 用户提交的$_POST['author']字段值,表示昵称
    * @Variable string $comment_content: 用户提交的$_POST['comment']字段值,表示评论内容
    **/
    $words = "com,cn,info,net,www,http,cc,host,代理,移动,电,国,港,器,服,医,肥,药,农,信,贷,日,盈,网,票,域,销,黄,司,企,机,租,人,钱,设,购,播";
    $word = explode(',', $words);
    $num = count($word);
    for($i=0;$i< $num ;$i++){
    if (strpos($comment_author,$word[$i],0) || strpos($comment_content,$word[$i],0)){
    err( __('广告必删,多谢理解!') );
    break;
    }
    }

4 后记

通过上面这段简单代码,我们就实现了提交对评论输入的用户昵称、评论内容进行了黑名单中的关键词的校验。一旦匹配到了上面的任何一个词语,例如出现了www,那么就提示用户“广告必删,多谢理解!”,效果如下图所示。这样算是又给博客上了一道保险,增强了wordpress反垃圾评论的免疫力,而且还是非插件的方法实现的哟!

wordpress关键词黑名单:反垃圾评论再升级(非插件)上面看上没问题,但是上午 @坏 童鞋一个邪恶测试,发现了上篇文章代码的BUG。晚上下班回来,仔细看了下代码,发现是自己对strpos函数的片面认识,因此做个笔记Mark一下。

2 strpos函数的原型

相信大家对strpos函数并不陌生,经常在字符串的处理中能看到它的身影。strpos函数原型是:

    /*
    * @Para string $source: 在该字符串中进行查找[*]
    * @Para mixed $target: 要查找的字符串;如若不是字符串,将被转换为整型并被视为字符的顺序值[*]
    * @Para int $offset: 查找的起始位置
    * @Return int/boolean: 成功则返回第一次出现的位置; 失败返回 FALSE 值
    **/
    int strpos(string $source, mixed $target [, int $offset = 0 ]);
    

3 strpos函数的简单测试

了解了strpos函数的原型之后,我们先来看一段简单的测试代码。

  

 代码如下 复制代码
  /*
    * @Author: vfhky 2013年09月21日20:35
    * @Description: 通过两个不同的测试变量$test_1和$test_2直击关键
    **/
        $words = "com,cn,info,net,www,http,cc,host,代理,移动,电,国,港,日,购";
    $word = explode(',', $words);
    $num = count($word);
    $test_1 = "购买TT";
    for($i=0;$i< $num ;$i++){
    if (strpos($test_1,$word[$i],0)){
    echo '广告必删,多谢理解!';
    break;
    }
    }
    echo "

----------This is $test_1 END----------

";
    
    $test_2 = "坏坏购买TT";
    for($i=0;$i< $num ;$i++){
    if (strpos($test_2,$word[$i],0)){
    echo '广告必删,多谢理解!';
    break;
    }
    }
    echo "

----------This is $test_2 END----------

";
    ?>

测试结果如下图所示:

再议wordpress反垃圾评论:都是strpos函数惹的祸

再议wordpress反垃圾评论:都是strpos函数惹的祸


4 strpos函数的测试结果分析

上面这段代码中有两个不同的测试变量$test_1和$test_2,并且二者都包含了黑名单中的关键词:购。但是从图中显示的测试结果来看,$test_1变量没有别有效屏蔽,而变量$test_2却被提示包含广告词。奥秘就在于变量$test_1和$test_2中的“购”字出现的位置就!当关键词“购”出现在最前面时($test_1),strpos($test_1,$word[$i],0)函数的执行结果为0,因为“购”字在字符串“购买TT”的最前面。那么for循环中的if语句变成了if(0){},从而不会被视为垃圾评论,这就造成了BUG。下面分别是继续用strpos函数和使用PHP正则表达式,两种方法来实现“wordpress关键词黑名单:反垃圾评论再升级”。
5.1 正确使用strpos函数修正BUG

 代码如下 复制代码

    /*
    * @Author: vfhky 2013年09月24日20:06
    * @Description: 正确使用strpos函数,解决上一篇文章代码的BUG
   
    **/
    $words = "com,cn,info,net,www,http,cc,host,代理,移动,电,国,港,器,服,医,肥,药,农,信,贷,日,购,播";
    $word = explode(',', $words);
    $num = count($word);
    for($i=0;$i< $num ;$i++){
    if ( (strpos($comment_author,$word[$i],0) !== false) || (strpos($comment_content,$word[$i],0) !== false) ){
    err( __('广告必删,多谢理解!') );
    break;
    }
    }

5.2 使用PHP正则表达式修正BUG

   

 代码如下 复制代码
/*
    * @Author: vfhky 2013年09月24日20:06
    * @Description: 使用PHP正则表达式修正BUG,实现“wordpress关键词黑名单:反垃圾评论再升级(非插件)”
  
    **/
    $words = "com,cn,info,net,www,http,cc,host,代理,移动,电,国,港,器,服,医,肥,药,农,信,贷,日,购,播";
    $word = explode(',', $words);
    $num = count($word);
    for($i=0;$i< $num ;$i++){
    if( preg_match("/$word[$i]/i", $comment_author) || preg_match("/$word[$i]/i", $comment_content) ){
    err( __('广告必删,多谢理解!') );
    break;
    }
    }

6 函数strpos的重要提醒

    使用strpos函数还需要注意的一点就是:它可能返回布尔值 FALSE,但也可能返回等同于 FALSE 的非布尔值。
    例如返回整型0,浮点型值0.0,空字符串,字符串 "0",不包括任何元素的数组,不包括任何成员变量的对象,特殊类型NULL等等。
    因此,应使用会检查返回的值的类型的恒等运算符“===”来测试此函数的返回值,而不是使用简单的等号“==”来判别。

7Update 2013.09.26 22:27

经过 @星河大帝 的提醒,可以使用数组来代替字符串,执行效率应该差不多。
7.1 使用strpos函数+数组修正BUG

 代码如下 复制代码

    $words = array("com","cn","info","net","www","http","cc","host","代理","移动","电","国","港","购");
    $num = count($words);
    for($i=0;$i< $num ;$i++){
    if (strpos($comment_author,$words[$i],0) !== false || strpos($comment_content,$words[$i],0) !== false){
    err( __('广告必删,多谢理解!') );
    break;
    }
    }

7.2 使用正则式+数组修正BUG

  

 代码如下 复制代码
  $words = array("com","cn","info","net","www","http","cc","host","代理","移动","电","国","港","购");
    $num = count($words);
    for($i=0;$i< $num ;$i++){
    if( preg_match("/$words[$i]/i", $comment_author) || preg_match("/$words[$i]/i", $comment_content) ){
    err( __('广告必删,多谢理解!') );
    break;
    }
    }

 

相关文章

精彩推荐