入门客AI创业平台(我带你入门,你带我飞行)
博文笔记

PHP的一个过滤敏感词或脏话的方法

创建时间:2012-04-28 投稿人: 浏览次数:14808

主要使用了  int substr_count ( string haystack, string needle [, int offset [, int length]] )  这个方法,这个方法遍历待测的字符串$str中有没有$allergicWord数组中所包含的敏感词: 

$allergicWord = array("脏话","骂人话");
$str = "这句话里包含了脏话和骂人话";

for ($i=0;$i<count($allergicWord);$i++){
    $content = substr_count($str, $allergicWord[$i]);
    if($content>0){
        $info = $content;
        break;
     }
}

if($info>0){
   //有违法字符 
   return TRUE;
}else{
   //没有违法字符
   return FALSE;
}

如果需要将出现的敏感词替换,比如替换###或者***可以结合substr_replace ( mixed string, string replacement, int start [, int length] )方法使用



=================================================================

关键字的存放形式为txt,txt文件中以这样形式存放:|赌博机|卖血|出售肾|出售器官|眼角膜

<?php
function Filter_word( $str, $fileName )   
{   
    if ( !($words = file_get_contents( $fileName )) ){   
        die("file read error!");   
    }   
    $str = strtolower($str);
 //var_dump($words);
 $word = preg_replace("/[1,2,3]
|
/i", "", $words);
 //$wor = substr($word,0,-1);
 //$w = preg_replace("|/|i", "/", $word);
 //echo "<pre>";
 //var_dump($w);
 //$words = "赌博机|卖血|出售肾|出售器官|眼角膜";
    $matched = preg_replace("/".$word."/i", "***", $string);
 return $matched; 
}   
  
$content = "<a href="#">我要卖血fsdf卖血d 赌博机wo眼口交膜</a>";   
if ($result = Filter_word($content, "./words.txt") ){
 echo $result;
    echo "替换成功 ";   
}else{   
    echo "替换失败! ";   
} 

 

?>





 

声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。