PHP实现用汉字比判断垃圾注释的方法

本文介绍了PHP实现通过汉字比例判断垃圾评论的方法,供大家参考,具体的实现方法如下:

1。需求:

最近一段时间经常出现这类垃圾邮件:在一个或两个罕见的汉字英文字符包括中文、字符、敏感词但不包含什么中国,通过评论过滤庄严。这种评论的处理可以通过汉字的比率来确定,但会有一个一定的误判。

两。解决方案:

使用PHP中的两个函数,strlen和mb_strlen,strlen将确定一个汉字的长度为3,并在相同的特征和功能之间的长度差1 mb_strlen.the单个汉字是两倍的实际的汉字和字符的实际数量是由将得到的两。汉字的总数量的汉字的比例由mb_strlen得到的长度比得到的。

三。实现代码:

复制代码如下:len_all美元= strlen($评论中的{ });

len_st美元= mb_strlen($评论{中},'utf-8);

如果(($ len_all至len_st)/(2×len_st美元)<0.5){

$ =小于百分之五十的汉字;

}

如果代码在注释中被张贴,那么汉字的比例就低了,代码字段需要过滤来判断。

希望本文能对大家的PHP程序设计有所帮助。