PHP实现用汉字比判断垃圾注释的方法
本文介绍了PHP实现通过汉字比例判断垃圾评论的方法,供大家参考,具体的实现方法如下:1。需求:
最近一段时间经常出现这类垃圾邮件:在一个或两个罕见的汉字英文字符包括中文、字符、敏感词但不包含什么中国,通过评论过滤庄严。这种评论的处理可以通过汉字的比率来确定,但会有一个一定的误判。
两。解决方案:
使用PHP中的两个函数,strlen和mb_strlen,strlen将确定一个汉字的长度为3,并在相同的特征和功能之间的长度差1 mb_strlen.the单个汉字是两倍的实际的汉字和字符的实际数量是由将得到的两。汉字的总数量的汉字的比例由mb_strlen得到的长度比得到的。
三。实现代码:
复制代码如下:len_all美元= strlen($评论中的{ });
len_st美元= mb_strlen($评论{中},'utf-8);
如果(($ len_all至len_st)/(2×len_st美元)<0.5){
$ =小于百分之五十的汉字;
}
如果代码在注释中被张贴,那么汉字的比例就低了,代码字段需要过滤来判断。
希望本文能对大家的PHP程序设计有所帮助。