PHP实现用汉字比判断垃圾注释的方法

本文介绍了PHP实现通过汉字比例判断垃圾评论的方法，供大家参考，具体的实现方法如下：

1。需求：

最近一段时间经常出现这类垃圾邮件：在一个或两个罕见的汉字英文字符包括中文、字符、敏感词但不包含什么中国，通过评论过滤庄严。这种评论的处理可以通过汉字的比率来确定，但会有一个一定的误判。

两。解决方案：

使用PHP中的两个函数，strlen和mb_strlen，strlen将确定一个汉字的长度为3，并在相同的特征和功能之间的长度差1 mb_strlen.the单个汉字是两倍的实际的汉字和字符的实际数量是由将得到的两。汉字的总数量的汉字的比例由mb_strlen得到的长度比得到的。

三。实现代码：

复制代码如下：len_all美元= strlen（$评论中的{ }）；

len_st美元= mb_strlen（$评论{中}，'utf-8）；

如果（（$ len_all至len_st）/（2×len_st美元）＜0.5）{

$ =小于百分之五十的汉字；

}

如果代码在注释中被张贴，那么汉字的比例就低了，代码字段需要过滤来判断。

希望本文能对大家的PHP程序设计有所帮助。