网站内容的重复和如何消除

点评:网站内容重复是百度K站的一个主要原因。但是,有些人不知道情况是怎样的,我认为网站内容的重复不仅仅是网站本身的两篇或更多的文章,还有很多方面。本文介绍了几种常见的情况,并指出了一些不足之处。




第一,网站内容的重复:
1,同一篇文章有多个URL,即使这篇文章是原创的,也会受到百度的惩罚。

2、网站内容为收集,本网站将重复作为收集站直接由百度关闭,百度的新绿色算法致力于打击收藏网站。

3,网站上有太多固定页面出现。很多网站的右边总是固定一些栏目或栏目。这些栏目的内容从不更新,或者每一页的内容都是头版内容相同。

4,没有设置404个错误页面,当我们删除一个页面时,必须使用404状态代码给用户和蜘蛛一些提示,如果代码设置得不正确,那么删除页面中的蜘蛛是虚构的,因此它已经包含了。

5、动态页面和静态共存,百度抓取到目录中包含大量动态页面。

6、网站内容主要是图片。几乎没有词。许多图片共享URL地址。所以蜘蛛很难保证它们在索引时不会重复。

重复内容是不同URL链接的内容相同,包含多个重复页面,并引入多个页面,但是网页的一般内容是相同的,因此处理的方式是错误的。

二是检测重复内容的方法
1。为了检查文章是否重复,标题:+文章标题可以找到同一篇文章。

2,取一段文字,百度搜索,大量的红色字母,表示文章的高度重复。

3、站内搜索,你可以找到一些内容。

4,使用一些页面相似性检查工具判断相邻页面的相似性,超过80%的相似度需要处理一些固定的列。

三。如何消除重复内容
1。原始内容的增加
对于网站内容大多是收集或简单的伪原创网站,企业赢001推荐增加原创文章的内容,而不是百度收录较少,不要让百度吐出以前的文章。

2。网站固定栏目内容的随机显示
根据文本的关键词,我们可以随机调用右栏内容,使每一页内容不同,避免了许多页面的高相似度。

三.设置404页
通知用户和搜索引擎页面不存在,防止搜索引擎收录大量链接。

4。页面设置独立的元标记。
关键字,标签,描述,每个页面需要不同,可以手动修改,或者按照一定的规则集。