网站重复内容的检测及清除方法
作者:admin / 2018-09-06 / 20
        重复内容是指不同的URL链接内容却是相同的,造成重复内容的原因可能是内容的采集,直接使用采集工具采集其他站点内容;网站因为网址不规范,导致网站有多个URL地址可以访问,蜘蛛也同时收录多个重复页面;网站没有设置404错误页面,默认所有的错误链接跳转到首页,这样处理错误链接的方法也导致网站大量重复页面。那么我们应该如何检测重复内容呢?
 
  如果自己站点内部存在重复内容,要检测还是比较容易site:域名,看下搜素引擎是否收录了重复的内容。但是要是检测外部页面是否重复,可以拿页面中的一句话,加上双引号后去搜索引擎查找,如果网络中存在大量的相同句子,点击查看并可知道是否是整篇网页是否重复。往往这样的检测方法比较难,能找出一句话出现在另一篇文章中的可能性低。对于检测一篇文章是否被剽窃,title:+文章标题并可找出相同的文章。那么接下来应该如何消除重复的内容呢?
 
 
  站内的重复内容往往来源于网址不规范,对于网址不规范的问题,最好的解决方法就是301转向,把网站所有的内部链接,规范到统一的URL链接上,减少网站权重的流失。对于是因为版本的不同导致的重复内容,可以使用robots文件屏蔽,禁止蜘蛛抓取不必要的页面,或者不希望收录的链接可以用nofollow标签。
 
  对于商城网站因为产品的大小不同,导致的重复页面收录,可以使用canonical标签,百度支持Canonical标签以后,站长可以通过将 元素和rel="canonical" 属性添加到该网页非规范版本的 部分,为搜索引擎指定规范网页。
        重复内容是指不同的URL链接内容却是相同的,造成重复内容的原因可能是内容的采集,直接使用采集工具采集其他站点内容;网站因为网址不规范,导致网站有多个URL地址可以访问,蜘蛛也同时收录多个重复页面;网站没有设置404错误页面,默认所有的错误链接跳转到首页,这样处理错误链接的方法也导致网站大量重复页面。那么我们应该如何检测重复内容呢?
 
  如果自己站点内部存在重复内容,要检测还是比较容易site:域名,看下搜素引擎是否收录了重复的内容。但是要是检测外部页面是否重复,可以拿页面中的一句话,加上双引号后去搜索引擎查找,如果网络中存在大量的相同句子,点击查看并可知道是否是整篇网页是否重复。往往这样的检测方法比较难,能找出一句话出现在另一篇文章中的可能性低。对于检测一篇文章是否被剽窃,title:+文章标题并可找出相同的文章。那么接下来应该如何消除重复的内容呢?
 
 
  站内的重复内容往往来源于网址不规范,对于网址不规范的问题,最好的解决方法就是301转向,把网站所有的内部链接,规范到统一的URL链接上,减少网站权重的流失。对于是因为版本的不同导致的重复内容,可以使用robots文件屏蔽,禁止蜘蛛抓取不必要的页面,或者不希望收录的链接可以用nofollow标签。
 
  对于商城网站因为产品的大小不同,导致的重复页面收录,可以使用canonical标签,百度支持Canonical标签以后,站长可以通过将 元素和rel="canonical" 属性添加到该网页非规范版本的 部分,为搜索引擎指定规范网页。
【晟杰业务】网站建设、网站设计、服务器空间租售、网站维护、网站托管、网站优化、百度推广、自媒体营销、微信公众号
如有意向---联系我们
热门栏目
热门资讯
热门标签

网站建设 网站优化 网络托管 成功案例 新闻动态 关于我们 联系我们

备案号:苏ICP备17075278号 

公司地址:南京市鼓楼区山西路68号颐和商厦609室 咨询QQ:1518526284 400电话:400-025-1319 手机:18751853571 固话:025-52631933