• Blogging News
  • Blogging Resource
  • Blogging tips
  • Blogging tutorials
  • Interview
  • Links Post
  • Personal logs
  • Reviews
  • WordPress Tips
  • Blogging Tips — 防止博客内容被重复收录

    如果没有经过适当的处理和优化,WordPress博客中将有很多内容重复的页面,而这些重复内容会不利于搜索引擎的索引。本文整理和归纳了关于重复收录的一些资料和好的建议,将全面分析解决博客内容被重复收录的途径:

    1. WordPress博客中有哪些重复内容

    (a) 首页显示的文章与独立文章页面的重复(特别是首页输出全文的blog)

    (b) 分类页面和独立文章页面的重复:WP博客中,可以通过分类页存档页来访问一篇文章,因此你的某篇文章会有不止一个url(如下), 从而造成重复收录。

    www.yoursite.com/2008/01/post-name

    www.yoursite.com/category/wordpress

    (c) 对于很多博客,www.yoursite.com yoursite.com都可以访问,而没有做跳转,你访问这两个地址将得到同样的结果,相当于整个站的重复。

    (d) google眼中,www.example.com/page www.example.com/page/是不同.

    (e) 文章内容和feed内容的重复,比如:

    www.yoursite.com/2008/01/post-name

    www.yoursite.com/2008/01/post-name/feed

    以上是第一部分,翻译自:Wordpress Duplicate Content Issues & Solutions

     

    2. “重复收录带来的影响

    如果没有做好优化,导致被搜索引擎收录了大量重复内容将会不利于你的排名,可能会被列入google的补充材料,同时也有可能被搜索引擎惩罚。

    关于补充材料,这里友情推荐一篇月光翻译的 :《逃离Google补充材料的五个技巧
    3. 如何避免博客内容的重复收录

    (1)设置你的All in One SEO插件。

    (2)在服务器上添加robots.txt文件。

    以上两个建议的具体步骤请参阅这里:《 防止搜索引擎添加补充材料和重复内容

    (3)针对 wwwnon-www的问题可以通过 这个插件来解决:enforce www ,还可以使用谷歌网站管理员工具进行设置,告诉搜索引擎你想要那种索引方式。

    关于后者你可以参阅这篇比较权威的文章: 《 巧妙地处理内容重复

    4)国外blogger使用较多的插件:wordpress duplicate content

    相关文章:Two Plugins to Help Fight Duplicate Content ,由于这篇文章比较简单,我这里就没有翻译,感兴趣的博友可以看一下。

    5)个人比较推荐的方法:

    实行以上的 1 23步,不安装其它插件,而是对主题进行部分优化:除了单篇文章页面本身, 其他页面显示文章的时候都不要全文输出, 而代之以摘要。原因请看这里:
    < 关于WordPress重复内容处理插件的问题> 英文原文:WordPress, Duplicate Content, and Wrong SEO Plugins

    当然,如何避免重复收录并没有一个标准的方法,以上是我整理的一些好的建议和帮助,如果你还有更好的见解,欢迎你留下你的评论 ^.^

    如果你喜欢本文,想继续关注 《Blogging Tips系列文章》,可以考虑订阅本博客,”后80花园“会陆续为你翻译和创作更多博客技巧类文章,致力于探讨国外优秀的经验,供大家一起学习借鉴。

    Related posts

    11条留言

    • At 2008.02.26 03:03, Estyle(靳田≌李薇) said:

      介个问题我倒是没有认真想过。
      恩,学习了先……
      不过,有些问题仿佛是GOOGLE应该去考虑的,或者说SE以后可能会改善,所以现在去CARE它们仿佛有些“怪怪的”,比如1(d)这种。SEO着了魔,也算是一种境界,呵呵。
      虽然偶不懂SEO,但还是可以随便说几句:
      3,(1),没用过,不知道是啥玩意儿;
      3,(2),机器人文件是王道!(原理上应该是这样。)
      3,(3),介个是解析记录设置的问题,应该可以直接解决,为啥要绕弯弯呢?
      另外,程序也有责任,1(b)这样的情况应该是可以避免的,不过应该也可以逐步改善的,就看作者有没有那份心。程序太火了,“准BUG”倒成了个研究话题,慢慢也就淡忘了那是可以FIX的,大家乐此不疲。网络就是介样~~~

      BTW:说点其它的。今天下午1点半左右的时候,华为(成都)有人跳楼了,恰好就在我们公司旁边。消息迅速传开,两个小时候,连上海的同事都来MSN问我们情况了,大家一片八卦。网络,确实很强大!

      • At 2008.02.26 03:20, Moon said:

        @:同意你的观点,至于3.(3)插件作者的目的可能是为了方便一些新手吧。ps:的确WP正越来越受欢迎,插件也数以千计,呵呵..

    • At 2008.02.26 04:23, ruosen said:

      其实只要是最先被收的就不用考虑这些了,所以ping一下gg的博客搜索服务器还是最简单的方法。

    • At 2008.02.26 05:50, anliu said:

      抗议!!呵呵
      博主我们还有不是WP的用户的,不过你的文章可以联想到z-blog相关插件的

      anliu’s last blog post..SkyDrive:微软推出5GB免费在线储存服务

    • At 2008.02.26 07:03, 涌泉 said:

      现在抄袭那么严重,自己做得再好也免不了有时候别人抄的反而占据了更好的位置,唉。

      • At 2008.02.27 03:23, Moon said:

        这倒的确是,这种事情经常听说,抄袭的反而排到了前面

        • At 2008.03.02 19:44, 博X said:

          同意,抄袭的靠前很正常.
          收录重复的现象好象好转了.

    • At 2008.02.26 10:00, Heyi said:

      我是将heyi.us, heyi.biz通过301重定向到heyi.name的主域的,当然包括non-www.heyi的域,这样很利于排名和流量转化。

      Heyi’s last blog post..Google AdSense TH Online 标准条款

    • At 2008.02.27 06:20, Newslinking said:

      话说重复收录的责任很大程度还在于搜索引擎本身
      所以我觉得这个问题应该由搜索引擎公司自己负责
      可惜咱们用户永远都是弱者:-(

      Newslinking’s last blog post..超乎想象的手机——Nokia Morph

      • At 2008.02.27 20:31, Moon said:

        I could’t agree more.搜索引擎本身应该做好这方面的工作,这本不是用户需要考虑的问题,不过既然现在存在这个问题,我们自己只能做好相应的应对措施^.^

    • At 2008.02.28 18:48, GooMoo said:

      我的好像被重复收录的太多了。

      GooMoo’s last blog post..~

    (Required)
    (Required, not published)

    Who is behind this blog?

    My name is Jacky,a college student in China at present.Blogging is one of my hobbies.I ran this blog to bring in useful blogging tips and skills from the top bloggers in foreign countries since I find there still remains a gap between our chinese blogs and foreigners'.I also want to help the greenhands who have just started blogging and may be not familiar with wordpress.I am looking forward to being your friend.Feel free to connect with me.