Blogging Tips — 防止博客内容被重复收录
如果没有经过适当的处理和优化,WordPress博客中将有很多内容重复的页面,而这些重复内容会不利于搜索引擎的索引。本文整理和归纳了关于“重复收录“的一些资料和好的建议,将全面分析“解决博客内容被重复收录“的途径:
1. WordPress博客中有哪些“重复内容“
(a) 首页显示的文章与独立文章页面的重复(特别是首页输出全文的blog)
(b) 分类页面和独立文章页面的重复:在WP博客中,可以通过分类页和存档页来访问一篇文章,因此你的某篇文章会有不止一个url(如下), 从而造成重复收录。
www.yoursite.com/2008/01/post-name
www.yoursite.com/category/wordpress
(c) 对于很多博客,www.yoursite.com和 yoursite.com都可以访问,而没有做跳转,你访问这两个地址将得到同样的结果,相当于整个站的重复。
(d) 在google眼中,www.example.com/page 和 www.example.com/page/是不同.
(e) 文章内容和feed内容的重复,比如:
www.yoursite.com/2008/01/post-name
www.yoursite.com/2008/01/post-name/feed
以上是第一部分,翻译自:《Wordpress Duplicate Content Issues & Solutions》
2. “重复收录”带来的影响
如果没有做好优化,导致被搜索引擎收录了大量重复内容将会不利于你的排名,可能会被列入google的补充材料,同时也有可能被搜索引擎惩罚。
关于补充材料,这里友情推荐一篇月光翻译的 :《逃离Google补充材料的五个技巧》
3. 如何避免博客内容的重复收录
(1)设置你的All in One SEO插件。
(2)在服务器上添加robots.txt文件。
以上两个建议的具体步骤请参阅这里:《 防止搜索引擎添加补充材料和重复内容》
(3)针对 www和non-www的问题可以通过 这个插件来解决:enforce www ,还可以使用谷歌网站管理员工具进行设置,告诉搜索引擎你想要那种索引方式。
关于后者你可以参阅这篇比较权威的文章: 《 巧妙地处理内容重复》
(4)国外blogger使用较多的插件:wordpress duplicate content
相关文章:Two Plugins to Help Fight Duplicate Content ,由于这篇文章比较简单,我这里就没有翻译,感兴趣的博友可以看一下。
(5)个人比较推荐的方法:
实行以上的 1 、2、3步,不安装其它插件,而是对主题进行部分优化:除了单篇文章页面本身, 其他页面显示文章的时候都不要全文输出, 而代之以摘要。原因请看这里:
< 关于WordPress重复内容处理插件的问题> 英文原文:《WordPress, Duplicate Content, and Wrong SEO Plugins》
当然,如何避免重复收录并没有一个标准的方法,以上是我整理的一些好的建议和帮助,如果你还有更好的见解,欢迎你留下你的评论 ^.^
如果你喜欢本文,想继续关注 《Blogging Tips系列文章》,可以考虑订阅本博客,”后80花园“会陆续为你翻译和创作更多博客技巧类文章,致力于探讨国外优秀的经验,供大家一起学习借鉴。
- Trackback
- Add to Mister Wong
- Technorati
- Add to Del.icio.us

Favorite posts
Popular posts











介个问题我倒是没有认真想过。
恩,学习了先……
不过,有些问题仿佛是GOOGLE应该去考虑的,或者说SE以后可能会改善,所以现在去CARE它们仿佛有些“怪怪的”,比如1(d)这种。SEO着了魔,也算是一种境界,呵呵。
虽然偶不懂SEO,但还是可以随便说几句:
3,(1),没用过,不知道是啥玩意儿;
3,(2),机器人文件是王道!(原理上应该是这样。)
3,(3),介个是解析记录设置的问题,应该可以直接解决,为啥要绕弯弯呢?
另外,程序也有责任,1(b)这样的情况应该是可以避免的,不过应该也可以逐步改善的,就看作者有没有那份心。程序太火了,“准BUG”倒成了个研究话题,慢慢也就淡忘了那是可以FIX的,大家乐此不疲。网络就是介样~~~
BTW:说点其它的。今天下午1点半左右的时候,华为(成都)有人跳楼了,恰好就在我们公司旁边。消息迅速传开,两个小时候,连上海的同事都来MSN问我们情况了,大家一片八卦。网络,确实很强大!
@:同意你的观点,至于3.(3)插件作者的目的可能是为了方便一些新手吧。ps:的确WP正越来越受欢迎,插件也数以千计,呵呵..
其实只要是最先被收的就不用考虑这些了,所以ping一下gg的博客搜索服务器还是最简单的方法。
抗议!!呵呵
博主我们还有不是WP的用户的,不过你的文章可以联想到z-blog相关插件的
anliu’s last blog post..SkyDrive:微软推出5GB免费在线储存服务
现在抄袭那么严重,自己做得再好也免不了有时候别人抄的反而占据了更好的位置,唉。
这倒的确是,这种事情经常听说,抄袭的反而排到了前面
同意,抄袭的靠前很正常.
收录重复的现象好象好转了.
我是将heyi.us, heyi.biz通过301重定向到heyi.name的主域的,当然包括non-www.heyi的域,这样很利于排名和流量转化。
Heyi’s last blog post..Google AdSense TH Online 标准条款
话说重复收录的责任很大程度还在于搜索引擎本身
所以我觉得这个问题应该由搜索引擎公司自己负责
可惜咱们用户永远都是弱者:-(
Newslinking’s last blog post..超乎想象的手机——Nokia Morph
I could’t agree more.搜索引擎本身应该做好这方面的工作,这本不是用户需要考虑的问题,不过既然现在存在这个问题,我们自己只能做好相应的应对措施^.^
我的好像被重复收录的太多了。
GooMoo’s last blog post..~