首页 > 常识 > 互联网 > 网站制作 > 网站推广

百度蜘蛛可能不喜欢抓取长地址

作者:shenghuobaodian.com  时间:2015-09-21
描述:我想把这次事件看作是百度善意的提醒,但是又害怕这样去想是自做多情。因此,我揣测大多可能是百度蜘蛛可能不喜欢抓取长地址的缘故。

2015年9月21日,我上百度看看《生活宝典》网页的收录情况,发现还是与前几次看到的情况一样,都是只有《生活宝典》的首页和某一篇文档的标题,没有这一文档的地址(只是首页的地址)。不过这次我多查看了几篇,竟然发现“揉捏手指 提神醒脑”一文被收录了,同时也看到地址省掉了“www”,形式如:http://shenghuobaodian.com/Health/Maintenance/6/1237.html

我想把这次事件看作是百度善意的提醒,但是又害怕这样去想是自做多情。因此,我揣测大多可能是百度蜘蛛可能不喜欢抓取长地址的缘故。

以前,我在Google里看看《生活宝典》网页的收录情况,发现不仅收录的寥寥无几,甚至连个首页也找不到,接下来,我有一次发现,有一篇文档有幸被收录了,但是除文章标题外,又多添加了“生活宝典”四个字,我想,难道是Google蜘蛛在提醒我,不收录的原因是你的页面标题没有按照标准规范来做,所以才不收录了。但是,我还是不解,难道蜘蛛有那么聪明吗?还或许是Google的工作人员有意提醒了我一下呢?这一次,我是坚持了自己的原则:我做的网站是给广大用户看的,并不是只给搜索引擎看的,不能够为了收录而去“讨好”或者是“迁就”搜索引擎的。首页、频道、栏目都加有“生活宝典”,内容页不加“生活宝典”字样,这样,文档的标题字数就节约了,算起来,整个网站就节约了不少空间呢。(后续补充:这篇文章是9月21日写的,10月国庆节放假期间,我又上Google发现,又多了一些页面给收录了,不过,原本内容页标题是没有网站名称的,Google在收录时候都把内容页标题上加上了“生活宝典”。再仔细想想,是啊,我有我的考虑,但搜索引擎也有它的考虑,因为它要告诉用户这个链接是来源于哪个网站的,是搜索引擎行业的标准规范做法。为了对搜索引擎显示友好合作,我又主动将内容页标题上都加上网站的名称了。

不管是不是自做多情,象“www.shenghuobaodian.com”这样的长域名是比较适合去掉前面三个www字母的,从节约的角度来讲,总是件好事情。想到此,我赶紧登陆后台,把一些可以手动做到各频道地址前面的都及时去掉重新生成了。内容页地址前面的三个www字母保持着,这是因为有其他的原因以及还有百度之外的其他很多搜索引擎在收录的时候是都有三个www字母的,去掉了虽然不影响访问到,但是这样变来变去的,又怕其他的蜘蛛不高兴了怎么办?

以“shenghuobaodian.com”呈现于观众面前比“www.shenghuobaodian.com”更加让人感觉清晰、容易记忆。

这件事情给我留下的启发是,小事情也会潜藏着巨大的价值,只要多想它。

从手机浏览器访问《生活宝典》

站内搜索
  • DIV+CSS网页布局 让搜索引擎蜘蛛不再累
  • 微商帮
    世界网站大全
    中国科研团队:大象的长鼻子是如何越变越长了
    中国科研团队:大象的长
    自己是否能够像自己想的那样做成一件事,身旁人的判断会比自己准确
    自己是否能够像自己想
    火宫殿:吃喝玩乐看,烧香拜神佛,红火的庙会经济
    火宫殿:吃喝玩乐看,烧香
    眼见为实也不为实,更须谨慎看到的并非全貌
    眼见为实也不为实,更须