2013年4月5日,是伊利诺SEO研究中心网站提交各大搜索引擎的第二天,有关各大搜索引擎登录入口在前面已经讲到过,今天,查询各大搜索引擎收录时,发现伊利诺SEO研究中心网站首页已经被谷歌给收录了。然后马上去查看网站日志,在这就跟大家分享下有关网站日志分析从中能够得到什么信息。
昨天,我写了一篇关于360搜索–网站收录情况讲解,在那里面提到360收录新站是非常快的(只是收录首页),在这我就分析下有关其他搜索引擎的情况吧!
在这我只主要分析下:百度蜘蛛与谷歌蜘蛛的一些情况。其他,相关搜索引擎就先不分析了,因为我在日志里面都没发现它们的身影。
下面是有关百度蜘蛛爬取网站时,留下来的记录:
我是昨天下午18:00左右向各大搜索引擎提交网站的,百度在当天23:49分来到我

网站直接访问网站首页,而并没有访问我设置的robots.txt文件,但对于这并没多在意,算算从提交到百度派蜘蛛来访问我网站,两者之间相隔5小时49分,将近6个小时。从这也可以看出,百度现在对新站提交入口的访问速度,还是算快的了,但到现在还没收录网站,这也说明百度现在对新站审核都是比较严格的。
下面是4月5日的记录:

通过上面的图可以看出,百度蜘蛛在昨天23:49访问3次后,在第二天9:05就开始又访问,截至到18:56总共访问28次,在此期间也并没有访问robots.txt协议文件,同样也没有收录网站,通过日志也可以反映出,网站首页被百度放出来是迟早的事,百度蜘蛛爬取的次数非常频繁,比其他蜘蛛要多很多。
接下来,我就来分析下有关谷歌蜘蛛爬取网站记录:

通过上面可以看出,谷歌蜘蛛紧接百度蜘蛛来访问网站,访问时间是4月5日1:07分比百度蜘蛛迟了1小时,但这时间并不是什么重要的因素。从图片中也可以看到谷歌是先访问了我两个xml的网站地图,现在想想有两种可能,一是,wordpress后台我下了个谷歌地图插件和百度地图插件,都是自动生成网站地图的。二是,这两个地址我都放在robots.txt文件里面了。但是谷歌蜘蛛并没访问我robots.txt文件的记录啊。在看看下面,第二次访问本网站是在14:52与第一次访问时间隔的很远,没有百度蜘蛛爬取的频繁,但在谷歌蜘蛛第二次访问网站的时候首先就访问了robots.txt文件,这也看出谷歌是比较尊重robots.txt协议。其次,谷歌蜘蛛又访问了订阅页面和首页。谷歌仅仅访问首页才一次,就把伊利诺SEO研究中心的首页给收录并放出来了。虽然,没有明确的记录出从访问网站到把首页放出来这个时间是多少,但可以看出,谷歌对新站开始收录的审核也不是很严格。
关于网站日志分析就到这了,虽然,分析的一些都并没什么实质性的意义,但至少也是记录这SEO研究中心的成长历程吧!通过网站日志我大胆猜测下,有关谷歌从返大陆,再次进入中文搜索市场,已经在暗自做好准备;其次,360搜索也是在为新的一轮搜索引擎大战努力储备着资源;最后,作为中文搜索老大的百度,也不甘示弱的积极派出百度蜘蛛来爬取新站,也在为今后做准备。新一轮的搜索引擎大洗牌也许正在运量与筹备,苦的也只有我们这些SEOer们啊!
在这,我可要告诫下,那些准备用黑帽SEO的朋友们,在这个时期,请不要在去惹怒搜索引擎哦,都安分点。多提高提高站内质量,不要把重心偏移到站外。也许搜索引擎会继续加大对网站质量的审核与过滤。
=====这个时段的SEOer是“阅读者和分享者”,分享我的所知,收获我所不知====
如果你觉得此文章能够帮您解决问题,您可以点击右侧百度分享,让您的更多好朋友能够学到更多有关SEO知识的技巧。
作者:SEOiit@seo顾问 上海seo顾问修订 2013-04-05
SEOiit(企业seo顾问),专门研究百度seo(搜索引擎优化)技术,让更多喜欢seo的朋友,能从中学习有关seo知识,理解搜索引擎优化真谛。
本文伊利诺SEO研究中心版权所有,未经批准转载必究。
对此文章有什么疑问,可以直接在下面发表评论,如还有其他有关SEO疑问,可以去SEO问答里面发布你的问题。
共有 0 条评论