乌拉,Google Sitemaps

百无聊赖地输入“site:go.6to23.com/nftx/blog/”,居然有54项搜索结果了,真是出乎意料的好。

前阵子在右侧栏加了“站内搜索”,一直没作介绍,原因是对msn search的搜索能力实在不敢恭维。虽然msn search收录了本站80个页面,但在关键词的提取上,似乎有点弱智。比如输入“ice”,那么会有结果;但输入“老六”的话,就不行了。简直是歧视啊。

但没办法,此前各大搜索引擎大都没有收录本站,原因各有不同,能找到一个收录了80页的,已经是天上掉下来的馅饼了,哪还容得我挑三拣四、说三道四。

多少有点不甘心,绞尽脑汁想啊想,最后想出了一个办法:Google Sitemaps

Sitemaps 协议使您能够告知搜索引擎您网站中可供抓取的网址。最简便的方式就是,使用 Google Sitemaps 协议的 Sitemaps 就是列有某个网站所有网址的 XML 文件。此协议可高度扩展,因此可适用于各种大小的网站。它还能够使网站管理员提供有关每个网址的其他信息(上次更新的时间、更改的频率、与网站中其他网址相比它的重要性)以便搜索引擎可以更智能地抓取该网站。

简单的说,就是写一个xml文件,把网站上的链接都列进去,然后提交给google,google就根据该文件,去抓取网站上的页面。当然,google不保证任何东西。

手工写这样一个文件无疑是不理智的,好在经过研究,发现Google Sitemaps支持Atom:

Google 接受使用 link并修改日期字段的 RSS 2.0 和 Atom 0.3 供稿。如果以这些格式之一对网站使用联合供稿馈送,则可以提交馈送的网址以便使 Google 了解网站最近更改。Google 使用馈送中的 link字段从网站收集网址,并使用修改日期字段(RSS 馈送的 pubdate字段和 Atom 馈送的 modified日期)来了解每个网址的最后修改时间。可以根据需要使用修改日期字段。请确保供稿请确保馈送位于想要搜索引擎抓取的最高级目录。

这可就很方便了,我的blog生成的正是Atom 0.3,最妙的是,我可以通过调整参数,让blogger.com为我生成一个包含全部blog链接的atom文件。

于是乎,一番操作之后,我颤抖着手,按下了submit按钮,听啊,十月革命一声炮响……咦,一天、两天、三天,哑炮不成?为啥老搜索不到东西的?我不由有点沮丧地挠挠头。

虽然不能立竿见影,但我还是坚持不懈地更新sitemap文件,浇浇水,施施肥,剪剪枝叶,日子就这么一天天过去,忽然,某一日,我揉揉眼睛,啊,葫芦娃出世了……不是,能google到我的blog了。

这段时间,应该在一周以上。

仰天大笑三声,以示得意。

2005.09.09

相关文章

发表留言

*的为必填项

*

*

输入你的留言: