搜索引擎都会定期的对其数据库进行更新
搜索引擎都会定期的对其数据库进行更新
Google Dance这个名字通常用于描述Google搜索引擎对其主要的索引结果进行更新的过程。每隔36天(一年10次),Google会对其主要的索引结果进行一次更新。不过在今年的5月,Google提前对其搜索结果进行了更新,而且是一次大的更新。
Google的更新过程可以很容易地通过搜索结果的显著变化来识别,通过Google对所有索引页面的网页快照的更新也能够看出来。你可以发现,每一分钟都会有明显的变化。不过Google的更新过程并不是象开关切换那样,从一个索引列表瞬间就可以切换到另外一个索引列表。实际上,Google需要几天的时间来完成对主要搜索结果的更新。
由于Google也和其它搜索引擎一样,以其随时向其访问者提供权威而可靠的搜索结果来赢得客户。这样Google的更新过程就变成一个比较严重的问题。在更新过程中,Google不可能关闭服务器来进行维护,即使是只有一分钟的掉线也会给Google带来不可想象的损失。所以就有了我们现在看到的这个术语--Google Dance。
其实每个搜索引擎都会定期的对其数据库进行更新,以保证提供最新的搜索结果。只是它们的更新周期各有不同而已。但是由于Google作为搜索引擎的龙头,有着巨大的影响力,因此我们对它的更新倍加注意。
在Google的更新过程中,其索引始终在变化,所以它的搜索结果也会有很大的变动。页面等级(PageRank)和返回链接的更新也是在这个时期完成的。
是不是只有搜索结果得到更新?
事实上并不是这样。任何一个更新过程完成之后,Google搜索结果的页面位置都会有一些变化。一方面这是由于Google的网络蜘蛛(spider)一直在活动并不断发现新站点;另一方面是由于一旦网络蜘蛛检测到那些失效的“死”站点,便会将这些站点从其索引列表中删除。而在Google Dance过程中,Google的Robot会对每个已被收录的站点重新进行遍历,计算其链入和链出数,并对这些链接的价值进行评估。然后根据其PageRank系统来计算每个页面的PageRank值,再依据这个数字来重新安排各个站点在列表中的位置。
因为Google总是在遍历和更新其挑选的页面,因此其搜索结果在这一个月内也会有稍微的变化。不过只有在Google Dance期间,其搜索结果才会有幅度较大的变化。你要考虑到Google有8个数据中心,共享着超过一万台的服务器。
由于某种原因,Google索引列表的更新虽然在几天之内完成,但整个搜索结果的更新会持续一个月。无论是对Google还是其它搜索引擎,搜索列表的更新工作自始至终都是必不可少的。这些在进行中所增加的更新,在任一时间内,只会影响索引的一部分而不是全部。