
第四节
1、
PageRank计算页面的重要性,对每个链入(inbound)赋以不同的权值,链接提供页面的越重要则此链接入越高。当前页的重要性,是由其它页面的重要性决定的。
页面等级是Google用来评价一个网站重要程度的方法。当考虑完其他的因素,如标题和关键词,Google就利用页面等级技术来判断一个网站的重要程度以决定这个网站在用户搜索结果中应处于什么位置。
下面是Google搜索引擎工作的基本步骤:
1) 找出符合搜索关键词的所有网页。
2) 根据网页内容如关键词对搜索结果排序。
3) 根据页面等级分数调整查询结果的排序。
当然实际操作还要复杂的多,在后面对此还要做更深入的讨论。但是就目前来说,上面的描述已经足够了。因为页面等级是一个乘数而不是简单与其他分数相加,所以如果你的页面等级分数是零,那么你的页面总分数也就为0,在搜索结果中你的网页就会排在最后的位置。
2、
在Google的页面等级算法中,如果网页A提供网页B的链接则假设网页A认为网页B是重要的。一个网页的等级分数会考虑到对这个网页提供链接的其他网页的重要性,如果很多重要的网页提供对这个网页的链接,那么这个网页就被认为是重要的,这个网页的等级分数也会大大提高。同时这个网页所链接的其他网页也随之变得重要。而网页中的实际内容则与页面等级没什么联系。
3、
如果想知道一个网页的页面等级,你可以从http://toolbar.google.com下载一个能够嵌入在Internet浏览器里的页面等级查看工具。安装好后,在浏览器的上方会有一个图案条,它可以显示你正在浏览网页的页面等级。把鼠标移到图案条上时,图案条上会显示一个从一到十的数字。这就是你所浏览网页的页面等级。如果你不能看到所浏览网页的页面等级,你可能安装了一个旧版本的页面等级查看工具。这时你需要先卸载所安装的页面等级查看工具,重新启动计算机。然后安装最新版本的页面等级查看工具。做完这一切后,你就可以从工具中看到你正在浏览的网页的页面等级。
在显示所浏览网页的实际页面等级的时候,Google的页面等级查看工具并不是很准确的。但是到现在为止也只能从它来得到对页面等级的一些人士。只要你知道这个工具的局限性,至少可以知道你在看什么。
Google的页面等级查看工具的两个主要局限:
1.页面等级查看工具的结果具有猜测性:如果你打开一个网页,这个网页并没有存在于它的网页列表中。但是网页列表中存在一个与你打开的相似的网页,它就会据此来猜测你打开网页的等级。这种猜测的结果对于我们是没有价值的,因为任何页面等级算法都不会这样做。想要知道所显示的页面等级是不是猜测的只有一个方法,把你所查看网页的URL输入Google的搜索框。如果在搜索结果中没有你所查看的网页,那么这个页面等级就是猜测的。
2.网页查看工具的结果只是实际页面等级的一种线性表示:网页查看工具的结果是线性的,而页面等级在Google里实际上是用非线性图来描述的。这样,在网页查看工具里,从等级2到等级3所提高的网页分数实际上要小于从等级3提高到等级4所提高的网页分数。我们可以从下面的对比表格里看到这种现象,Google里实际使用的标准还是保密的。
If the actual
PageRank is
between
0.00000001 and 5
6 and