PR是PageRank的缩写.Google PR理论是所有基于链接的搜索引擎论中最有名的.SEO人员可能不清楚其他链接的理论.但不可能不知道PR.

PR是Google创始人之一拉里佩奇发明的,用地表示页面重要性的概念.用最简单的话说就是,反向链接越多的页面就是越重要的页面,国此PR值也就越高.

Google PR有点类似于科技文献中互相引用的概念,被其他文献引用较多的文献,很可能也是比较重要的文献.

这里只说说PR的概念和计算.

我们可以把互联网理解为由结点及链接组成的有向图,页面就是一个个结点,页面之间的有向链接传递着页面的重要性.一个链接传递的PR值决定于导入链接所在页面的PR值,发出链接的页面本身PR值越高,所能传递出去的PR也越高.传递的PR数值也取决于页面上的导出链接数目.对于给定PR值的页面来说,假设能传递到下级页面100份PR,页面上有10个导出链接,每个链接能传递10份PR,页面上有20个导出链接的话,每个链接只能传递5份PR.所以一个页面的PR值取决于导入链接总数,发出链接页面的PR值,以及发出链接页面上的导出链接数目.

PR值计算公式是

PR(A)=(1-d)+d(PR(t1)/C(t1)+…+PR(tn)/C(tn)

A代表页面A.

PR(A)则代表页面A的PR值

d为阻尼指数。通常认为d=0.85

t1…tn 代表链接向页面A的页面t1到tn

C代表页面上的到处链接数目。C(t1)即为页面t1上的到外链接数目.

从概念及计算公式都可以看到,计算PR值必须使用迭代计算.页面A的PR值取决于链接的A的页面t1到tn页面的PR值,而t1到tn页面的PR值又取决于其他页面的PR值,其中很可能还包含页面A.所以PR需要多次迭代才能得到.计算时先给所有页面设定一个初始值,经过一定次数的迭代计算后,各个页面的PR值将趋于稳定.研究证明,无论初始值怎么选取,经过迭代计算的最终PR值不会受到影响.

对阻尼系数做个简要说明.考虑如下所示这样一个循环(实际网络上是一定存在这种循环的).

Y->A->B->C->D->A

外部页面Y向循环注入PR值,循环中页面不停迭代传递PR,如果没有阻尼系数,循环中的页面PR将达到无穷大.引入阻尼系数,使PR在传递时自然衰减,才能将PR计算稳定在一个值上.