1.PageRank算法概述:
页面排名,或者Page rank,也叫PageRank,Google左排名或者PageRank。
这是谷歌创始人拉里·佩奇(Larry;佩奇)和谢尔盖·布林(谢尔盖;Brin)在1997年构建早期搜索系统的原型时提出了链接分析算法。自从Google在商业领域取得空之前的成功,这个算法也成为了其他搜索引擎和学术界关注的计算模型。目前很多重要的链接分析算法都是从PageRank算法中衍生出来的。PageRank是Google用来识别网页排名/重要性的方法,也是Google用来衡量网站质量的唯一标准。在整合了标题、关键词等所有其他因素后,Google通过PageRank调整搜索结果,让那些“排名/重要性”更高的页面在其他搜索结果网站中排名更高,从而提高搜索结果的相关性和质量。它的水平从0到10,10是满分。PR值越高,页面越受欢迎(也越重要)。比如PR值1表示站点不是很受欢迎,PR值7到10表示站点很受欢迎(或者很重要)。一般的PR4,就算是好网站。Google将其网站的PR值设为10,说明Google是一个非常受欢迎的网站,也可以说这个网站非常重要。
2.从入站链接到页面排名的计数:
在PageRank提出之前,已经有研究者提出利用网页中的链接数来分析计算链接。如果一个网页有更多的链接,那么这个网页就更重要了。在早期,许多搜索引擎也采用链接数作为链接分析方法,这对提高搜索引擎的效果也起到了重要作用。PageRank不仅考虑了链接数量的影响,还涉及到网页的质量。这两种方法的结合使得网页的重要性得到了更好的评价标准。
网页排名计算基于以下两个基本条件:
(1)数量if:在Web图模型中,如果一个页面节点从其他页面接收到更多的传入链接,那么这个页面更重要。
(2) 质量如果:链接到页面a的质量不同,高质量的页面将通过链接向其他页面传递许多其他权重。所以高质量的页面指向a页越多,a页就越重要。
(2)质量如果链接到页面A的质量不同,高质量的页面会通过链接把很多其他权重传递到其他页面。所以,优质页面越指向A页,A页就越重要。
3.基本概念
(1)脱离链条
如果网页B的超链接B-Link附在网页A上,用户在浏览网页A时可以点击B-Link,然后进入网页B..以上a与B链相连的情况表明a脱离了B链..可以看出,网页a也可以脱离链接C,如果a也附带了网页C的超链接C-Link。
(2)入链
点击网页a中的B-Link进入B,表示a进入B链..如果用户自己在浏览器输入栏输入网页B的URL,然后输入B,则意味着用户通过输入URL进入了链B
(3)无连锁
如果网页A中没有附加到其他网页的超链接,则表示A没有脱离链接