题目内容 (请给出正确答案)
[主观题]

PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当

网页甲有一个链接指向网页乙,就认为乙获得了甲对它贡献的分值,该值的多少取决于网页甲本身的重要程度,即网页甲的重要性越大,网页乙获得的贡献值就越高。由于网络中网页链接的相互指向,该分值的计算为一个迭代过程,最终网页根据所得分值进行检索排序。

互联网是一张有向图,每一个网页是图的一个顶点,网页间的每一个超链接是图的一个边,邻接矩阵B=(b)w如果从网页i到网页j有超链接,则by=1,否则为0。

记矩阵B的列和及行和分别是PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当网页它们分别给出了页面j的链人链接数目和页面i的链出链接数目。假如在上网时浏览页面并选择下一个页面的过程,与过去浏览过哪些页面无关,而仅依赖于当前所在的页面。那么这一-选择过程可以认为是一一个有限状态、离散时间的随机过程,其状态转移规律用Markov链描述。定义矩阵A=(ay)wxn为PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当网页式中:d是模型参数,通常取d=0.85;A是Markov链的转移概率矩阵;ay表示从页面i转移到页而j的概率。根据Markov链的基本性质,对于正则Markov链存在平稳分布x=PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当网页式中:x为在极限状态(转移次数趋于无限)下各网页被访问的概率分布,Google将它定义为各网页的PageRank值。假设x已经得到,则它按分量满足方程PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当网页网页i的PageRank值是划,它链出的页面有τ个,于是页面i将它的PageRank值分成r份,分别“投票"给它链出的网页。x为网页k的PageRank值,即网络上所有页面“投票给网页k的最终值。根据Markov链的基本性质还可以得到,平稳分布(即PageRank值)是转移概率矩阵A的转置矩阵AT的最大特征值(=1)所对应的归一化特征向量。

已知一个N=6的网络如图4.8所示,求它的PageRank取值。

PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当网页

查看答案
如搜索结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能会需要:
您的账号:
发送账号密码至手机
发送
更多“PageRank算法是基于网页链接分析对关键字匹配搜索结果进…”相关的问题

第1题

关于PageRank标准算法与简化算法正确的是()
A、PageRank简化算法对G中的每一个节点n,设定其初始值均为1/n

B、PageRank标准算法不考虑没有超链接网页的情况

C、PageRank简化算法可以保证迭代过程中的PageRank值之和为1

D、在实际运算过程中,由于节点数n的值巨大,因此通常采用适用于稀疏矩阵运算的PageRank标准算法来对运算过程进行改善

点击查看答案

第2题

关于PageRank标准算法与简化算法正确的是()。
A、PageRank简化算法可以保证迭代过程中的PageRank值之和为1

B、PageRank简化算法对G中的每一个节点n,设定其初始值均为1/n

C、在实际运算过程中,由于节点数n的值巨大,因此通常采用适用于稀疏矩阵运算的PageRank标准算法来对运算过程进行改善

D、PageRank标准算法不考虑没有超链接网页的情况

点击查看答案

第3题

关于PageRank标准算法与简化算法正确的是()。
A、PageRank标准算法不考虑没有超链接网页的情况

B、PageRank简化算法对G中的每一个节点n,设定其初始值均为1/n

C、PageRank简化算法可以保证迭代过程中的PageRank值之和为1

D、在实际运算过程中,由于节点数n的值巨大,因此通常采用适用于稀疏矩阵运算的PageRank标准算法来对运算过程进行改善

点击查看答案

第4题

关于PageRank算法,下列说法错误的是( )

A.PageRank算法提出了一种新的数学统计方法

B.PageRank算法使谷歌在搜索引擎的竞争中脱颖而出

C.PageRank算法改变了以网页访问量作为排序依据的传统想法

D.PageRank算法能够更准确、更省力地统计出网页的访问量 “

点击查看答案

第5题

搜索引擎的过程中需要用到PageRank等算法。()

点击查看答案

第6题

阅读下面的文章,回答问题 一个正常的搜索引擎,其核心功能自然是网页搜索。那搜索结果应该怎样排序才最好呢?实际上,在谷歌主导互联网搜索之前,人们为此伤透脑筋。很显然,搜索引擎应该把重要的网页放到搜素结果中比较靠前的地方。这个方案很容易想到,但是解决的方法却没有想象的那么简单。 在谷歌诞生之前那段时间,流行的网页排名算法都很类似,它们都使用了一个非常简单的思想:越是重要的网页,访问量就会越大。许多大公司就通过统计网页的访问量来进行网页排名。但是这种排名算法有两个很显著的问题:一是只能够抽样统计,所以统计数据不一定准确,而且访问量的波动会比较大,想要得到准确的统计需要大量的时间和人力,还只能维持很短的有效时间;二是访问量并不一定能体现网页的“重要程度”——可能一些比较早接触互联网的网民还记得,那时有很多人推出了专门“刷访问量”的服务。有没有更好的方法,不统计访问量就能够为网页的重要度排序呢? 就是在这种情况下,1996年初,谷歌公司的创始人,当时还是美国斯坦福大学研究生的佩奇和布林开始了对网页排序问题的研究。在1999年,一篇以佩奇为第一作者的论文发表了,论文中介绍了一种叫PageRank的算法,这种算法的主要思想是:越“重要”的网页,页面上的链接质量也越高,同时越容易被其它“重要”的网页链接,于是,算法完全利用网页之间互相链接的关系来计算网页的重要程度,将网页排序彻底变成一个数学问题,终于摆脱了访问量统计的框框。 不过要强调的是,虽然PageRank是谷歌搜索结果排序的重要依据,谷歌也以此发家,但是它并不是全部依据——实际上,谷歌发展到现在,已同时用了数百种不同的算法来确定最终显示给用户的搜索结果顺序。 搜索引擎对网页排序的最基本思想是指( )

A.访问量越大排在越前面

B.链接质量越高排在越前面

C.和其他网页关系越密切排在越前面

D.越重要排在越前面

点击查看答案

第7题

试比较PageRank算法和HITS算法。

点击查看答案

第8题

谷歌搜索引擎的基本算法是()。
A、HITS算法

B、PageRank算法

C、PopRank算法

D、TrustRank算法

点击查看答案

第9题

以下选项中描述正确的是()。
A、中文分词技术采用了基于符号的方法来识别

B、查准率是衡量系统在实施某一作业时检出相关文献能力的一种测度指标,是对检索遗漏程度的度量

C、机器学习的四个步骤中,文档特征抽取是指利用抽取算法抽取查询词TF/IDF信息、文档长度、网页PageRank值、网页入链/出链数量等

D、动态索引包含2个关键的索引结构:倒排索引、临时索引

点击查看答案

第10题

以下选项中描述正确的是()。
A、查准率是衡量系统在实施某一作业时检出相关文献能力的一种测度指标,是对检索遗漏程度的度量

B、机器学习的四个步骤中,文档特征抽取是指利用抽取算法抽取查询词TF/IDF信息、文档长度、网页PageRank值、网页入链/出链数量等

C、中文分词技术采用了基于符号的方法来识别

D、动态索引包含2个关键的索引结构:倒排索引、临时索引

点击查看答案
热门考试 全部 >
相关试卷 全部 >
账号:
你好,尊敬的上学吧用户
发送账号至手机
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改
谢谢您的反馈

您认为本题答案有误,我们将认真、仔细核查,
如果您知道正确答案,欢迎您来纠错

警告:系统检测到您的账号存在安全风险

为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!

微信搜一搜
上学吧
点击打开微信
警告:系统检测到您的账号存在安全风险
抱歉,您的账号因涉嫌违反上学吧购买须知被冻结。您可在“上学吧”微信公众号中的“官网服务”-“账号解封申请”申请解封,或联系客服
微信搜一搜
上学吧
点击打开微信