首页
登录
从业资格
阅读以下说明和流程图,填补流程图中的空缺,将解答填入答题纸的对应栏内。 [说明
阅读以下说明和流程图,填补流程图中的空缺,将解答填入答题纸的对应栏内。 [说明
考试题库
2022-08-02
55
问题
阅读以下说明和流程图,填补流程图中的空缺,将解答填入答题纸的对应栏内。[说明]指定网页中,某个关键词出现的次数除以该网页长度称为该关键词在此网页中的词频。对新闻类网页,存在一组公共的关键词。因此,每个新闻网页都存在一组词频,称为该新闻网页的特征向量。设两个新闻网页的特征向量分别为:甲(a1,a2,...,ak)、乙(b1,b2,...,bk),则计算这两个网页的相似度时需要先计算它们的内积S=a1b1+a2b2+...+akbk。一般情况下,新闻网页特征向量的维数是巨大的,但每个特征向量中非零元素却并不多。为了节省存储空间和计算时间,我们依次用特征向量中非零元素的序号及相应的词频值来简化特征向量。为此,我们用(NA(i),A(i)|i=1,2,...,m)和(NB(j),B(j)|j=1,2,...,n)来简化两个网页的特征向量。其中:NA(i)从前到后描述了特征向量甲中非零元素A(i)的序号(NA(1)<NA(2)<...),NB(j)从前到后描述了特征向量乙中非零元素B(j)的序号(NB(1)<NB(2)<...)。下面的流程图描述了计算这两个特征向量内积S的过程。
选项
答案
解析
0
S+A(i)B(j) 或 等价表示
i>m或i=m+1或 等价表示
j>n或i=n+1 或 等价表示
i>m or j>n或i=m+1 or i=n+1 或等价表示
【解析】
本题是简化了的一个大数据算法应用之例。世界上每天都有大量的新闻网页,门户网站需要将其自动进行分类,并传送给搜索的用户。为了分类,需要建立网页相似度的衡量方法。流行的算法是,先按统一的关键词组计算各个关键词的词频,形成网页的特征向量,这样,两个网页特征向量的夹角余弦(内积/两个向量模的乘积),就可以衡量两个网页的相似度。因此,计算两个网页特征向量的内积就是分类计算中的关键。
对于存在大量零元素的稀疏向量来说,用题中所说的简化表示方法是很有效的。这样,求两个向量的内积只需要在分别从左到右扫描两个简化向量时,计算对应序号相同(NA(i)=NB(j))时的A(i)*B(j)之和(其他情况两个向量对应元素之乘积都是0)。因此,流程图中(2)处应填S+A(i)*B(j),而累计的初始值S应该为0,即(1)处应填0。
流程图中,NA(i)<NB(j)时,下一步应再比较NA(i+1)<NB(j),除非i+1已经越界。因此,应先执行i+1→i,再判断是否i>m或i=m+1(如果成立,则扫描结束)。因此(3)处应填i>m或i=m+1。
流程图中,NA(i)>NB(j)时,下一步应再比较NA(i)<NB(j+1),除非j+1已经越界。因此,应先执行j+1→j,再判断是否j>n或j=n+1(如果成立,则扫描结束)。因此(4)处应填j>n或j=n+1。
(5)处应填扫描结束的条件,i>m or j>13或i=m+1 or j=n+1,即两个简化向量之一扫描结束时,整个扫描就结束了。
转载请注明原文地址:https://tihaiku.com/congyezige/2426294.html
本试题收录于:
初级程序员题库软件水平考试初中高级分类
初级程序员
软件水平考试初中高级
相关试题推荐
解答服务对象的健康问题,帮助其澄清观念、做出决策的人际传播形式称为A.咨询B.个
阅读一下说明,回答问题1至问题4.将解答填入答题纸对应的解答栏内。 【说明】
阅读以下说明,回答问题1至问题2,将解答填入答题纸对应的解答栏内。 【说明】
阅读下列说明,回答问题1至问题3,将解答填入答题纸的对应栏内。 【说明】 某
阅读以下说明,回答问题1至问题5,将解答填入答题纸对应的解答栏内。 【说明】
阅读以下说明,回答问题l至问题4,将解答填入答题纸对应的解答栏内。 【说明】
阅读下列说明,回答问题1至问题3,将解答填入答题纸的对应栏内。 【说明】 某
阅读以下说明,回答问题1至问题4,将解答填入答题纸对应的解答栏内。 【说明】
阅读以下说明,回答问题l至问题4,将解答填入答题纸对应的解答栏内。 【说明】
阅读下列说明,回答问题1至问题3,将解答填入答题纸的对应栏内。 【说明】 某
随机试题
Specialistscallthefeelingswhichpeopleexperiencewhentheycometoanewen
商标专用权的特征有()。A.显著性 B.地域性 C.期限性 D.独立性
材料题 C Willitmatterifyoudon’ttake
A.口内翼下颌皱襞内侧纵形切口 B.口内翼下颌皱襞处横形切口 C.下颌骨下缘
在假设检验中,P值和α的关系为A.P值越大,α值就越大 B.P值越大,α值就越
守法合规对基金从业人员的要求是( )。A.自觉遵守法律法规 B.举报违法违规
A.3.98 B.4.83 C.2.73 D.15.8
期望模型中的三个因素可以有无穷多的组合,产生最强动机组合是()。A:低价值、低期
六西格玛管理工作程序DMAIC中的D表示( )。A.界定 B.测量 C.分
甲公司为一家大型集团公司,主要从事煤矿及建筑施工业务乙,丙公司均为其下属企业,其
最新回复
(
0
)