刷题刷出新高度,偷偷领先!偷偷领先!偷偷领先! 关注我们,悄悄成为最优秀的自己!

简答题

阅读以下说明和流程图,填补流程图中的空缺,将解答填入答题纸的对应栏内。
[说明]
指定网页中,某个关键词出现的次数除以该网页长度称为该关键词在此网页中的词频。对新闻类网页,存在一组公共的关键词。因此,每个新闻网页都存在一组词频,称为该新闻网页的特征向量。
设两个新闻网页的特征向量分别为:甲(a1,a2,...,ak)、乙(b1,b2,...,bk),则计算这两个网页的相似度时需要先计算它们的内积S=a1b1+a2b2+...+akbk。一般情况下,新闻网页特征向量的维数是巨大的,但每个特征向量中非零元素却并不多。为了节省存储空间和计算时间,我们依次用特征向量中非零元素的序号及相应的词频值来简化特征向量。为此,我们用(NA(i),A(i)|i=1,2,...,m)和(NB(j),B(j)|j=1,2,...,n)来简化两个网页的特征向量。其中:NA(i)从前到后描述了特征向量甲中非零元素A(i)的序号(NA(1)<NA(2)<...),NB(j)从前到后描述了特征向量乙中非零元素B(j)的序号(NB(1)<NB(2)<...)。
下面的流程图描述了计算这两个特征向量内积S的过程。

使用微信搜索喵呜刷题,轻松应对考试!

答案:

0
S+A(i)B(j) 或 等价表示
i>m或i=m+1或 等价表示
j>n或i=n+1 或 等价表示
i>m or j>n或i=m+1 or i=n+1 或等价表示

解析:

本题描述了如何计算两个新闻网页特征向量的内积。特征向量中的元素是关键词的词频,而向量是非零元素的序号及相应的词频值组成的简化形式。计算内积的过程需要遍历这两个简化特征向量,并计算对应序号相同时的元素乘积之和。

流程解析如下:

  1. 初始化S为0,作为内积的累计值。
  2. 对于每一个A(i),需要与B(j)对应元素相乘并加到S上,直到NA(i)<NB(j),此时需要比较下一个A(i+1)与NB(j),或者比较NA(i)与下一个B(j+1)。
  3. 如果在比较A(i+1)与NB(j)后,发现i+1已经越界(即i>m或i=m+1),则扫描结束。
  4. 如果在比较NA(i)与B(j+1)后,发现j+1已经越界(即j>n或j=n+1),则扫描结束。
  5. 当两个简化向量之一扫描结束时,整个扫描结束,即满足条件i>m or j>n 或 i=m+1 or i=n+1。

因此,答案中的填空部分应如上所述。

创作类型:
原创

本文链接:阅读以下说明和流程图,填补流程图中的空缺,将解答填入答题纸的对应栏内。[说明]指定网页中,某个关键词

版权声明:本站点所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明文章出处。

让学习像火箭一样快速,微信扫码,获取考试解析、体验刷题服务,开启你的学习加速器!

分享考题
share