image

编辑人: 独留清风醉

calendar2025-07-25

message8

visits435

2015百度校招机器学习/数据挖掘笔试题

一  简单题(本题共30分)

1.(10分) 如何理解继承、多态、组合,请举例说明它们的应用。

2.(10分) 请列举出进程间通信的几种方式(至少列举三种)。

3.(10分) 请写出贝叶斯公式,请描述朴素贝叶斯分类方法的原理和步骤。

二  算法与程序设计(本题共40分)

1.(20分) 两个长度为100的随机向量X和Y,X=(x1,x2,x3,……,xn),Y=(y1,y2,y3,……,yn),其中xi和yi都是从均值为0,标准差为1的正态分布中随机选择的数,随机变量Z为X和Y的相关系数,请问:(1)Z的期望和标准差是多少?请简单给出推导公式。(2)请用蒙特卡洛方法模拟,写代码计算Z的期望和标准差。

2.(20分) 假设张三的mp3里有1000首歌,现在希望设计一种随机算法来随机播放。与普通随机模式不同的是,张三希望每首歌被随机到的概率是与一首歌的豆瓣评分(0~10分)成正比的,如朴树的《平凡之路》评分为8.9分,逃跑计划的《夜空中最亮的星》评分为9.5分,则希望听《平凡之路》的概率与《夜空中最亮的星》的概率比为89:95。现在我们已知这1000首歌的豆瓣评分:(1)请设计一种随机算法来满足张三的需求。(2)写代码实现自己的算法。

三  系统设计题(本题共30分)

1.(30分) 我们对一批一维数组进行回归拟合,给定训练数据集D = (xi, yi) ,i = 1……n,其中xi∈R是一个实数,yi∈R是xi对应的回归目标。我们拟使用线性,二次,高次函数对yi进行拟合:线性函数:f(x) = ax+b二次函数:f(x) = ax2+bx+c三次函数:f(x) = ax3+bx2+cx+d…(1)我们设定最小均方误差为损失函数,请写出损失函数的具体形式。(2)以二次函数拟合为例,请使用随机梯度下降(stochastic gradient decent)对损失函数进行优化,给出参数a,b,c的梯度推导并写出算法。(3)下面三图分别是一次函数,二次函数,七次函数拟合的结果,同时给出它们在D上损失函数值依次是:0.76,0.15,0.01。在选择用什么函数作为最终拟合函数的时候,你会有哪些考虑。本例中你会选择那个函数。

 

喵呜刷题:让学习像火箭一样快速,快来微信扫码,体验免费刷题服务,开启你的学习加速器!

创作类型:
原创

本文链接:2015百度校招机器学习/数据挖掘笔试题

版权声明:本站点所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明文章出处。
分享文章
share