image

编辑人: 长安花落尽

calendar2025-06-15

message2

visits145

国内互联网公司算法&机器学习岗(阿里星)面试总结

题目汇总

笔试题

在互联网分析中,通常会关注用户的【第N日激活率】来衡量用户质量。用户的第N日激活指的是用户在注册的第N天登录网站或App,即算为该用户的第N日激活。第N日激活率指的是某日注册用户在第N天激活的数量除以该日所有注册用户数量

“赤兔”是领英中国针对中国职场人士推出的一款本土化的社交应用。如果你是领英中国的数据分析师,你会从哪些方面和维度来设计各项指标,给产品的设计和运营提供数据上的支持?请给出具体的维度和指标,并说明原因。

网易游戏的一道笔试题是给定一条包含3个join的SQL语句,要求写代码模拟实现SQL的功能。

 

编程题

最少时间复杂度求数组中第k大的数,写code

去除字符串S1中的字符使得最终的字符串S2不包含’ab’和’c’,写code

长度为N的序列Sequence=abc….Z,问有多少不同的二叉树形态中序遍历是这个,写递推公式

给定整数n和m,问能不能找出整数x,使得x以后的所有整数都可以由整数n和m组合而成

中序遍历二叉树,利用O(1)空间统计遍历的每个节点的层次,写bug free的code

排序二叉树转双向链表

一个运算序列只有+、*、数字,计算运算序列的结果

 

机器学习&数据挖掘问题

L1和L2正则项 >> 它们间的比较

各个模型的Loss function,牛顿学习法、SGD如何训练

介绍LR、RF、GBDT ,分析它们的优缺点,是否写过它们的分布式代码

介绍SVD、SVD++

是否了解线性加权、bagging、boosting、cascade等模型融合方式

推荐系统的冷启动问题如何解决

是否了解A/B Test以及A/B Test结果的置信度

特征工程经验

是否了解mutual infomation、chi-square、LR前后向、树模型等特征选择方式

 

解决方案类题目

为今日头条设计一个热门评论系统,支持实时更新

给定淘宝上同类目同价格范围的两个商品A和B,如何利用淘宝已有的用户、商品数据、搜索数据、评论数据、用户行为数据等所有能拿到的数据进行建模,判断A和B统计平均性价比高低。统计平均性价比的衡量标准是大量曝光,购买者多则高。

有n个elements和1个Compare(A, B)函数,用Compare函数作为排序算法中的比较算子给elements排序。Compare函数有p的可能比较错。排序完取Top m个元素,本来就在Top m并被正确分在Top m的元素个数是x。问x的数学期望。

 

喵呜刷题:让学习像火箭一样快速,快来微信扫码,体验免费刷题服务,开启你的学习加速器!

创作类型:
原创

本文链接:国内互联网公司算法&机器学习岗(阿里星)面试总结

版权声明:本站点所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明文章出处。
分享文章
share