DataHub大数据岗位笔试面试总结

笔试：

#linux命令

1、查看磁盘空间的命令、查看目录空间的命令

2、写一行命令，kill掉zuxs用户下所有进程名带dba_的进程，用到通道。

pkill -u zuxs -f dba_

#设计模式

1、用代码实现一个线程安全的单例模式。单例我写出来了，但是在线程安全方面还有问题。

2、写一下除了单例模式、工厂模式以外的其他三种编程模式。

#JVM

1、说一下JVM内存模型，GC算法，GC垃圾回收机制，如何优化？

前端：

1、写下session、cookie、local storage的区别

2、描述一下在浏览器输入一个url后的处理流程。

大数据：

1、说一下HDFS\MapReduce\HBase\Hive\Yarn的适用场景。

数据结构：

1、实现一个空间复杂度为O(1),时间复杂度为O(n)的倒排遍历一个单链表的程序。

2、如何判断一个单链表里存在一个环。

一面：

介绍一下对HBase的了解（底层），为什么选择HBase?有没有用过Balance?是怎样设计RowKey的？
ElasticSearch，集群的搭建，为什么选择ES而不选择传统关系型数据库?ES调优有哪些?遇到过什么坑?对Agg聚合查询有了解多少?性能怎样?有没有遇到什么问题。
Spark，Spark环境的搭建及调优,RDD分区

二面：

喵呜刷题：让学习像火箭一样快速，快来微信扫码，体验免费刷题服务，开启你的学习加速器！

最热门资讯