面试公司:字节跳动

面试岗位:大数据开发

一面题:

• 自我介绍数仓维度建模

• 深挖事实表维度表构建spark join

• mapreduce原理

• spark 常用算子

• map flatmap

• 有没有实际做过数仓项目

算法题:

给定数组包含正负数(数量至多差1),要求将其排列成正负彼此相邻形式,要求时间复杂度O(N),空间复杂度O(1)

二面题:

• 自我介绍

• 介绍实习项目

• ·数据倾斜怎么解决的

• 如果需要变回原来粒度怎么办

算法题

  1. 1-N个数字,找出字典序第K大的数字,要求空间O(1),时间O(K),举例1-19字典序为1,10,11,12,13,14,15,16,17,18,19,2,3,4,5,6,7,8,9

写过hive没有?

来个hive题

spark区别来个题

  1. 两个栈模拟队列

要高效主动介绍实验室项目

• 反问

三面题:

• 自我介绍

• 模拟彩票抽奖中奖,每个人有n张票,有100个奖品

• 介绍当前面试界面涉及的网络技术

• 介绍最近一个有挑战的项目

• 最近学习上的计划安排

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐