智慧图大数据面试题
智慧图
文章插图
1)画出自己工作主要参与的业务架构和技术架构并标注自己实现的部分
要求:写出大数据相关系统的版本号
2)有50万个不重复的整数 , 从中随机取出不重复的10万个整数 。
要:执行时间尽可能少 , 代码实现(开发语言不限 , 不要求用MR方式解决)
3)举例一个工作中的业务场景 , 描述MR的过程
4)kafka或flume运行机制及设计实现描述
5)统计一个月的日志 , 根据日志中的用户id 统计uv和新增的uv 。 每月第一天新增的uv , 等于当天的uv;第二天的新增uv等于二天的uv排除第一天的uv;第三天新增的uv等于第三天 的uv排除前两天的uv 。
要求:内存中无法存储整月id的uv进行排重处理 , 导致io调用频繁 。 如何优化?画图描述优化此业务的处理过程 。
6)Linux常用过的命令及参数 。 (排除一下命令cd ls vi)
【智慧图大数据面试题】要求:命令不少于3个 , 每个命令至少2个参数描述
- 「技术」这样的思路,让控制器中按键处理数据的方法变得简单了
- IPsecVPN(数据通信)
- 学大数据是否有前途 如何系统掌握大数据技术
- 分析|用数据量化方法透视不确定性世界
- 睿沃科技王琦:三年打造出行业独角兽,智慧酒店领域再添新样板
- 微信官方发布国庆假期消费大数据,来瞧瞧你的钱都花到哪了
- 数据|女生从事数据分析岗位会面临哪些压力
- 擎朗送餐机器人在2020国际智能机器人博览会打造智慧商业模式
- 将万物“装进”教室 百度VR一体机落地福州小学为智慧教育添新力
- 海云数据:用AI让不可能变成可能