航天信息大数据面试题
航天信息
文章插图
1.写出Spark经典算法wordcount伪代码(java scala python均可)(5分)
一、数据库部分(共10分)
1、设学生表和课科表的结构分别为(学号 , 姓名)和(学号 , 课程号 , 成绩).如果希望查询出“成绩大于90分的学生姓名” 。 则对应的SOL请句是( ) 。 (2分)
A、SELECT姓名FROM学生表WHERE学生表.学号一课程表.学号AND课程表.成绩>90
B、SELECT姓名FROM课程表WHERE学生表.学号=课程表.学号AND课程表.成绩>90
C.SELECT姓名FROM学生表 , 课程表WHERE学生表.学号=课程表.学号OR课程表.成绩>90
D.SELECT姓名FROM学生表 , 课程表WHERE学生表.学号=课程表.学号AND课程表.成绩>90
2、执行数据库查询时 , 如果查询的数据很多 , 下面喝线办法是提高在询效率( )(4分)
A 采用连接池 , 增加数据库执行线程
B 反复使用PreparedStatement.减少查询次数
C 增加数据库缓冲区 , 提高数据库I/O方面性能
D 建立索引
3.有一下每门课程都大于80的学生姓名:学生表stulent 分数长grade(4分)
二、简答题(40分)
(1)现有集合A(集合学段为 Jxfp _id , gf_ nsr_ key , je , se) , B(集合字段为jxfp_id, gf_nsr_key, wpmc).两个集合的关联字段为jxfp_id , 请计算集合C(C-A-B)(5分)
(2)请完成下面的方法 , 该方法的目的是采用递规的方式计算结果 (5分)
public static double recursive(int i){
}
(3)简述HDFS的主要功能节点及其作用(0分)
(4)解释一下工厂模式(5分)
【航天信息大数据面试题】(5)简述MapReduce框架的三大主要功能节点及其作用?(10分)
- 对手|一加9Pro全面曝光,或是小米11最大对手
- 同比|亚马逊公布“剁手节”创纪录战绩:第三方卖家全球销售额超48亿美元 同比大增60%
- 人民币|天猫国际新增“服务大类”,知舟集团提醒入驻这些类目的要注意
- 痛点|首个OTA智能社区诞生 解决行业四大痛点
- 王兴称美团优选目前重点是建设核心能力;苏宁旗下云网万店融资60亿元;阿里小米拟增资居然之家|8点1氪 | 美团
- 零部件|马瑞利发力电动产品,全球第七大零部件供应商在转型
- 长安|长安傍上华为这个大腿,市值暴涨500亿!可见华为影响力之大?
- 信息|澜湄合作机制开通水资源合作信息共享平台
- 通气会|12月4~6日,2020中国信息通信大会将在成都举行
- 程序|2020全景生态流量秋季大报告:TOP100APP超半数布局小程序,全景流量重塑行业竞争新格局