Hive应用开发中,如下操作引起数据倾斜的概率最小的是哪个()。
A.大小表进行join关联,小表key集中
B.大表join大表,关联字段null值过多
C.两表关联条件的字段为string类型,长度至少为1
D.进行CountDistinct计算时某些特殊值过多
A.大小表进行join关联,小表key集中
B.大表join大表,关联字段null值过多
C.两表关联条件的字段为string类型,长度至少为1
D.进行CountDistinct计算时某些特殊值过多
第1题
A.hive中的join查询只支持等值链接,不支持非等值连接
B.hive的表一共有两种类型,内部表和外部表
C.hive默认仓库路径为/user/hive/warehouse/
D.hive支持数据删除和修改
第3题
A.内部表数据由Hive自身管理,外部表数据由HDFS管理
B.外部表数据的存储位置由自己制定
C.删除内部表会直接删除元数据(metadata)及存储数据
D.删除外部表,HDFS上的文件也会被删除
第5题
A.创建内部表的同时,会将数据挪到数据仓库指定的位置
B.删除内部表时只删除源数据
C.创建内部表时,只记录数据指定的路径
D.删除外部表时删除表中数据和源数据
第6题
现有学生表,课程表和成绩表,三表中的字段如下:
student表:id,student_name
course表:id,course_name
score表:student_id,course_id,score
前提:每个学生都会参加多门课程的考试,每门课程的成绩在score表中都是一条数据
现若要查询出 平均分在60分以上的学生id和学生姓名以及平均分,以下哪个sql语句是正确的? ()
A.select student_id,student_name,avg(score) av from student s join score sc on s.id=sc.student_id;
B.select student_id,student_name,avg(score) av from student s join score sc on s.id=sc.student_id where av>60;
C.select student_id,student_name,avg(score) av from student s join score sc on s.id=sc.student_id where av>60 group by student_id;
D.select student_id,student_name,avg(score) av from student s join score sc on s.id=sc.student_id group by student_id having av>60;
第7题
A.加快数据检索效率
B.加速表和表连接效率
C.索引需要占用更多物理存储空间
D.唯一性约束索引,保证数据库表中每一行数据的唯一性
第8题
在文档XLH.XLS中进行如下操作:
1、计算与填充
在Sheet1中进行如下操作:
(1)公式计算
按公式"总分=语文*0.6 数学*0.7 外语*0.8"计算"总分"列。
计算"数学"的平均值,并填写到第14行的对应单元格中。
(2)数据填充
按等比序列填充第七列,起点为第2行,步长值为3,终点为第13行(包括13行)。
2、图表制作
在Sheet2中制作嵌入图表,要求如下:
数据源依次为"姓名"、"一季度奖金",其中"姓名"列为分类轴。
图表类型为"三维簇状柱形图".
图表标题为"2005年奖金发放表".
不显示图例。
3、数据库应用
在Sheet3中进行如下操作:
对记录排序,主要关键字为"出厂价",从小到大,次要关键字为"市场价",从小到大。
4、数据透视表
在Sheet4中制作数据透视表,要求如下:
在A18单元格开始的右下区域插入如下图所示的数据透视表(注意:位置错误不得分)。
其中列为"影院",数据为"卖出票数",汇总方式为"求和".
5、格式排版
在Sheet5中进行如下操作:
设置标题"2005年奖金发放表"在A-E列水平跨列居中。
第三行行高设为23磅。
设置第3-15行数据区域的外边框和内部水平、垂直线为单线
6、将本文档存盘,退出EXCEL。
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!