题目内容 (请给出正确答案)
[单选题]

Hive应用开发中,如下操作引起数据倾斜的概率最小的是哪个()。

A.大小表进行join关联,小表key集中

B.大表join大表,关联字段null值过多

C.两表关联条件的字段为string类型,长度至少为1

D.进行CountDistinct计算时某些特殊值过多

查看答案
如搜索结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能会需要:
您的账号:
发送账号密码至手机
发送
更多“Hive应用开发中,如下操作引起数据倾斜的概率最小的是哪个(…”相关的问题

第1题

下面关于使用hive的描述中不正确的是()。

A.hive中的join查询只支持等值链接,不支持非等值连接

B.hive的表一共有两种类型,内部表和外部表

C.hive默认仓库路径为/user/hive/warehouse/

D.hive支持数据删除和修改

点击查看答案

第2题

以下哪个操作是hive不支持的()。

A.表增加列

B.表删除列

C.表修改列

D.修改表名

点击查看答案

第3题

关于Hive中内部表与外部表的区别,哪项描述是错误的()。

A.内部表数据由Hive自身管理,外部表数据由HDFS管理

B.外部表数据的存储位置由自己制定

C.删除内部表会直接删除元数据(metadata)及存储数据

D.删除外部表,HDFS上的文件也会被删除

点击查看答案

第4题

按粒度大小的顺序,hive数据被组成为:数据库,表,()和桶。

A.元数据

B.行

C.块

D.分区

点击查看答案

第5题

Hive针对内部表和外部表的区别是()

A.创建内部表的同时,会将数据挪到数据仓库指定的位置

B.删除内部表时只删除源数据

C.创建内部表时,只记录数据指定的路径

D.删除外部表时删除表中数据和源数据

点击查看答案

第6题

现有学生表,课程表和成绩表,三表中的字段如下:student表:id,student_namecourse表:id,course_n

现有学生表,课程表和成绩表,三表中的字段如下:

student表:id,student_name

course表:id,course_name

score表:student_id,course_id,score

前提:每个学生都会参加多门课程的考试,每门课程的成绩在score表中都是一条数据

现若要查询出 平均分在60分以上的学生id和学生姓名以及平均分,以下哪个sql语句是正确的? ()

A.select student_id,student_name,avg(score) av from student s join score sc on s.id=sc.student_id;

B.select student_id,student_name,avg(score) av from student s join score sc on s.id=sc.student_id where av>60;

C.select student_id,student_name,avg(score) av from student s join score sc on s.id=sc.student_id where av>60 group by student_id;

D.select student_id,student_name,avg(score) av from student s join score sc on s.id=sc.student_id group by student_id having av>60;

点击查看答案

第7题

SQL开发中会用到数据库索引,如下对索引描述正确的是()。

A.加快数据检索效率

B.加速表和表连接效率

C.索引需要占用更多物理存储空间

D.唯一性约束索引,保证数据库表中每一行数据的唯一性

点击查看答案

第8题

奖金发放表
*说明:考生必须注意选择指定的工作表,否则不得分。

在文档XLH.XLS中进行如下操作:

1、计算与填充

在Sheet1中进行如下操作:

(1)公式计算

按公式"总分=语文*0.6 数学*0.7 外语*0.8"计算"总分"列。

计算"数学"的平均值,并填写到第14行的对应单元格中。

(2)数据填充

按等比序列填充第七列,起点为第2行,步长值为3,终点为第13行(包括13行)。

2、图表制作

在Sheet2中制作嵌入图表,要求如下:

数据源依次为"姓名"、"一季度奖金",其中"姓名"列为分类轴。

图表类型为"三维簇状柱形图".

图表标题为"2005年奖金发放表".

不显示图例。

3、数据库应用

在Sheet3中进行如下操作:

对记录排序,主要关键字为"出厂价",从小到大,次要关键字为"市场价",从小到大。

4、数据透视表

在Sheet4中制作数据透视表,要求如下:

在A18单元格开始的右下区域插入如下图所示的数据透视表(注意:位置错误不得分)。

其中列为"影院",数据为"卖出票数",汇总方式为"求和".

5、格式排版

在Sheet5中进行如下操作:

设置标题"2005年奖金发放表"在A-E列水平跨列居中。

第三行行高设为23磅。

设置第3-15行数据区域的外边框和内部水平、垂直线为单线

6、将本文档存盘,退出EXCEL。

点击查看答案

第9题

对于大批量数据的关联汇聚,在大数据中适合哪种组件实现()。

A.IMPALA

B.SPARKSQL

C.HIVE

D.STORM

点击查看答案

第10题

每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的?()

A.S4

B.GraphX

C.Impala

D.Hive

点击查看答案
热门考试 全部 >
相关试卷 全部 >
账号:
你好,尊敬的上学吧用户
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改
谢谢您的反馈

您认为本题答案有误,我们将认真、仔细核查,
如果您知道正确答案,欢迎您来纠错

警告:系统检测到您的账号存在安全风险

为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!

微信搜一搜
上学吧
点击打开微信
警告:系统检测到您的账号存在安全风险
抱歉,您的账号因涉嫌违反上学吧购买须知被冻结。您可在“上学吧”微信公众号中的“官网服务”-“账号解封申请”申请解封,或联系客服
微信搜一搜
上学吧
点击打开微信