![](https://lstatic.shangxueba.com/sxbzda/h5/images/m_q_title.png)
Mapreduce将计算过程分为两个阶段,Map阶段并行处理输入数据,Reduce阶段对Map结果进行汇总。
![](https://lstatic.shangxueba.com/sxbzda/h5/images/tips_org.png)
第3题
A.分布式计算
B.数据库
C.MySQL
D.MapReduce
第4题
A、MapReduce采用“分而治之”策略
B、MapReduce设计的一个理念就是“数据向计算靠拢”,而不是“计算向数据靠拢”
C、MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker和Task
D、MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数,Map和Reduce
第5题
A、通过对决策表的每个字段进行数据分片(然后每个字段再按照记录分片),可以实现决策树重要分枝属性的选择。
B、可以对决策表的样本进行划分,并行计算每个分片数据各种属性取值对应的类别个数,从而可以合并这些数据得到某个属性在整个数据集的重要性度量。
C、决策树对大数据的处理只能采用批处理的算法。
D、决策树的分布式学习可以借助MapReduce计算框架。
第6题
A、通过对决策表的每个字段进行数据分片,可以很容易实现决策树重要分枝属性的选择。
B、可以对决策表的样本进行划分,并行计算每个分片数据各种属性取值对应的类别个数,从而可以合并这些数据得到某个属性在整个数据集的重要性度量。
C、决策树对大数据的处理只能采用批处理的算法。
D、决策树的分布式学习需要借助MapReduce计算框架。
第8题
A、HadoopHadoop是一个能够对大量数据进行分布式处理的软件框架
B、HANAHANA是一个软硬件结合体,提供高性能的数据查询功能
C、HBaseHBase是一个开源的非关系型分布式数据库(NoSQL)
D、Hyper-VHyper-V是微软提出的一种系统管理程序虚拟化技术,能够实现桌面虚拟化
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!