在大数据相关技术中,(  )是一个分布式的、面向列的开源数据库,是一个适合于非结

考试题库2022-08-02  42

问题 在大数据相关技术中,(  )是一个分布式的、面向列的开源数据库,是一个适合于非结构化数据存储的数据库。A.HBaseB.MapReduceC.ChukwaD.HDFS

选项 A.HBase
B.MapReduce
C.Chukwa
D.HDFS

答案 A

解析 (1) HDFS,Hadoop分布式文件系统(HDFS)是适合运行在通用硬件上的分布式文件系统,是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问'非常适合大规模数据集上的应用。
(2) HBase是一个分布的、面向列的开源数据库,HBase 不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的地方是HBase 基于列的而不是基于行的模式。(A选项,本题答案)
(3) MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。
(4) Chukwa 是一个开源的用于监控大型分布式系统的数据收集系统。
转载请注明原文地址:https://tihaiku.com/congyezige/2303442.html

最新回复(0)