首页
登录
从业资格
某软件公司开发基于云计算的分布式文档协作平台(DDCP),系统部分需求如下所示:
某软件公司开发基于云计算的分布式文档协作平台(DDCP),系统部分需求如下所示:
资格题库
2022-08-02
31
问题
某软件公司开发基于云计算的分布式文档协作平台(DDCP),系统部分需求如下所示:(1)实现文档的分布式存储,客户端可随时随地上传和下载文档;(2)支持多客户端并发编辑同一文档,某个客户端所做修改会实时显示在其他客户端;(3)要求系统具有自我修复机制,当系统中某个节点失效时,无需人工干预能够自动实现节点替换并恢复到一致状态。项目组经过讨论,决定采用现有的分布式文件系统作为基础架构,但在具体选用哪种设计方案时产生了分歧。王工建议采用Hadoop分布式文件系统HDFS作为系统参考架构,但张工认为Google分布式文件系统GFS更适合该系统需求。最后经过更为详细的分析和讨论,同意了张工的建议,采用GFS作为分布式文档协作平台的文件系统架构。【问题1】(12分)请用300字以内的文字说明GFS和HDFS有何异同,并针对系统需求,用200字以内的文字说明选择GFS的原因。【问题2】 (8分)针对图2-1所示DDCP基础架构,请分别说明一次数据读操作和一次并发写操作的过程。
图2-1 DDCP系统架构【问题3】(5分)请分别叙述采用GFS和HDFS架构,单点失效问题是如何解决的。
选项
答案
解析
分布式数据存储系统是实现云计算和面向服务计算等分布式计算模型的基础,采用不同的分布式文件系统架构决定了分布式数据存储系统的运行效率、可伸缩性、容错能力及安全性等。分布式文件系统是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连,从而实现了数据的分布式存储和管理。Google的GFS文件系统和Hadoop分布式文件系统HDFS是当前最流行的两种分布式文件系统参考架构。
本题主要考查应试者对于分布式文件系统设计的掌握情况,特别是GFS和HDFS分布式文件系统架构的设计。本题结合一个典型的实际项目案例,首先要求分析GFS和HDFS之间的异同,然后针对系统需求分析采用GFS文件系统的原因;针对项目中所设计的DDCP基础架构,分析数据读写操作的过程;最后针对具体的单点失效问题,说明两种分布式文件系统架构所提供的解决方案。
【问题1】
本题要求考生针对GFS和HDFS两种分布式文件系统架构的特点展开分析并进行总结。
(1)GFS是一个面向大规模数据密集型应用的、可伸缩的分布式文件系统,虽然运行在多台普通硬件设备上,但是它提供了灾难冗余的能力,为大量客户机提供高性能的服务。一个GFS集群中包含了一个单独的Master节点、多台Chunk服务器,并且同时被多个客户端访问。GFS存储的文件被分割为固定大小的Chunk并分配标识,缺省提供3个存储复制节点,Master节点管理所有的文件系统元数据,GFS客户端代码以库的形式被链接到客户程序里,无论是客户端还是Chunk服务器都不需要缓存文件数据。
(2)HDFS是一个高度容错性的系统,能够提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS采用Master/Slave架构,一个HDFS集群由一个Namenode和一定数目的Datanodes组成。Namenode是一个中心服务器,负责管理文件系统的命名空间以及客户端对文件的访问,集群中的Datanode一般是一个节点一个,负责管理它所在节点上的存储。一个文件被分成一个或多个数据块,这些块存储在一组Datanode上,Namenode执行文件系统的命名空间操作并确定数据块到具体Datanode节点的映射,Datanode在Namenode的统一调度下负责处理文件系统客户端的读写请求。
【问题2】
本题要求考生认真分析图中给出的DDCP系统架构,依据图中节点之间的数据传输关系描述数据传输过程。
(1)读数据的过程:应用程序将读数据请求发送给客户端后,客户端访问主服务器请求所需数据位置信息,主服务器查询数据分块和地址信息返回给客户端,客户端根据地址信息向块服务器发送读数据请求,块服务器将所请求数据发送给客户端,客户端将数据转发给应用程序。
(2)写数据的过程:应用程序分别将数据和写数据请求发送给客户端,客户端依次访问主服务器请求所写数据位置信息,主服务器依次查询数据分块和地址信息发送给客户端,客户端将所要写入的数据重新组织,将属于同一个块服务器的数据按照分组报文和分组序列信息发送给块服务器数据缓存(Primary),客户端将所写数据按照分组报文发送给块服务器数据缓存(Secondary),块服务器数据缓存(Primary)按照分组序列将数据写入到块服务器数据块(Primary),块服务器(Primary)将分组序列发送给块服务器(Secondary),块服务器数据缓存(Secondary)按照分组序列将数据写入块服务器数据块(Secondary),块服务器(Secondary)将写入完成信息发送给块服务器(Primary),块服务器数据(Primary)将写数据完成信息发送给客户端。
【问题3】
本题要求应试者掌握单点失效问题产生的原因,并能够结合GFS和HDFS架构的特点进行分析,说明所采用的解决方案。
转载请注明原文地址:https://tihaiku.com/congyezige/2401602.html
本试题收录于:
高级系统分析师题库软件水平考试初中高级分类
高级系统分析师
软件水平考试初中高级
相关试题推荐
()包括本单位的质量目标并且质量目标能反映客户的期望和需求,它是质量管理
《监理通知单》属于发送给()的文档。A.监理单位 B.建设单位 C.承
信息系统设备安全是信息系统安全的重要内容,其中设备的()是指设备随时可以正
信息系统安全保护的五个等级,分别是用户自主保护级、系统审计保护级、()、
下列()不属于范围管理的内容。A.编制项目管理计划 B.收集需求
信息系统项目实施过程中往往会出现进度滞后、投资超预算等情况,这说明该项目需加强(
信息系统工程项目投资构成中的设计费属于()。A.工程费 B.工程前期费
某信息系统建设项目,由于建设单位组织结构调整,造成项目进度延期,并导致监理合同约
信息系统工程监理与设备监理是目前我国实施的()的监理体系,仅在“信息工程
某系统集成企业在项目实施阶段出现突发情况,引起进度问题。此时监理单位应通过()
随机试题
WhatisthemainfindingaboutcarbondioxideinRoger’sreport?[br][original
Theymayappeartobemarvelsofmodernscience.Buttheideasthatledtot
Someuniversitiesareverylargeandhaveseveralthousandstudents.Othersares
如图所示土围堰的防渗形式属于( )。 A.斜墙式 B.斜墙带水平铺盖式 C
实验误差(简称误差)是其客观真值与何值之差A:测量值B:理论值C:预测值D
A.钙通道阻滞剂 B.β受体阻滞剂 C.膜稳定作用为主的药物 D.延长动作
存放于变电站内的备品应视同()进行管理。备用设备$;$运行设备$
从以下图形序列中将哪一个去掉后剩下的图形可以呈现出一定的规律性?()
下列有关控制测试和实质性程序的说法中,错误的是()。A.无论是否实施控制测
主要用作电机和电器绝缘、开关的底板和绝缘子等绝缘材料属于( )。A.有机复合绝缘
最新回复
(
0
)