首页
登录
从业资格
在大数据的关键技术中,数据抽取工具ETL是( )过程主要使用的技术。A.数据采
在大数据的关键技术中,数据抽取工具ETL是( )过程主要使用的技术。A.数据采
admin
2022-08-02
60
问题
在大数据的关键技术中,数据抽取工具ETL是( )过程主要使用的技术。A.数据采集B.数据存储C.数据清洗D.数据分析
选项
A.数据采集
B.数据存储
C.数据清洗
D.数据分析
答案
A
解析
本题考查大数据关键技术知识,出自《系统集成项目管理工程师教程(第2版)》第三章 信息系统集成专业技术知识 3.8.4 大数据,全书第172页。
大数据所涉及的技术很多,主要包括数据采集、数据存储、数据管理、数据分析与挖掘四个环节。在数据采集阶段主要使用的技术是数据抽取工具 ETL。
(1)数据采集:ETL工具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
(2)数据存储:其对象包括数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。
(3)数据清洗:指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。
(4)数据分析:指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。
在数据存储环节主要有结构化数据、非结构化数据和半结构化数据的存储与访问。结构化数据一般存放在关系数据库,通过数据查询语言( SQL)来访问;非结构化(如图片、视频、 doc文件等)和半结构化数据一般通过分布式文件系统的 NoSQL(Not Only SQL)进行存储,比较典型的 NoSQL有 Google的 Bigtable、Amazon的 Dynamo和 Apache的 Hbase。大数据管理主要使用了分布式并行处理技术,比较常用的有 MapReduce,编程人员借助MapReduce可以在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。数据分析与挖掘是根据业务需求对大数据进行关联、聚类、分类等钻取和分析,并利用图形、表格加以展示,与 ETL一样,数据分析和挖掘是以前数据仓库的范畴,只是在大数据中得以更好的利用。
转载请注明原文地址:https://tihaiku.com/congyezige/2303328.html
本试题收录于:
中级 系统集成项目管理工程师题库软件水平考试初中高级分类
中级 系统集成项目管理工程师
软件水平考试初中高级
相关试题推荐
10个月婴儿腹泻蛋花汤样便1d,在静点3:2:1溶液过程中,忽然出现抽搐,最合适
新生儿寒冷损伤综合征治疗的关键为A.防止器官功能障碍 B.早期积极提供热量
一胎龄33周的早产儿接受全静脉营养(TPN)过程中发生氮质血症及脱水,这可能因为
近球小管重吸收的关键动力是A. B.管腔膜上的同向转运 C.管腔膜上的逆向转
A.增加Cl通道开放的时间 B.加强大脑皮层的抑制过程 C.激动GABA受体
接生过程中,下列哪项处理是错误的A.宫缩时协助胎头俯屈 B.胎肩娩出后仍应注意
卵子的发育过程哪项错误A.颗粒细胞是由中胚叶细胞形成的 B.排卵前初级卵母细胞
关于IVF-ET技术的常见并发症不包括下列哪项A.异位妊娠 B.流产 C.排
在产房初产妇的分娩过程为 这种分娩过程是A.胎头下降延缓 B.胎头下降停滞
患者,女,35岁。葡萄胎刮宫术后5个月,间断有阴道出血,量不多。术后以工具避孕。
随机试题
WhenLauraLangankifoundextratowelsinthelaundrysmellinglemonyfresh
"Youwouldratherfollowthanlead"means______.[br]"Theytellus,amongoth
[originaltext]M:Hey,Monica.What’sup?Lookslikeyougosomesunthisweeken
SarrElysetookasipfromaplasticcup.Likeapractisedwinetaster,she
受众理论中有一种以“刺激-反应论”的心理学模式为基础,并从行为主义的角度描述受众
现代医学模式是指()A.生物心理-社会医学模式 B.生物医学模式 C.高新
某公司经过化简的2018年度资产负债表如下表所示。 资产负债表单位:千万元
下列选项中属于企业筹资渠道的有()。A.政府财政资金 B.银行信贷资金
下列各项中,关于会计师事务所针对治理和领导层所设定的质量目标的相关说法中,错误的
项目团队正式开展工作以后,项目经理管理团队工作必须() A.编制项目工作
最新回复
(
0
)