首页
登录
从业资格
在大数据的关键技术中,数据抽取工具ETL是( )过程主要使用的技术。A.数据采
在大数据的关键技术中,数据抽取工具ETL是( )过程主要使用的技术。A.数据采
admin
2022-08-02
56
问题
在大数据的关键技术中,数据抽取工具ETL是( )过程主要使用的技术。A.数据采集B.数据存储C.数据清洗D.数据分析
选项
A.数据采集
B.数据存储
C.数据清洗
D.数据分析
答案
A
解析
本题考查大数据关键技术知识,出自《系统集成项目管理工程师教程(第2版)》第三章 信息系统集成专业技术知识 3.8.4 大数据,全书第172页。
大数据所涉及的技术很多,主要包括数据采集、数据存储、数据管理、数据分析与挖掘四个环节。在数据采集阶段主要使用的技术是数据抽取工具 ETL。
(1)数据采集:ETL工具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
(2)数据存储:其对象包括数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。
(3)数据清洗:指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。
(4)数据分析:指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。
在数据存储环节主要有结构化数据、非结构化数据和半结构化数据的存储与访问。结构化数据一般存放在关系数据库,通过数据查询语言( SQL)来访问;非结构化(如图片、视频、 doc文件等)和半结构化数据一般通过分布式文件系统的 NoSQL(Not Only SQL)进行存储,比较典型的 NoSQL有 Google的 Bigtable、Amazon的 Dynamo和 Apache的 Hbase。大数据管理主要使用了分布式并行处理技术,比较常用的有 MapReduce,编程人员借助MapReduce可以在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。数据分析与挖掘是根据业务需求对大数据进行关联、聚类、分类等钻取和分析,并利用图形、表格加以展示,与 ETL一样,数据分析和挖掘是以前数据仓库的范畴,只是在大数据中得以更好的利用。
转载请注明原文地址:https://tihaiku.com/congyezige/2303328.html
本试题收录于:
中级 系统集成项目管理工程师题库软件水平考试初中高级分类
中级 系统集成项目管理工程师
软件水平考试初中高级
相关试题推荐
10个月婴儿腹泻蛋花汤样便1d,在静点3:2:1溶液过程中,忽然出现抽搐,最合适
新生儿寒冷损伤综合征治疗的关键为A.防止器官功能障碍 B.早期积极提供热量
一胎龄33周的早产儿接受全静脉营养(TPN)过程中发生氮质血症及脱水,这可能因为
近球小管重吸收的关键动力是A. B.管腔膜上的同向转运 C.管腔膜上的逆向转
A.增加Cl通道开放的时间 B.加强大脑皮层的抑制过程 C.激动GABA受体
接生过程中,下列哪项处理是错误的A.宫缩时协助胎头俯屈 B.胎肩娩出后仍应注意
卵子的发育过程哪项错误A.颗粒细胞是由中胚叶细胞形成的 B.排卵前初级卵母细胞
关于IVF-ET技术的常见并发症不包括下列哪项A.异位妊娠 B.流产 C.排
在产房初产妇的分娩过程为 这种分娩过程是A.胎头下降延缓 B.胎头下降停滞
患者,女,35岁。葡萄胎刮宫术后5个月,间断有阴道出血,量不多。术后以工具避孕。
随机试题
教师应当尊重学生的人格,不得歧视学生,不得对学生实施()的行为,不得侵犯学生合
请简要阐述个体心理系统包括哪些方面。
分项工程其合格标准为()。A.质量控制完整 B.观感质量验收符合要求 C.
外伸梁AB的弯矩图如右下图所示,梁上载荷(右上图)F、m的值为( )。
上市公司只有董事会、单独或合并持有上市公司已发行股份1%以上的股东可以提出独立董
商业银行应最迟在发售理财计划前10日,将( )等资料按照相关规定及时向中国银行
A.下颌第三磨牙 B.上颌第二前磨牙 C.上颌第一磨牙 D.上颌第二磨牙
要实现国家在推动现代经济发展和现代社会关系重构中的作用,就必须使国家拥有与之相称
以下不属于营运能力分析指标的是()。A.应收账款周转率 B.存货周转率
根据《中华人民共和国海洋环境保护法》,下列说法中,正确的是( )A.禁止生活污
最新回复
(
0
)