首页
登录
从业资格
采用数据仓库技术进行数据收集时,有时会遇一些略微不一致但可以纠正的数据,纠正这些
采用数据仓库技术进行数据收集时,有时会遇一些略微不一致但可以纠正的数据,纠正这些
练习题库
2022-08-02
34
问题
采用数据仓库技术进行数据收集时,有时会遇一些略微不一致但可以纠正的数据,纠正这些数据的过程称为( )。A.数据转换B.数据抽取C.数据清洗D.数据装载
选项
A.数据转换
B.数据抽取
C.数据清洗
D.数据装载
答案
C
解析
数据清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。因为数据仓库中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来,而且包含历史数据,这样就避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为“脏数据”。我们要按照一定的规则把“脏数据”“洗掉”,这就是数据清洗。而数据清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。数据清洗是与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。
转载请注明原文地址:https://tihaiku.com/congyezige/2401491.html
本试题收录于:
高级系统分析师题库软件水平考试初中高级分类
高级系统分析师
软件水平考试初中高级
相关试题推荐
依据标准GB/T11457—2006《信息技术软件工程术语》,()是忽略系统
信息技术主要为解决信息的,采集、加工、存储、传输、处理、计算、转换、表现等问题。
信息系统安全策略涉及技术的和非技术的、硬件的和非硬件的、法律的和()各个方面。
采取某些特定作业技术或开展某些活动,以达到质量要求,一般指的是()A.质量保证
信息系统工程是代表高科技的工程,尤其是在信息化技术快速发展的当下时期,对监理开展
监理工作风险分类不包含()A.工作技能风险 B.技术资源风险 C.管理风险
某信息化项目到2019年6月1日的成本执行数据如下表,根据下表数据当该项目为非典
某信息化项目到2019年6月1日的成本执行数据如下表,根据下表数据当该项目为非典
在对某项目采购供应商的评价中,评价项有:技术能力、管理水平、企业资质等,假定满分
对于大型项目,集成商有时会将某些子系统,或子系统中某些模块委托给另外的软件开发商
随机试题
顶进过程中,为防止发生崩铁伤人事故,一切操作人员()。A.顶进过程中可以停机
关于双胎输血综合征下列说法不正确的是:()A.供血胎儿贫血 B.受
根据《中华人民共和国测绘法》,测绘事业是经济建设、国防建设和社会发展的( )事
中国药典的凡例分类项目,下列说法正确的是A.名称及编排B.检验方法和限度C.精确
从营销包括的主要环节来分,营销人员的客户服务可以分为售前服务、售中服务和售后服务
一般情况下,期限长的债券对利率变动的敏感程度要小于期限短的债券对利率变动的敏感程
氟中毒的处理原则是( )。A.有确切的有机氟气体意外呼吸史者,不论有无自觉症状
某旧货经营单位为增值税小规模纳税人,2020年2月销售旧货共取得含税销售收
M公司2×20年10月5日购入N公司股票20万股,支付价款总额为280.4万元,
某项永久性扶贫基金拟在每年年初发放80万元扶贫款,年利率为4%,则该基金需要在第
最新回复
(
0
)