首页
登录
从业资格
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果
资格题库
2022-08-02
67
问题
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于( )。A.关联分析B.序列模式分析C.分类分析D.聚类分析
选项
A.关联分析
B.序列模式分析
C.分类分析
D.聚类分析
答案
C
解析
本题考查数据挖掘基础知识。
数据挖掘就是应用一系列技术从大型数据库或数据仓库中提取人们感兴趣的信息和知识,这些知识或信息是隐含的,事先未知而潜在有用的,提取的知识表示为概念、规则、规律、模式等形式。也可以说,数据挖掘是一类深层次的数据分析。无论采用哪种技术完成数据挖掘,从功能上可以将数据挖掘的分析方法划分为四种,即关联分析、序列模式分析、分类分析和聚类分析。
①关联分析(Associations):目的是为了挖掘出隐藏在数据间的相互关系。若设R={A1,A2,…,AP}为{0,1}域上的属性集,r为R上的一个关系,关于r的关联规则表示为X→B,其中X∈R,B∈R,且x∩B=?。关联规则的矩阵形式为:矩阵r中,如果在行X的每一列为1,则行B中各列趋向于为1。在进行关联分析的同时还需要计算两个参数,最小置信度(Confidence)和最小支持度(Support)。前者用以过滤掉可能性过小的规则,后者则用来表示这种规则发生的概率,即可信度。
②序列模式分析(Sequential Patterns):目的也是为了挖掘出数据之间的联系,但它的侧重点在于分析数据间的前后关系(因果关系)。例如,将序列模式分析运用于商业,经过分析,商家可以根据分析结果发现客户潜在的购物模式,发现顾客在购买一种商品的同时经常购买另一种商品的可能性。在进行序列模式分析时也应计算置信度和支持度。
③分类分析(Classifiers):首先为每一个记录赋予一个标记(一组具有不同特征的类别),即按标记分类记录,然后检查这些标定的记录,描述出这些记录的特征。这些描述可能是显式的,如一组规则定义;也可能是隐式的,如一个数学模型或公式。
④聚类分析(Clustering):聚类分析法是分类分析法的逆过程,它的输入集是一组未标定的记录,即输入的记录没有作任何处理。目的是根据一定的规则,合理地划分记录集合,并用显式或隐式的方法描述不同的类剔。
在实际应用的DM系统中,上述四种分析方法有着不同的适用范围,因此经常被综合运用。
转载请注明原文地址:https://tihaiku.com/congyezige/2419817.html
本试题收录于:
中级 数据库系统工程师题库软件水平考试初中高级分类
中级 数据库系统工程师
软件水平考试初中高级
相关试题推荐
可以采用不同的方法配置VLAN,下面列出的方法中,属于静态配置的是()。A
VLAN的划分有许多种方法,其中不包括()。A.基于端口划分 B.基于路由设
以下关于入侵检测系统的叙述中,错误的是()。A.包括事件产生器、事件分析器、响应
克服网络故障问题的最有效的方法是(54)。A.限制非法操作 B.事务跟踪处理
故障管理的功能包括:()、建立和维护差错日志并进行分析。A.通知用户 B.
日常网络管理模式提供的网络管理入口不含(63)。A.对象入口 B.用户入口
在HTML中,<ol>标签的作用是()。A.定义列表条目 B.定义无序列
下列关于VLAN划分的方法错误的是()。A.基于端口的划分 B.基于MAC
划分VLAN有多种方法,这些方法中不包括(3)。在这些方法中属于静态划分的是(4
在所示的下列两种调制方法中,说法正确的是()。 A.(1)是调相 B.(2
随机试题
HowGlobalWarmingWorksGasesintheEarth’satmosp
[originaltext]Nowadaystherearemoreandmorewaysofgoingonholiday.Mo
若已知一棵二叉树的前序遍历序列和后序遍历序列,则可以恢复该二叉树。()
操作系统是一种系统软件,它有许多种类,PC-DOS是一种()操作系统,Wind
在使用TCRM型断面仪多功能断面测量分析系统进行测量扫描时,可将线路的平面定线参
请简述计算机使用道德规范。
下列关于冬眠低温治疗期间的护理叙述错误的是A.冬眠期间不宜翻身或移动体位 B.
假小叶的基本病变 A.肝细胞核大、双核 B.肝细胞团内中央静脉偏位或
(2018年真题)某女,35岁,因家庭纠纷,情志不畅导致肝气郁结,影响脾胃运化功
根据《矿山安全法》,各级安全生产监督管理部门要对矿山安全工作行使监督职责。下列叙
最新回复
(
0
)