柠檬试题库
search
首页
计算机
公务员
驾照
关于
share
数据挖掘可以简单地理解为从大量的数据中发现或挖掘知识。设某公司的客户关系管理系统中有客户表A(CID, v1, v2, …, vn)。给定一个训练集S(v1, v2, …, vn, c),其中c为客户类别、vi(i=1..n)为客户其他属性。若对表A中任一客户x,要使系统能判定x所属的客户类别,较合理的方案是()
A.将x对应的元组中的特征向量(v1, v2, …, vn)与训练集S中的元组进行匹配,从而判定x所属的客户类别
B.对训练集S设计适当的算法,构造一个分类器M,将x对应的特征向量(v1, v2, …, vn)作为M的输入,用M判定x所属的客户类别
C.采用关联规则挖掘算法构成一个关联式分类器M,用M判定x所属的类别
D.采用适当的聚类算法,对表A中的所有元组进行聚类,将每个元组归入训练集S各元组的c列所给出的客户类别中,从而实现x所属客户类别的判定
热度🔥395
参考答案:B
解析:
对于训练集S,测试集A利用数据挖掘中的分类算法,通过训练集构建一个分类器,将测试集A作为分类器输入,经过分类器后会得到相应的类别号。即使相同的类别编号的训练集也可能对应不同的属性集,所以单纯的通过对属性集差别的比较来识别类别不准确,故A错。关联规则挖掘是发现交易数据库中不同商品之间的联系,而本题是对数据进行分类,与题意不符,故C错。D项属于无监督学习算法,对类别并没有规定明确的前提条件,与本题所给的条件无关。综上可知,选项B正确。
复制题目向AI提问
content_copy
content_copy
扫码免费计算机二级刷题
2025年计算机等级考试题库
推荐
下列只能读不能写的文件打开方式是( )。
有以下程序 #include void fun (char *c) { while(*c) { if( *c >= 'a' && *c ,则程序的输出结果是
在Visual FoxPro中,编译或连编生成的程序文件的扩展名不包括( )。
Linux内核由若干个子系统组成,一般来说下面哪一个不是Linux内核的子系统( )。
小李使用PPT2010创建了一份关于公司新业务推广的演示文稿,现在发现第3张幻灯片的内容太多,需要将该张幻灯片分成两张显示,以下最优的操作方法是( )。
标签
三级数据库技术
类别
客户
训练
算法