(单选题)数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的人们事先不知道的但又是潜在有用的信息和知识的过程。根据上述定义,下列属于数据挖掘的是:
A.超市通过对海量原始交易数据的分析,确定货物摆放的规律
B.语音识别通过数据库让机器对语言信号进行识别和理解
C.小李为了写毕业论文查询数据库中相关课题的研究结果
D.邮箱运营商根据客户注册时提供的兴趣爱好,定期推送相关广告
【答案】A
【解析】
第一步,根据提问方式,确定为选是题。
第二步,找关键信息。
①大量的、不完全的、有噪声的、模糊的、随机的数据;
②提取隐含在其中的人们事先不知道的但又是潜在有用的信息。
第三步,辨析选项。
A项:“对海量原始交易数据的分析,确定货物摆放的规律”,符合“从大量的数据中心”“提取有用信息”,符合定义;
B项:“对语言信号进行识别和理解”,不符合“有噪声的、模糊的”信息,提取的也并非隐含信息,不符合定义;
C项:“数据库中相关课题的研究结果”,未体现数据是“大量的、不完全的”或者“模糊的”,不符合定义;
D项:涉及的客户信息很明确,不符合“提取隐含在其中的人们事先不知道的但又是潜在有用的信息”,不符合定义。
因此,选择A选项。