数据挖掘源自《从数据库中发现知识》(缩写为kdd)。它首次出现在1989年8月在底特律举行的第十一届国际联合人工智能会议上。为了统一理解,fayyad,piatetsky-shapiro和smyth在权威文章集《知识发现与数据进展》中给出了kdd和数据挖掘的最新定义。从中总结了1996年该领域的进展,并予以区分:
kdd的定义是:kdd是从数据中识别有效,新颖,潜在有用且最终可以理解的模式的过程。
数据挖掘的定义是:数据挖掘是kdd中的一步,它使用特定算法在可接受的计算效率限制内生成特定模式。
数据挖掘技术的特点
1.基于大量数据:不是说无法挖掘小数据量。实际上,大多数数据挖掘算法都可以在较小的数据量上运行并获得结果。但是,一方面,过小的数据量可以通过手动分析来总结,另一方面,小数据量通常不能反映现实世界的一般特征。
2.非平凡性:所谓非平凡的意思是指所挖掘的知识是不简单的。一定不能与著名体育评论员所说的相似:“经过我的计算,直到比赛结束我才发现了一个有趣的现象。本届世界杯的进球数和失球数都是相同的。非常巧合!”这种知识。这似乎没有必要,但是许多不了解业务知识的数据挖掘新手经常会犯此错误。
3.隐含性:数据挖掘是发现数据深处的知识,而不是直接出现在数据表面的信息。常用的bi工具(例如亿信bi和豌豆bi)完全可以让用户找到此信息。
4.新奇性:挖掘的知识以前应该是未知的,否则仅是为了验证业务专家的经验。只有新知识才能帮助公司获得进一步的洞察力。
5.价值性:挖掘的结果必须为企业带来直接或间接的利益。有人说数据挖掘只是“杀龙技术”。它看起来牛气哄哄,但没有用。这只是一个错误的想法。不可否认的是,在某些数据挖掘项目中,由于缺乏明确的业务目标,或者由于数据质量不足,或者由于人们抵制不断变化的业务流程,又或者由于挖掘人员缺乏经验,都会导致结果不佳甚至根本没有效果。但是,大量成功的案例也证明了数据挖掘确实可以成为提高效率的武器。
iphone8什么时候上市?iphone8最新消息:苹果因为高通起诉导致iphone8延迟发布
新道格XDG1400磁敏测速传感器的详细介绍
三星再次带来了惊喜,向众人展示了一系列仍在研发的家用机器人
-48V低边精密电流检测
苹果拟在印度采购iPhone 16系列电池,或对印度制造能力提出考验
了解数据挖掘的概念和特点
华为的鸿蒙系统真的有那么强大吗
闪电网络可以促进对加密货币的匿名性离链支付
隔离变压器的特征、选择标准和应用
我国首个脑机接口综合性开源软件平台正式发布
通快激光助力汽车刹车盘减少有毒粉尘排放
如何正确选择气体检测仪器,有哪些方法
数字信号
为什么科研人员需要便携式地物光谱仪?
小米5S、vivo Xplay6、努比亚Z11,春游拍照之选
人机界面的功能及工作原理
SynQor创新的QorSeal封装方法不惧怕最恶劣的环境
MXeval助力自动驾驶性能评估—shape better cars
Zara 将引进增强现实AR 应用程序,吸引年轻族群上门
高速稳定的TypeC to PCIE(NVME)移动硬盘盒解决方案-----RTL9210