微信关注“刘鹏看未来”公众号,回复“课件01”“课件02”等,可以下载本系列的PPT。

点击视频观看(时长58分钟)
内容概要:
1.什么是数据挖掘?
从数据中识别有效的、新奇的、有用的以及可理解的模式的过程.

2.相关领域
机器学习(Machine learning)
数据库(Databases)
统计学(Statistics)
信息检索(Information retrieval)
可视化(Visualization)
高性能计算(High-performance computing)
...
3.数据挖掘:KDD过程的核心

4.框架:典型的数据挖掘系统

5.数据挖掘:数据源

6.数据挖掘任务


7.分类:定义
给定 个记录(样本)集合(训练集)
每条记录有 些属性组成, 其中 个属性为类别.
(x1, x2, …, xn, c)
找到 个将类别属性表示为其他属性的函数的模型. (如c = f(x))
8.分类任务演示

9.分类任务例子

10.常用的方法

11.决策树例子

12.另 个决策树例子

13.对测试数据应用模型






14.支持向量机






15.应用例子

16.什么是聚类?

17.聚类的概念是模糊的

18.划分方法:K-Means

19.两个不同的K-means聚类

20.选取初始点的重要性


本PPT课件部分页面引自其他专家的PPT,在此致以衷心感谢!
刘鹏教授是中国信息协会大数据分会副会长,中国云计算(chinacloud.cn)、中国大数据(thebigdata.cn)网站的创始人,《云计算》教材作者。
欢迎关注我的公众号:刘鹏看未来!
本公众号将陆续提供全系列的《云计算(第三版)》配套PPT(共40个)下载!
