微信关注“刘鹏看未来”公众号,回复“课件01”“课件02”等,可以下载本系列的PPT。
点击视频观看(时长58分钟)
内容概要:
1.什么是数据挖掘?
从数据中识别有效的、新奇的、有用的以及可理解的模式的过程.
2.相关领域
机器学习(Machine learning)
数据库(Databases)
统计学(Statistics)
信息检索(Information retrieval)
可视化(Visualization)
高性能计算(High-performance computing)
...
3.数据挖掘:KDD过程的核心
4.框架:典型的数据挖掘系统
5.数据挖掘:数据源
6.数据挖掘任务
7.分类:定义
给定 个记录(样本)集合(训练集)
每条记录有 些属性组成, 其中 个属性为类别.
(x1, x2, …, xn, c)
找到 个将类别属性表示为其他属性的函数的模型. (如c = f(x))
8.分类任务演示
9.分类任务例子
10.常用的方法
11.决策树例子
12.另 个决策树例子
13.对测试数据应用模型
14.支持向量机
15.应用例子
16.什么是聚类?
17.聚类的概念是模糊的
18.划分方法:K-Means
19.两个不同的K-means聚类
20.选取初始点的重要性
本PPT课件部分页面引自其他专家的PPT,在此致以衷心感谢!
刘鹏教授是中国信息协会大数据分会副会长,中国云计算(chinacloud.cn)、中国大数据(thebigdata.cn)网站的创始人,《云计算》教材作者。
欢迎关注我的公众号:刘鹏看未来!
本公众号将陆续提供全系列的《云计算(第三版)》配套PPT(共40个)下载!