微信关注“刘鹏看未来”公众号,回复“课件01”“课件02”等,可以下载本系列的PPT。
点击视频观看(时长53分钟)
内容概要:
1.“大云(Big Cloud)”计划
中国移动研究院为打造中国移动云计算基础设施而实施的关键技术研究及原型系统开发计划
2.Big Cloud 技术架构
3.MapReduce系统架构
4.大云数据挖掘平台
5.神经网络算法
把整个神经网络的神经元划分成不同层次,对同层次内的不同神经元进行并行参数计算,并通过统 调度和精度控制对神经元进行快速的并行化训练。训练完毕后,对于每 个输入,通过并行化神经网络快速地得到输出
6.并行聚类算法Clusterers4MR
聚类算法应对用户提供的全体数据集,按照 定的聚类原则,自动聚成几簇。每个簇内的数据应具有很高的相似性。应提供的功能包括:
(1)自动聚类:将数据集形成簇模型;
(2)预测:依据形成的簇模型,对新数据判定所属的簇。
并行聚类规则算法包括:k均值算法、Clara聚类算法、DBScan聚类算法。
7.并行关联规则算法Associations4MR
关联规则挖掘工具以选定的客户消费记录全集作为输入,分析消费记录中各消费项间依赖关系,产生规则描述各消费项之间同时出现的规律。
关联规则算法包括:并行PApriori算法、并行PFPgrowth算法、并行PAwfits算、时序关联规则。
8.时序关联规则算法
时序关联规则挖掘算法主要可以用于发现交易序列中的频繁模式。因为交易序列具有时间性,因此各数据项集之间存在时间上的先后关系,“买A又买B的顾客往往还会买C”的规则转变成了“买A后又买B的顾客往往会接下来再买C”或者“买B后又买A的顾客往往会接下来再买C”,在时序关联规则算法中,这后两者是不同的两个关联规则。
9.基于数据挖掘的数据业务精确营销
本PPT课件部分页面引自其他专家的PPT,在此致以衷心感谢!
刘鹏教授是中国信息协会大数据分会副会长,中国云计算(chinacloud.cn)、中国大数据(thebigdata.cn)网站的创始人,《云计算》教材作者。
欢迎关注我的公众号:刘鹏看未来!
本公众号将陆续提供全系列的《云计算(第三版)》配套PPT(共40个)下载!