大数据最核心的价值就是在于对于海量数据进行存储和分析。相比起现有的其他技术而言,大数据的“廉价、迅速、优化”这三方面的综合成本是最优的。
当这项技术在自己用的时候(如google等),自己将会非常收益,因为成本会降低;当这项技术作用在客户时候,客户同时也会受益。能够让客户和自己同时受益的技术,就是最有商业价值的。所以,大数据并不只是喊口号的空话,而是像其他的新兴技术一样,商业化是需要一个过程,就现在看来,大数据还是属于雷声大雨点小的阶段,所以让很多人会去认为大数据炒作的嫌疑更大。
虽然大数据并不是仅仅局限在技术的显示,但是hadoop系统的技术已经在事实上获得认可了,因此,在讨论大数据最核心的价值同时,也不能脱离Hadoop系统的技术。
一、海量
这是大数据里面最关键的一条,少量的数据在IT行业有许多解决方案,所以大数据技术并不占优。
二、存储
这里首先是需要很多存储的技术,其次数据的存储设备需要有扩展性,只要将存储服务器的节点增加即可,将默认的副本技术让数据不丢失。
三.分析
海量的数据分析一定是需要进行分布式处理的,不然时间成本太大。分布式技术很早就已经有了,都很专业和复杂。Hadoop只需要让分布式处理上运行几十条或者上百条代码即可完成,在专业程序上只需要很短的时间就可以完成基本的数据分析。当然最专业的大数据分析还是需要专家还完成。
四.优秀
Hadoop系列技术是专门为海量数据处理而进行设计的,IT行业的顶级企业参与了贡献和相关技术的贡献,在生态圈上具有完善的一套体系,所以各种需求都能够基本满足。相较于其余的分布式技术,Hadoop则更加优秀。
五.快速
1.在集群的处理上的性能,会随着运算借点的增加而将线性进行扩展。
2.基于JAVA语言实现,将学习的门槛大大的降低了。
3.对于集群的部署和维护,变得越来越容易(有很多自动化的集群构建和维护工具,包括许多商业版本,都提供web界面的运维功能)。
6.廉价
1.不需要购买IBM、Oracle、EMC等公司昂贵的硬件、软件和服务,也无需windows授权。
2.因为会这项技术的人或公司越来越多,购买或定制开发基于相关技术的商业产品越来越便宜
综上,相对于其他技术体系,大数据的综合成本最优。