当前,我国已经进入大数据时代,在这样的时代背景下,hadoop的应用也逐渐深入,正在从互联网企业,逐渐拓展到电信,金融,政府,医疗这些传统行业。虽然目前Hadoop应用场景还是以日志存储、查询和非结构化数据处理为主,但是Hadoop技术的不断成熟以及生态系统相关产品的完善,包括Hadoop对SQL不断加强的支持,以及主流商业软件厂商对Hadoop支持的不断增强,会带动Hadoop 渗透到越来越多的应用场景中。
2013年是中国大数据的应用落地年,越来越多的行业用户开始重视并启动大数据相关的项目。而在大数据领域的众多技术中,最受关注的是衍生于开源平台的Hadoop/Mapreduce生态系统。Hadoop 从2006 年诞生至今已经超过7 年时间。2013 年,整个生态系统变得比以往更加丰富,无论是在开源领域,商业软件厂商或是硬件厂商,都开始推出基于Hadoop 的相关产品。Hadoop之所以受到如此的关注,主要原因在于它支持用户在低价的通用硬件平台上实现对大数据集的处理和分析,在某种程度上替代了传统数据处理所需的昂贵的硬件设备和商业软件。
总体来看,中国行业用户对大数据及Hadoop 的应用依然处在初级阶段,Hadoop 技术相关专业人员比较匮乏,Hadoop生态系统还亟待完善,这些都影响了该市场的发展。Hadoop/MapReduce 生态系统的基础是开源软件,目前Hadoop 发行版依然是最稳定的主流商业模式,但现在很多软硬件厂商也在通过往自己的产品中加入Hadoop 元素或者通过Hadoop一体机实现Hadoop商业化过程,提升Hadoop相关产品的易用性。我们建议用户需要依靠目前拥有的Hadoop相关人才以及总体IT战略来决定选择开源还是商业化产品。
需要强调的是,目前有不少人认为Hadoop是大数据的代名词,但是我们提示用户不要认为大数据就是Hadoop,用户要慎重选择Hadoop/MapReduce 生态系统相关产品,目前它所适用的应用场景非常有限。Hadoop/MapReduce 生态系统中各个层面的产品功能、易用性和完整性仍有待提升,应用解决方案以及相关业务和工具软件仍然有比较大的发展空间。以关系型数据库为基础的列存储,内存计算等技术的发展也在增强关系数据库的处理能力,且依然会在大数据市场上扮演重要角色。
D1Net评论:
大数据与Hadoop之间,不能简单的划等号,Hadoop并不是大数据的代名词,大数据也不等于Hadoop,从长远发展来看,未来的大数据世界将会是多种技术和平台共存的世界,并没有哪一种技术能够完全解决大数据面临的所有问题,从这一点就可以看出大数据与Hadoop的不同之处。