就大数据的核心而言,hadoop是一个用于有效存储和处理大数据的开源架构。多年来,开源初创公司Cloudera和Hortonworks在Hadoop市场一直占有绝对地位,诸如Oracle、微软以及其他一些公司也想在这个市场占有一席之地,但更多是通过与专业的Hadoop初创公司建立伙伴关系间接地参与市场争夺。
大数据核心
根据Forrester分析的最新报告,传统技术供应商会推出一系列强势的产品战略,即使所推出的Hadoop产品仍有许多有待完善的地方。但厂商们却希望提供基于开源项目的稳定产品,直接通过开源技术的合作而获取产品成果,但可由于在开源领域所做的贡献太少,因此也很难有太大的影响力。
Hadoop:不是选配而是发展趋势
正确把握Hadoop发展趋势并不难,就像Forrester说的那样,Hadoop未来的发展主要取决于不断变化的数据基础设施,而且Hadoop已经成为“未来灵活数据管理平台的基石”。对技术供应商而言,想要跟上如今企业的步伐,它只需要一份关于Hadoop的报告。
企业对Hadoop之说以感兴趣,因为它使企业能够以较少的成本来存储和分析大量数据。根据Forrester发现,企业目前分析的数据只占到企业总数据的12%,是由于企业不知道该如何处理数据造成的。
Hadoop可以轻松实现大数据,因为它支持企业以更低的成本存储数据,一旦它们找到分析数据的最优办法,就可以对数据进行处理。
即便如此,一些企业将Hadoop看作“无人监管的数字垃圾场”,随着越来越了解Hadoop和大数据,企业将Hadoop的分析能力与NoSQL实时数据处理引擎结合在一起,用以从企业数据中收集有价值的部分,并及时采取行动。
对于Hadoop领域未来发展,什么样的供应商值得关注?
但Forrester建议我们不要仅仅关注那些在Hadoop上投入大量资金的供应商。
在开源领域,提供代码源甚至要比占有源码更为重要。同样,专有软件供应商靠软件授权收费,因为它对自己知识产权保密,开源供应商的市场力量与供应商对开源项目的影响力有直接关联,特别是对知识产权的把控上。
出人意料的是,尽管“战略”包括了许可、定价、执行力、产品路线图和客户支持,Forrester对所有公司的社区扩展活动不作任何评论。像之前ReadWrite报道的那样,由于对Hadoop发展贡献的很少,像IBM和AWS这样的供应商很难决定Hadoop发展的方向,Hadoop创始人Doug Cutting断言:
同样,Hortonworks首席执行官Rob Bearden表示:社区是保证Hadoop技术精密联系的关键。
开源领域也并非完全公平。例如亚马逊在MySQL上投入了大量的资金,比MySQL或者Oracle花的还多。同样,IBM在Linux上花的钱比Linux领域的领导者Red Hat还多。
但Forrester的观点可能也不完全正确,例如,在“客户支持”领域,Hortonworks的贡献可以打满分,因为Hortonworks为Hadoop社区贡献了很多代码,但Pivotal和IBM也获得相应的分值,这似乎并不具备说服力。
Forrester分析觉得IBM与AWS为Hadoop专有产品提供更好的客户支持。但那些对开源项目发展没有多少贡献的供应商,它们的客户支持能力也无法和投入很多的供应商相提并论。尽管IBM、Amazon和其他公司将来会构建基于Hadoop的优质服务,但难以提供很好的客户支持,因为总是被迫成为Hadoop追随者,而不是领导者。
Hadoop技术中强者
Forrester针对Hadoop供应商排名与Hadoop本身关系不大,更多与Hadoop如何融入公司长期产品战略相关,比如IBM的产品战略,从产品路线图看到包括继续将IBM其他产品(如SPSS高级分析,高性能计算工作的负载管理、BI工具以及数据管理和建模工具)与BigInsights Hadoop解决方案集成。
Hadoop对这些供应商而言,只是一个很好的补充而不是主要部分。
IBM、AWS等厂商尽管通过Hadoop丰富其产品会从市场获利,但对于那些想要从Hadoop本身获得价值的公司,可能更容易从对Hadoop发展贡献较大的企业(Cloudera和Hortonworks)获得好处,并且为Hadoop提供更好的支持。笔者认为IBM、AWS等厂商利用开源Hadoop技术完善产品推广市场并无问题,但为用户提供最好技术支持推动Hadoop社区长久并发展下去才是长远之计。