虽然像MongoDB,MapReduce这样的技术被视为创新的标志,但企业还是信赖一些成熟的技术,比如SQL。当企业需要收集的数据格式越来越多元化,特别是一些新的格式并没有SQL作为支持的时候,从这些数据中挖掘重要的商业模式就变得非常困难。
当面对这样的问题时,市场营销分析公司SumAll选择了基于Web的数据仓库来对非SQL数据提供SQL查询的支持。据了解,该公司选择了BitYota的解决方案,能够对存储在MongoDB中的JSON数据进行快速的交互分析。
SumAll为用户提供社交媒体以及Web应用指标数据的挖掘服务,根据CIO Korey Lee的说法,公司希望使用SQL来生成报表,从而帮助客户更好地识别社交趋势并衡量自身与同行在社交媒体上的表现。他们支持包括Twitter,Instagram以及Facebook等主流的Web应用。
Lee表示,BitYota的软件服务可以在MongoDB之上构建一个映射层,通过它可以对数据进行查询和聚合。SumAll跟踪了数十亿条的社交媒体数据,Lee认为MongoDB的扩展性非常好,但是要分析并对MongoDB数据进行聚合的时候存在一定的困难。
“MongoDB自带了MapReduce功能,”Lee表示:“我们的编程环境往往用hadoop或MongoDB来处理海量的数据集,但MapReduce与MongoDB一起使用的时候,至少对我们来说在扩展方面还是有些困难。”
SumAll会生成分析仪表盘,让客户在跨多个社交媒体平台上对市场营销项目的结果以及投资回报率进行评估。帮助客户了解哪个平台的推广效果更好,比如对一些公司来说,Instagram的效果要强过Facebook。
JSON与NoSQL
从MongoDB或Hadoop数据源来分析非结构化数据的需求在不断增长,BitYota的CEO Dev Patel表示他之所以要成立这家公司,就是为了满足集成不同类型数据的需求,而基于云计算的数据仓库能够帮助客户构建这样的应用。
NoSQL数据库支持事实后的数据模式创建,它能够让用户敞开系统,接纳向所有类型的数据。SumAll以及许多类似的公司都希望能够通过成熟的SQL来查询这些Web生成的NoSQL数据。Patel表示:“NoSQL数据库之所以流行起来,是因为企业需要更多的灵活性,特别是移动或者Web端应用方面。然而这并不意味着传统数据库技术就会消亡,我们看到有许多领域对SQL的需求还是非常强大的。”
在现代化的NoSQL数据集合中,JSON类型的数据出现频率最高。随着JavaScript开发浪潮而来,JSON已经成为XML的最佳替代品。
与此同时,MongoDB数据库也开始流行起来,它通常用来存储JSON格式的文档。而许多传统的数据库厂商也没用忽视这样的趋势,包括IBM、Informix、微软以及Oracle等公司都开始以不同的方式支持JSON数据的处理能力。像SunAll这样希望把传统的SQL方式应用到NoSQL数据上的客户并不在少数。
Lee表示,SumAll之所以选择BitYota数据仓库服务也是处于这样的考虑,用熟悉的方法处理新的数据的确是最佳的选择。
据了解,SumAll的MongoDB选择了Rackspace旗下ObjectRocket公司的版本,后者主要提供MongoDB即服务(MongoDB as a Service)。根据Lee的说法,速度是SunAll选型的主要考量指标,现在公司已经可以在任何时间对完整的数据集进行按需查询。