大数据处理专家SAP HANA,SAP HANA十大误区-其它-@大数据资讯

在当今大数据时代，如果你还不知道SAP HANA，那只能说明你OUT了。SAP HANA是一个软硬件结合体，提供高性能的数据查询功能，用户可以直接对大量实时业务数据进行查询和分析，而不需要对业务数据进行建模、聚合等。对于一些对SAP HANA听说但不是很了解的客户来说，从字面理解上会存在很大的误区，下面我们就来一起分析一下SAP HANA十大误区：

1、数据库平台的作用
错误观点：内存数据库只能做一些事情，如MOLAP，运行报告，查询和分析，规划和预算编制，以及发现非结构化信息。

正确观点：SAP HANA在内存中的数据库平台是一个通用的内存数据库平台—它能带来新的数据，捕捉交易与全面的ACID兼容性，当它们发生时分析它们，做数据库处理，下放商业、预测和规划的逻辑，它服务的客户包括分析师、云计算和移动应用程序。它的主流应用远远超过了小众对数据库的理解，你并不需要添加多种技术和或将一个box中的引擎复制为不同的用途。

2、存储方式 – 行、列、文本
错误观点：SAP HANA不支持非结构化的数据，也不提供行和列的压缩。

正确观点：SAP HANA可以在一个数据库中存储行、列以及文本，它本身就支持非结构化数据的存储。因为这些都整合在一起了，所以就简化了各个不同的存储器中的事务以及分析操作。事实上，SAP HANA就是在非结构化基础上建立起来的。它能处理在结构数据上的标准搜索、文本挖掘、以及类文本的搜索。SAP HANA中也将包含Inxight技术在语言上的功能，如标签，特征提取，实体提取和情感分析。Inxight在市场上是最好的文本分析软件。SAP HANA支持大量压缩的列存储。行存储并不需要大量压缩，因为它只被用做压缩列和不相关的表格的缓冲器而已。

3、商业智能客户端
错误观点：SAP HANA只对一些BI客户端提供有限的支持。

正确观点：SAP HANASAP已经优化 Business Objects的运行。此外_如今众多_第三方客户端已成为可能(如Tableau，TIbco Spotfire)，我们将继续在SAP HANA上向第三方BI客户端完全开放。

4、规划应用程序和分析功能
错误观点：SAP HANA为规划和预算编制程序提供了很有限的支持。

正确观点：SAP HANA为规划程序提供了完整的支持，有相当多的SAP企业绩效管理程序可以运行在SAP HANA上。SAP HANA在

数据库中有本地规划支持与规划引擎。类似于分解聚合、复制和其他的操作符是SAP HANA中关系代数的一部分。此外，我们支持SAP 数据库内自带的规划语言FOX。

5、运营报表和数据源
错误观点：SAP HANA对使用复制和ETL技术的运营报表能力有限，由于“有限的数据源”。

正确观点：SAP拥有非常好的对于不同数据源(如SAP CO-PA加速器)的实时运行报表解决方案;其中很多都是非SAP程序数据源。SAP数据服务和SAP Sybase复制服务器是市场领先的ETL和复制技术，可以从非SAP和SAP数据源加载数据。HANA具有极高的插入率，由于大规模并行的批量机制，它支持所有的数据源，并且测试表明数据传入SAP HANA的速度为每小时2TB。

6、磁盘中的SAP HANA
错误观点：SAP HANA不支持数据存储至磁盘中。

正确观点：SAP HANA通过使用优先级技术，例如最近最少使用(LRU)支持数据存储磁盘。SAP HANA可以将相关数据放在内存中，而来自磁盘的数据则根据需要加载。

7、查询速度
错误观点：SAP HAN执行查询的速度不比其他数据库快。

正确观点：SAP HANA将所有数据以整数格式列式存储，并且利用了最新的intel创新技术，如向量运算的CPU开发优化。SAP HANA下一代架构以及芯片级的创新使其快于市场上任何一家竞争对手数据库。举个例子，我们有4个客户使用了SAP HANA后，业务流程提升了10万倍。领先的是MKI，其零售、物流数据分析提升了40.8万倍。

8、安装和实施经历
错误观点：SAP HANA需要几天去安装，而实施则需要几月甚至几年。

正确观点：SAP HANA在数据中心安装只需几分钟至一小时。事实上，很快你就能从我们合作伙伴或者云上安装。Provimi的利润分析仅用了3个星期就上线了。

9、数据缓存和查询优化
错误观点：SAP HANA和TimesTen都能做数据缓存。

正确观点：上一代的数据库使用缓存来提高性能。HANA是基于一个新的建筑范式上的一个纯内存数据库。既然整个数据库都在HANA中，你就不用再缓存数据。SAP HAHA有一个世界顶级的查询优化器，本身就允许大规模的平行查询执行，包括内部和外部运营的平行操作。

10、聚合和物化视图
错误观点：你需要聚合数据的物化视图取得高性能。

正确观点：又是一个!就像电动车不需要火花塞一样，内存中详细数据瞬时聚合性能高得多。聚合是过时的技术，因为需要耗费大量精力来创建，存储冗余和管理变化。 SAP HANA并不需要像传统数据库那样上性能指标，鉴于它所有的部分都存在在内存中，面对所有尺寸的数据，它能将自己的行为设置成就像一个索引一样。

了解其它相关SAP HANA信息，请点击： http://www.avatech.com.cn/pro/product90.html