“这是第一次基于YARN架构可以运行在Windows环境,”Hortonworks公司产品营销主管Jim Walker表示,“在Windows运行hadoop对于所有客户都很重要。”
Apache Hadoop YARN是去年10月发布的Hadoop 2.0的基础。YARN作为Hadoop操作系统,利用单一使用的数据平台进行批量处理,并将其转变为多用途平台,可同时进行批处理、交互式、在线和流处理。
新的YARN
对于存储在Hadoop分布式文件系统(HDFS)上的数据,YARN是主要的资源管理器和访问介质,它让企业可以将数据存储在单个位置,然后以多种方式与它进行交互,保持相同的服务水平。
“针对Windows的HDP 2.0是一个飞跃,因为它将Apache Hadoop的功能带到Windows,”Hortonworks公司产品经理Rohit Bakhshi表示,“YARN让用户可以同时以多种方式与所有数据进行交互,例如同时利用实时和批处理,让Hadoop真正成为多用途平台,并让其在现代数据架构占有一席之地。”
他补充说:“Windows数据中心现在依赖于高度可用的NameNode来自东检测和恢复任何硬件、操作系统或JVM故障,并向左右HDP处理组件提供对数据的可靠访问。”
Hortonworks与Windows紧密协作
Hortonworks的工程师一直在与微软的工程师紧密合作,以将HDP 2.0带到Windows数据中心。
“他们是很好的合作伙伴,”Walker表示,“我们真的找不到更好的合作伙伴了,他们了解Hadoop在数据中心的重要性,这是改变游戏规则的关键,他们正在帮助促成这件事情。”
Walker表示,无论你是运行Linux还是Windows,现在你都可以访问最新最强大的Hadoop版本。
“这没有什么区别,”Walker表示,“这归结到底你是使用Windows还是Linux。现在大部分都在使用Windows,对于Windows客户而言,这是一个巨大的好处。微软希望实现Hadoop在内部部署以及云计算的可用性,并且允许你无缝地在这两者之间移动工作负载。这里的便携性是至关重要的。”
除此之外,针对Windows的HDP 2.0是关于确保依赖于Excel的企业现在可以连接到Hadoop 2.0数据来源来推动其业务。
“我们希望将Hadoop的功能添加到这个世界上最强大的商业分析工具中,”Walker表示,“我认为Excel是这个世界上最大的分析工具,加上Hadoop的功能,再整合Power BI,这将给数据分析师、开发人员和操作系统人员带来希望。”