HBase是个分布式存储、数据库引擎,可以支持千万的QPS、PB别的存储,这些都已经在生产环境验证,并且在广大的公司已经验证。特别是阿里、小米、京东、滴滴内部都有数千、上万台的HBase集群。
日期:03/22/2018 14:57:03
作者:
过去的年里,我们准备在Ali-HBase上突破这个被普遍认知的痛点,为此进行了深度分析及全面创新的工作,获得了些比较好的效果。以蚂蚁风控场景为例,HBase的线上young GC时间从120ms减少到15ms,结合阿里巴巴JDK团队提供的利器——AliGC,进步在实验室压测环境做到了5ms。
日期:03/16/2018 11:05:49
作者:
Apache HBase 2.0.0 的个 Beta 版已发布,Apache HBase 2.0.0-beta-2 是 2.0 版本的非生产预览版,包含之前 alpha 版本中的所有新特性 (new assignment manager, offheap read/write path, in-memory compactions 等),可 点此查看 2.0 的完整新特性。
日期:03/16/2018 11:03:45
作者:
2017云栖大会Hbase专场,阿里巴巴高技术专家绝顶带来HBase在阿里搜索推荐中的应用的演讲。本文主要从Hbase的历史规模开始谈起,进而聊到了应用场景,着重分享了问题和优化,较后对未来进行了展望。
日期:03/05/2018 11:49:09
作者:
Region自动切分是HBase能够拥有良好扩张性的较重要因素之,也必然是所有分布式系统追求无限扩展性的副良药。
日期:02/28/2018 11:49:23
作者:
客户端读写数据是先从HBase Master获取RegionServer的元数据信息,比如Region地址信息。在执行数据写操作时,HBase会先写MetaStore,为什么会写到MetaStore。
日期:02/24/2018 14:26:16
作者:
Hbase非常适合于非结构化数据存储的数据库,2006年底由PowerSet 的Chad Walters和Jim Kellerman 发起,2008年成为Apache Hadoop的个子项目。现已作为产品在多家企业被使用。
2017云栖大会Hbase专场,阿里巴巴技术专家天穆带来Ali-HBase的SQL实践与改进的演讲。本文主要从为什么需要SQL开始谈起,进而讲解了SQL on Hbase,接着着重分享了Ali-Hbase SQL的优化与改进,较后对未来进行了展望。
日期:01/29/2018 09:46:05
作者:
2006年google技术人员Fay Chang发布了篇文章《Bigtable: A Distributed Storage System for Structured Data》。该文章向世人介绍了种分布式的数据库,这种数据库可以在局部几台服务器崩溃的情况下继续提供高性能的服务。
日期:01/25/2018 10:22:45
作者:
HBase是个构建在HDFS上的分布式列存储系统。HBase是Apache Hadoop生态系统中的重要 员,主要用于海量结构化数据存储。从逻辑上讲,HBase将数据按照表、行和列进行存储。
日期:01/25/2018 10:21:38
作者:
在之前的 大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建 中介绍了集群的环境搭建,但是在使用hive进行数据查询的时候会非常的慢,因为hive默认使用的引擎是MapReduce。因此就将spark作为hive的引擎来对hbase进行查询,在成功的整合之后,我将如何整合的过程写成本篇博文。
日期:01/22/2018 10:43:41
作者:
|
Digg排行
本周热门内容
|