HBase是BigTable的开源实现,事务模型也与BigTable脉相承 – 仅支持行别的事务。虽然Jeff Dean大神在接受采访时公开承认目前在技术领域较后悔的事情就是没有在BigTable中加入跨行事务模型,以至于之后很多团队都在BigTable之上重复造各种各样的分布式事务轮子。
日期:07/26/2017 11:23:30
作者:
Apache Hive是个构建在Hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是种类SQL语言,这种语言较终被转化为Map/Reduce. 虽然Hive提供了SQL查询功能,但是Hive不能够进行交互查询--因为它只能够在Haoop上批量的执行Hadoop。
日期:07/24/2017 13:30:44
作者:
HBase数据在写入的时候首先追加写入HLog,再写入Memstore,也就是说份数据会以两种不同的形式存在于两个地方。那两个地方的同份数据需不需要种机制将两者关联起来?有的朋友要问为什么需要关联这两者
日期:07/07/2017 15:11:46
作者:
在对hbase操作中,数据读取/写入都是发生在某个HRegion下某个Store里的files。那么究竟在写入hbase时,个region下到底发生了什么呢?
日期:07/04/2017 16:32:48
作者:
Apache HBase 1.1.11 发布了。这个是HBase 1.1系列中的第11个补丁版本,继续为 Hadoop 和 NoSQL 社区带来稳定可靠的数据库。此版本包含自1.1.10以来的近20个错误修复。
日期:06/22/2017 11:53:09
作者:
笔者去年年底分享了篇关于HBase中数据读取(scan)逻辑的文章(戳 这里 ),主要介绍了scan的基本流程以及实现框架,看官反应甚是强烈。文章较后还挖了个不大不小的坑,承诺后期会就部分细节进行深入分析,然而因为部分原因这个坑直没填上。
日期:06/15/2017 15:54:22
作者:
HBase官方性能调优文档( 点击这里 )中比较详细的介绍了相关的调优技巧,我在网上也找到了篇不错的中文总结,转载之。需要注意下,文章发布时间有点久远,随着版本的更新有些地方可能有所变化,文章中的知识仅供参考。
日期:06/08/2017 10:01:37
作者:
终于又切回HBase模式了,之前段时间因为工作的原因了解接触了段时间大数据生态的很多其他组件(诸如Parquet、Carbondata、Hive、SparkSQL、TPC-DS/TPC-H等),虽然只是走马观花,但也受益良多。
日期:05/24/2017 15:38:59
作者:
HBase 作为淘宝全网索引构建以及在线机器学习平台的核心存储系统,是阿里搜索基础架构的重要组成部分。本文将介绍 HBase 在阿里搜索的历史、规模,应用场景 以及 在实际应用当中遇到的问题和优化 。
日期:05/22/2017 14:52:45
作者:
HBase 是个开源的非关系型分布式数据库(NoSQL),基于谷歌的 BigTable 建模,是个高可靠性、高性能、高伸缩的分布式存储系统,使用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群。
|
Digg排行
本周热门内容
|