Hi,大家好!我叫祝海林,微信号叫祝威廉,本来微博也想叫祝威廉的,可惜被人占了,于是改名叫·祝威廉二世。然后总感觉哪里不对。目前在乐视云数据部门里从事实时计算,数据平台、搜索和推荐等多个方向。曾从事基础框架,搜索研发四年,大数据平台架构、推荐三年多,个人时间现专注于集群自动化部署,服务管理,资源自动化调度等方向。
通过前文的描述,我们知道在HBase写时,相同Cell(RowKey/ColumnFamily/Column相同)并不保证在起,甚至删除个Cell也只是写入个新的Cell,它含有Delete标记,而不定将个Cell真正删除了,因而这就引起了个问题,如何实现读的问题?要解决这个问题,我们先来分析下相同的Cell可能存在的位置
日期:09/24/2015 10:13:12
作者:
公司内部使用的是MapR版本的Hadoop生态系统,因而从MapR的官网看到了这篇文文章: An In-Depth Look at the HBase Architecture ,原本想翻译全文,然而如果翻译就需要各种咬文嚼字,太麻烦,因而本文大部分使用了自己的语言,并且加入了其他资源的参考理解以及本人自己读源码时对其的理解,属于半翻译、半原创吧。
日期:09/24/2015 10:08:34
作者:
HBase vs. MongoDB vs. MySQL vs. Oracle vs. Redis,三大主流
日期:09/16/2015 10:45:01
作者:
做个项目中由于数据量比较大,并且需要定时增量分析,做了hbase的分页。项目中用到的版本是hbase1.1 。需要启用协处理器 Aggregation
日期:09/02/2015 11:22:18
作者:
通过前文的描述,我们知道在HBase写时,相同Cell(RowKey/ColumnFamily/Column相同)并不保证在起,甚至删除个Cell也只是写入个新的Cell,它含有Delete标记,而不定将个Cell真正删除了,因而这就引起了个问题,如何实现读的问题?要解决这个问题
日期:08/24/2015 10:07:33
作者:
ZooKeeper 顾名思义 动物园管理员,他是拿来管大象(Hadoop) 、 蜜蜂(Hive) 、 小猪(Pig) 的管理员, Apache Hbase和 Apache Solr 以及LinkedIn sensei 等项目中都采用到了 Zookeeper。ZooKeeper是个分布式的,开放源码的分布式应用程序协调服务,ZooKeeper是以Fast Paxos算法为基础,实现同步服务,配置维护和命名服务等分布式应用。
日期:08/21/2015 10:39:49
作者:
HBase 数据库是个基于分布式的、面向列的、主要用于非结构化数据存储用途的开源数据库。其设计思路来源于 Google 的非开源数据库”BigTable”。
日期:08/20/2015 10:33:57
作者:
MVCC(Multi-Version Concurrent Control),即多版本并发控制协议,广泛使用于数据库系统。本文将介绍HBase中对于MVCC的实现及应用情况。 MVCC基本原理
日期:08/13/2015 17:09:28
作者:
Java类与HBase数据模型
HBaseConfiguration 包名 : org.apache.hadoop.hbase.HBaseConfiguration 作用:对HBase进行配置。 用法示例: HBaseConfiguration hconfig = new HBaseConfiguration(); hconfig.set("hbase.zookeeper.property.clientPort","2181"); 1 2 HBaseAdmin 包名 : org.apache.hadoop.hbase.client.HBaseAdmin ... 随着Facebook使用HBase来构建实时消息系统,基于Hadoop的面向列存储的HBase持续升温。
日期:06/29/2015 17:06:29
作者:
|
Digg排行
本周热门内容
|