读书人

HBase中 Region种

发布时间: 2012-09-08 10:48:07 作者: rapoo

HBase中 Region类

http://hi.baidu.com/xuelianglv/blog/item/bdff9a1ecc15201940341725.html

一个Region在HBase中用一个HRegionInfo表示。该类定义在文件HRegionInfo.java中。一个Region包括如下几个重要属性:
// 代表Region的开始Key
byte [] startKey = HConstants.EMPTY_BYTE_ARRAY;

// 代表Region的结束Key?
byte [] endKey = HConstants.EMPTY_BYTE_ARRAY;
????
// 该Region的id
long regionId = -1;

// 该Region的名字
byte [] regionName = HConstants.EMPTY_BYTE_ARRAY;

// 所在Table的表描述符
HTableDescriptor tableDesc = null;

开始Key和结束Key对应该Region中包含了哪些Row。RegionId用于唯一的标识该Region。


1. Region名字的组成:table的名字,开始Key,RegionId。函数
??? createRegionName(byte[] tableName, byte[] startKey, byte[] id) 用于生产region名字。
?? 由于Region的名字中包含了table的名字,HRegionInfo提供了一个getTableNameFromRegionName
?? 用于从Region名字中返回table名字。

2. 为便于Logging,HRegionInfo类包含了字段regionNameStr,返回用于logging的Region name字符串。

3. 该Region是否是Root Region?
?? tableDesc.isRootRegion() 为true表明该Region是Root Region。
????
4. 该Region是否是MetaRegion?
??? tableDesc.isMetaRegion()为true表明该Region是Meta region。
????
HRegionInfo其它的字段:
split:表明该region是否已经split了,并且包含daughters。
offLine: 表明该region是否是offline的

HRegionInfo提供了一个函数encodeRegionName,对Region名字进行编码,在很多地方使用了这个编码
结果。编码采用了JenkinsHash,见http://burtleburtle.net/bob/hash/doobs.html
int encodeRegionName的实现(byte[] regionName):
??? Math.abs(JenkinsHash.hash(regionName, regionName.length, 0))

读书人网 >软件架构设计

热点推荐