读书人

hbase之scan的rowkey有关问题

发布时间: 2012-06-29 15:48:47 作者: rapoo

hbase之scan的rowkey问题

最近使用到hbase做存储,发现使用scan的时候,返回的rowkey并不是特别友好

?

例如我insert的rowkey是 xyz_123_abc

?

调用KeyValue的getKeyString方法返回的String为

?

Java代码??hbase之scan的rowkey有关问题
  1. kv\x00\x0Bxyz_123_abc\x02kvobj\x00\x00\x011\xD7\xB9\xDD\x1B\x04??

?可以看到我的rowkey已经被处理过了,不过这个处理只是拼接处理,没有其他译码的过程。

?

好吧,这下需要考虑如何提取出我的真实的rowkey了,看了下KeyValue中,生成key的算法太繁琐了,直接跳过,debug看下rowkey的返回过程,发现KeyValue对象本身其实是正常的,也就是说KeyValue的toString方法其实有正常的rowkey,ok找到入口点了,直接看toString的方法

?

Java代码??hbase之scan的rowkey有关问题
  1. public?String?toString()?{??
  2. ????if?(this.bytes?==?null?||?this.bytes.length?==?0)?{??
  3. ??????return?"empty";??
  4. ????}??
  5. ????return?keyToString(this.bytes,?this.offset?+?ROW_OFFSET,?getKeyLength())?+??
  6. ??????"/vlen="?+?getValueLength();??
  7. ??}??

?

接着看keyToString方法,摘取最前面重要的2段

?

Java代码??hbase之scan的rowkey有关问题
  1. public?static?String?keyToString(final?byte?[]?b,?final?int?o,?final?int?l)?{??
  2. ???if?(b?==?null)?return?"";??
  3. ???int?rowlength?=?Bytes.toShort(b,?o);??
  4. ???String?row?=?Bytes.toStringBinary(b,?o?+?Bytes.SIZEOF_SHORT,?rowlength);??

?

这次终于找到了他的构成方法了,ok 对照KeyValue的API 可以写个util方法来获取真实的rowkey字符串了

?

Java代码??hbase之scan的rowkey有关问题
  1. public?static?String?getRealRowKey(KeyValue?kv)?{??
  2. ????????int?rowlength?=?Bytes.toShort(kv.getBuffer(),?kv.getOffset()+KeyValue.ROW_OFFSET);??
  3. ????????String?rowKey?=?Bytes.toStringBinary(kv.getBuffer(),?kv.getOffset()+KeyValue.ROW_OFFSET?+?Bytes.SIZEOF_SHORT,?rowlength);??
  4. ????????return?rowKey;??
  5. ????}??

更多信息请查看?java进阶网?http://www.javady.com

读书人网 >开源软件

热点推荐