HBase 系列(三)HBase Shell分析

符号 阅读:189 2020-02-20 19:09:40 评论:0

HBase 系列(三)HBase Shell

./hbase shell   # 进入 hbase 命令行

(1) HBase 命令帮助

help        # 查看 HBase 所有的命令 
create      # 或 help 'create'   查看 create 的帮助命令 
list        # 查看 HBase 所有的表

(2) 名称空间,类似 mysql 中的数据库

list_namespace      # 列出所有的数据库 
create_namespace 'ns1'              # 列出所有的数据库 
list_namespace_tables 'default'     # 查看数据库 default 中所有的表

(3) 创建表

# 创建user表,包含info、data两个列族 
create 'user', 'info', 'data' 
create 'user', {NAME => 'info', VERSIONS => '3'} 
 
# 查看表结构 
describe 'user' 
 
# 删除表 
disable 'user' 
drop 'user'

(4) 插入数据

# 语法:put <table>,<rowkey>,<family:column>,<value>,<timestamp> 
# 向user表中插入信息,row key为rk0001,列族info中添加name列标示符,值为zhangsan 
put 'user', 'rk0001', 'info:name', 'zhangsan' 
put 'user', 'rk0001', 'info:gender', 'female' 
put 'user', 'rk0001', 'info:age', 20 
put 'user', 'rk0001', 'data:pic', 'picture'

(5) 查数据(get)

# 获取user表中row key为rk0001的所有信息 
get 'user', 'rk0001' 
 
# 获取user表中row key为rk0001,info列族的所有信息 
get 'user', 'rk0001', 'info' 
 
# 获取user表中row key为rk0001,info列族的name、age列标示符的信息 
get 'user', 'rk0001', 'info:name', 'info:age' 
 
# 获取user表中row key为rk0001,info、data列族的信息 
get 'user', 'rk0001', 'info', 'data' 
get 'user', 'rk0001', {COLUMN => ['info', 'data']} 
 
get 'user', 'rk0001', {COLUMN => ['info:name', 'data:pic']} 
 
# 获取user表中row key为rk0001,列族为info,版本号最新5个的信息 
get 'user', 'rk0001', {COLUMN => 'info', VERSIONS => 2} 
get 'user', 'rk0001', {COLUMN => 'info:name', VERSIONS => 5} 
get 'user', 'rk0001', {COLUMN => 'info:name', VERSIONS => 5, TIMERANGE => [1392368783980, 1392380169184]} 
 
# 获取user表中row key为rk0001,cell的值为zhangsan的信息 
get 'people', 'rk0001', {FILTER => "ValueFilter(=, 'binary:图片')"} 
 
# 获取user表中row key为rk0001,列标示符中含有a的信息 
get 'people', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"} 
 
put 'user', 'rk0002', 'info:name', 'fanbingbing' 
put 'user', 'rk0002', 'info:gender', 'female' 
put 'user', 'rk0002', 'info:nationality', '中国' 
get 'user', 'rk0002', {FILTER => "ValueFilter(=, 'binary:中国')"}

(6) 查数据(scan)

# 查询user表中的所有信息 
scan 'user' 
 
# 查询user表中列族为info的信息 
scan 'user', {COLUMNS => 'info'} 
scan 'user', {COLUMNS => 'info', RAW => true, VERSIONS => 5} 
scan 'persion', {COLUMNS => 'info', RAW => true, VERSIONS => 3} 
# 查询user表中列族为info和data的信息 
scan 'user', {COLUMNS => ['info', 'data']} 
scan 'user', {COLUMNS => ['info:name', 'data:pic']} 
 
 
# 查询user表中列族为info、列标示符为name的信息 
scan 'user', {COLUMNS => 'info:name'} 
 
# 查询user表中列族为info、列标示符为name的信息,并且版本最新的5个 
scan 'user', {COLUMNS => 'info:name', VERSIONS => 5} 
 
# 查询user表中列族为info和data且列标示符中含有a字符的信息 
scan 'user', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"} 
 
# 查询user表中列族为info,rk范围是[rk0001, rk0003)的数据 
scan 'people', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'} 
 
# 查询user表中row key以rk字符开头的 
scan 'user',{FILTER=>"PrefixFilter('rk')"} 
 
# 查询user表中指定范围的数据 
scan 'user', {TIMERANGE => [1392368783980, 1392380169184]}

(7) 删除数据

# 删除user表row key为rk0001,列标示符为info:name的数据 
delete 'people', 'rk0001', 'info:name' 
# 删除user表row key为rk0001,列标示符为info:name,timestamp为1392383705316的数据 
delete 'user', 'rk0001', 'info:name', 1392383705316 
 
# 清空user表中的数据 
truncate 'people'

(8) 修改表结构

# 首先停用user表(新版本不用) 
disable 'user' 
 
# 添加两个列族f1和f2 
alter 'people', NAME => 'f1' 
alter 'user', NAME => 'f2' 
# 启用表 
enable 'user' 
 
# 删除一个列族: 
alter 'user', NAME => 'f1', METHOD => 'delete' 或 alter 'user', 'delete' => 'f1' 
 
# 添加列族f1同时删除列族f2 
alter 'user', {NAME => 'f1'}, {NAME => 'f2', METHOD => 'delete'} 
 
# 将user表的f1列族版本号改为5 
alter 'people', NAME => 'info', VERSIONS => 5

(9) 过滤(filter)

get 'person', 'rk0001', {FILTER => "ValueFilter(=, 'binary:中国')"} 
get 'person', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"} 
scan 'person', {COLUMNS => 'info:name'} 
scan 'person', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"} 
scan 'person', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'} 
 
scan 'person', {COLUMNS => 'info', STARTROW => '20140201', ENDROW => '20140301'} 
scan 'person', {COLUMNS => 'info:name', TIMERANGE => [1395978233636, 1395987769587]} 
delete 'person', 'rk0001', 'info:name' 
 
alter 'person', NAME => 'ffff' 
alter 'person', NAME => 'info', VERSIONS => 10 
 
get 'user', 'rk0002', {COLUMN => ['info:name', 'data:pic']}

每天用心记录一点点。内容也许不重要,但习惯很重要!

标签:hadoop
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

发表评论
搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容