HBase 简介
简介
HBase
基于 HDFS 的大表软件(实时数据库)
十亿行 x 百万列 x 上千个版本
版本是通过 mvcc 技术控制:multiple version concurrent control
HBase 数据是以字节形式存储
HBase 和 Hive 的区别
1 | # 数据库,不支持分析 |
HBase 安装
本地安装
1 | # 1.解压 |
完全分布式安装
1 | # 0.关闭hbase进程 |
HBase 数据模型
HBase 命令
HBase 与 SQL 的区别
1 | # 1.进入hbase命令行 |
合并 HBase 中的小文件
1 | major_compact 'test:t1' |
删除数据的区别
HBase 在 shell 中删除时将整条记录删除
HBase 在 api 中是删除最新版本的记录
HBase 开发
HBase API 使用
TestHbase
Demo1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17# 创建创建命名空间
createNS()
# 创建表
createTable()
# 插入数据
putData1()
# 批量插入数据
putData2()
# 删除数据
delData()
# 删除表
dropTable()
HBase 原理
HBase 写入过程
1 | # hbase数据在写入时,将数据写到WAL,同时写入到memstore(内存)中 |