博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
HBase安装
阅读量:6412 次
发布时间:2019-06-23

本文共 3792 字,大约阅读时间需要 12 分钟。

  hot3.png

1. 千篇一律的HBase简介

HBase是Hadoop的数据库, 而Hive数据库的管理工具, HBase具有分布式, 可扩展及面向列存储的特点(基于谷歌BigTable). HBase可以使用本地文件系统和HDFS文件存储系统, 存储的是松散的数据(key-value的映射关系).

HBase位于HDFS的上层, 向下提供存储, 向上提供运算

2. HBase安装

HBase有单机, 伪分布式, 全分布式运行模式

依赖:

  • 匹配HBase的Hadoop版本
  • Java JDK 1.6+
  • SSH

安装

$ brew install hbase# 安装在/usr/local/Cellar/hbase/1.0.0

配置HBase

conf/hbase-env.sh设置JAVA_HOME

$ cd /usr/local/Cellar/hbase/1.0.0/libexec/conf$ vim hbase-env.shexport JAVA_HOME="/usr/bin/java"

conf/hbase-site.xml设置HBase的核心配置

$ vim hbase-site.xml
hbase.rootdir
//这里设置让HBase存储文件的地方
file:///Users/andrew_liu/Downloads/hbase
hbase.zookeeper.property.dataDir
//这里设置让HBase存储内建zookeeper文件的地方
/Users/andrew_liu/Downloads/zookeeper

/usr/local/Cellar/hbase/1.0.0/bin/start-hbase.sh提供HBase的启动

$ ./start-hbase.sh                                          starting master, logging to /usr/local/Cellar/hbase/1.0.0/libexec/bin/../logs/hbase-andrew_liu-master-Andrew-liudeMacBook-Pro.local.out

验证是否安装成功

$ jps3440 Jps3362 HMaster # 有HMaster则说明安装成功1885

启动HBase Shell

$ ./bin/hbase shellHBase Shell; enter 'help
' for list of supported commands.Type "exit
" to leave the HBase ShellVersion 1.0.0, r6c98bff7b719efdb16f71606f3b7d8229445eb81, Sat Feb 14 19:49:22 PST 20151.8.7-p357 :001 >1.8.7-p357 :001 > exit #退出shell

停止HBase运行

$ ./bin/stop-hbase.shstopping hbase....................

3. 伪分布式模式

必须关闭HBase

修改hbase-env.sh

HBASE_MANAGE_XK = true

修改hbase-site.xml, 设置HBase使用分布式模式运行

hbase.rootdir
//Here you have to set the path where you want HBase to store its files.
hdfs://localhost:8020/hbase
hbase.cluster.distributed
true

hbase.rootdir路径一定要跟hadoop中core-site.xml中fs.default.name相同

change the hbase.rootdir from the local filesystem to the address of your HDFS instance ---offical quick start

如何两处设置不同会引起ERROR: Can't get master address from ZooKeeper; znode data == null错误错误

在启动HBase之前, 请先启动Hadoop, 使之运行

启动HBase

$ ./start-hbase.sh$ jps  #验证是否启动成功, 包含HMaster和HRegionServer说明启动成功6400 DataNode7872 Jps7702 HMaster  7624 HQuorumPeer6315 NameNode6508 SecondaryNameNode6716 NodeManager7804 HRegionServerHBase 6623 ResourceManager

如果在启动HBase后, 提示如下

regionserver running as process 4667. Stop it first.#请执行以下操作$ kill -9 4667  #这里4667是要杀掉的进程号

启动成功HBase会在HDFS下创建/hbase目录

$ hdfs dfs -ls /hbase

4. HBase Shell

$ hbase shell  #启动HBase Shell#创建表> create 'student', 'description', 'course'  #创建表名为student的表, 指明两个列名, 分别为description和course#信息明细> list 'student'  #列出list表信息#插入数据> put 'student', 'row1', 'description:age', '18'  #意思为在student表row1处插入description:age的数据为18> put 'student', 'row1', 'description:name', 'liu'put 'student', 'row1', 'course:chinese', '100'#一次扫描所有数据> scan 'student#使表失效 / 有效> disable 'student'> enable 'student'#删除表(要先disable)>  drop 'student'#退出shell> quit

5. HBase与HDFS

HBase是一个稀疏的长期存储的, 多维度的, 排序的映射表, 通过行键, 行键 + 时间戳 或 行键 + 列(列族: 列修饰符)就可以定位特殊的数据

5.1. HBase体系结构

HBase的服务器体系遵从简单的主从服务器架构, 由HRegion服务器群HBase服务器构成, Master服务器负责管理所有的HRegion服务器, 而HBase中所有的服务器通过ZooKeeper来进行协调并处理HBase服务器运行期间可能遇到的错误.

HBase逻辑上的表可能会被划分为多个HRegion, 然后存储在HRegion服务器上.

  • HBase不涉及数据的直接删除和更新, 当Store中的Storefile数量超出阈值会触发合并操作
  • HMaster的主要任务是告诉每个HRegion服务器它要维护那些HRegion
  • ZooKeeper存储的是HBase中ROOT表和META表的位置, ZooKeeper还负责监控各个机器的状态

元数据子表采用三级索引结构: 根子表->用户表的元数据表->用户表

5.2. Java API

  • HBaseConfiguration, 通过此类对HBase进行配置
  • HBaseAdmin, 提供一个接口来管理HBase数据库的表信息, 提供创建, 删除表, 列出表项, 使表有效或无效, 以及添加或删除列族成员
  • HTableDescriptor, 包含了表的名字及对应表的列族
  • HColumnDescriptor, 维护关于列族的信息
  • HTable, 用来与HBase表进行通信
  • Put, 用来对单个行执行添加操作
  • Get, 用来获取单个行的相关信息
  • Result, 存储Get或者Scan操作后获取的表的单行值

6. 参考链接

  • <Hadoop Action>

转载于:https://my.oschina.net/wqm6/blog/774837

你可能感兴趣的文章
css3 变形
查看>>
Win7 64bit 安装Mysql5 出错 无法启动服务。
查看>>
嵌入式 H264参数语法文档: SPS、PPS、IDR以及NALU编码规律
查看>>
初识Opserver,StackExchange的监控解决方案
查看>>
给大家讲解一下JavaScript与后台Java天衣无缝相结合
查看>>
探索HTML5之本地文件系统API - File System API
查看>>
javascript有用代码块(1)
查看>>
libevent 笔记
查看>>
PHP实现人人OAuth登录和API调用
查看>>
redis源码笔记 - initServer
查看>>
FindBugs工具常见问题
查看>>
ECSHOP报错误Deprecated: preg_replace(): The /e modifier is depr
查看>>
【iOS】iOS之Button segue弹出popOver消除(dismiss)问题
查看>>
java多线程系列5-死锁与线程间通信
查看>>
数据库分库分表
查看>>
腾讯Hermes设计概要——数据分析用的是列存储,词典文件前缀压缩,倒排文件递增id、变长压缩、依然是跳表-本质是lucene啊...
查看>>
小程序模板嵌套以及相关遍历数据绑定
查看>>
Systemd入门教程:命令篇(转)
查看>>
java随机范围内的日期
查看>>
linux包之diff
查看>>