HBase 体系结构

在HBase中,表被分割成区域并由区域服务器提供服务。区域按列族垂直划分为“商店”。商店被保存为HDFS文件。下面显示的是HBase的体系结构。

注意: 术语'商店'用于区域来解释存储结构。

HBase体系结构

HBase有三个主要组件:客户端库,主服务器和区域服务器。区域服务器可以根据需要添加或删除。

1. MasterServer

主服务器

  • 将区域分配给区域服务器,并借助Apache ZooKeeper执行此任务。
  • 处理跨区域服务器区域的负载均衡。它卸载繁忙的服务器并将区域转移到占用较少的服务器。
  • 通过协商负载平衡来维护集群的状态。
  • 负责架构更改和其他元数据操作,如创建表和列族。

2. 地区

区域只不过是分割并遍布区域服务器的表格。

区域服务器

区域服务器具有以下区域 -

  • 与客户沟通并处理与数据相关的操作。
  • 处理其下所有区域的读取和写入请求。
  • 按照区域大小阈值决定区域的大小。

当我们深入了解区域服务器时,它包含区域和商店,如下所示:

区域服务器

该商店包含内存存储和HFiles。Memstore就像一个缓存内存。输入到HBase中的任何内容都将存储在此处。稍后,数据将作为块传输并保存在Hfiles中,并刷新内存。

3. Zookeeper

  • Zookeeper是一个开源项目,提供维护配置信息,命名,提供分布式同步等服务。
  • Zookeeper具有代表不同区域服务器的短暂节点。主服务器使用这些节点来发现可用的服务器。
  • 除可用性外,节点还用于跟踪服务器故障或网络分区。
  • 客户端通过zookeeper与区域服务器通信。
  • 在伪和独立模式下,HBase本身会照顾动物园管理员。

下一章:HBase 安装

本章介绍HBase的安装和初始配置。Java和Hadoop需要继续使用HBase,因此您必须在系统中下载并安装Java和Hadoop。1. 预安装设置在将Hadoop安装到Linux环境中之前,我们需要使用 ssh (Se ...