HBase 紹介

Big Data 時代に入ると、データの数は以前より多くなり、 関係データベースにすなわちデータ管理システムの効率が日々膨大なデータ成長速度に対応できないこと。 データの数が増え、あえてシステムの効率がデータの成長に追い詰めません。 ハードウェアアップグランド、 特別なコンピューティングでも有効的に解決してきません。 こんな状況に Doug Cutting は 2006 年で Hadoop 分散プラットフォームを開発しました。データを複数コンピューティングユニットとユニット、 分散概念で、データを集中管理ため、ひとつのインターセプトポイントの負擔を減ってきます。

Hadoop はプラットフォーム、Random Reads and Writes をサポートしてない、 存放してるデータが分散的に、ファイルとして読み書く。 Hadoop 環境でのデータをもっと便利的に存取するため、HBase が生まれる。 データベースに似てる格納環境、 関係データベースアーキテクチャ的に大違いがあるので、こういうタイプのデータベースが NoSQL データベースと呼ぶ。 以下の特徴があります:

(一)Distributed 分散的
HBase は Master、Zookeeper と Region Server 三つの要素を含む。 Master は Metadata の記録、Zookeeper はインターセプトポイントの諧調、Region Server はデータ内容を管理や検索すること。

(二)Multi-Dimensional 多次元セーブ
HBase は Key-Value の概念でデータセーブ、Rowkey、Column Family、Column QualifierとVersion を使って、 唯一のデータ内容を指定することができるブラント。 Row と Column を生まれた二次元格納スペースの RDB と比べて、HBase は多維度のデータ格納スペース。

(三)High-Availability 高可靠性
データバックアップは可能あること。Hadoop 分散ファイルシステム HDFS で築け、 データバックアップやデータ検索と再利用を影響しないこと。データの管理者にとって、 HBase Cluster は多くの Region Server が存在し、ひとつの Region Server が崩れても、 自動的にもうひとつも Region Server で Client のサービスします。

(四)High-Performance 高効率
HBase の分散システムで、データが分散的に存放であり、 一つ一つ分散してるデータ區塊は各自のコンピューティング能力を持っています。 ユーザがデータベースシステムを利用し場合、分散したデータは各自でコンピューティング、 ユーザの要求を同時、効率的に運算します。

(五)Storage System 儲存システム
HBase は分散式プラットフォームに築るデータベースである。

(六)A Big Sorted Map
HBase のデータはKey-Value方式で存放、データアーキテクチャは, 資料結構為 Map<RowKey, Map <ColumnFamily, Map<ColumnQualifier, Map<Version, Data>>>>、 このような多層的Mapデータアーキテクチャ。