HBase 紹介
Big Data 時代に入ると、データの数は以前より多くなり、
関係データベースにすなわちデータ管理システムの効率が日々膨大なデータ成長速度に対応できないこと。
データの数が増え、あえてシステムの効率がデータの成長に追い詰めません。
ハードウェアアップグランド、
特別なコンピューティングでも有効的に解決してきません。
こんな状況に Doug Cutting は 2006 年で Hadoop 分散プラットフォームを開発しました。データを複数コンピューティングユニットとユニット、
分散概念で、データを集中管理ため、ひとつのインターセプトポイントの負擔を減ってきます。
Hadoop はプラットフォーム、Random Reads and Writes をサポートしてない、
存放してるデータが分散的に、ファイルとして読み書く。
Hadoop 環境でのデータをもっと便利的に存取するため、HBase が生まれる。
データベースに似てる格納環境、
関係データベースアーキテクチャ的に大違いがあるので、こういうタイプのデータベースが NoSQL データベースと呼ぶ。
以下の特徴があります:
(一)Distributed 分散的
HBase は Master、Zookeeper と Region Server 三つの要素を含む。
Master は Metadata の記録、Zookeeper はインターセプトポイントの諧調、Region Server はデータ内容を管理や検索すること。
(二)Multi-Dimensional 多次元セーブ
HBase は Key-Value の概念でデータセーブ、Rowkey、Column Family、Column QualifierとVersion を使って、
唯一のデータ内容を指定することができるブラント。
Row と Column を生まれた二次元格納スペースの RDB と比べて、HBase は多維度のデータ格納スペース。
(三)High-Availability 高可靠性
データバックアップは可能あること。Hadoop 分散ファイルシステム HDFS で築け、
データバックアップやデータ検索と再利用を影響しないこと。データの管理者にとって、
HBase Cluster は多くの Region Server が存在し、ひとつの Region Server が崩れても、
自動的にもうひとつも Region Server で Client のサービスします。
(四)High-Performance 高効率
HBase の分散システムで、データが分散的に存放であり、
一つ一つ分散してるデータ區塊は各自のコンピューティング能力を持っています。
ユーザがデータベースシステムを利用し場合、分散したデータは各自でコンピューティング、
ユーザの要求を同時、効率的に運算します。
(五)Storage System 儲存システム
HBase は分散式プラットフォームに築るデータベースである。
(六)A Big Sorted Map
HBase のデータはKey-Value方式で存放、データアーキテクチャは,
資料結構為 Map<RowKey, Map <ColumnFamily, Map<ColumnQualifier, Map<Version, Data>>>>、
このような多層的Mapデータアーキテクチャ。
|