Sobre HBase
En la era de Grandes Datos, los sistemas de archivos tradicionales y las bases de datos relacionales ya no soportan ingentes cantidades de datos que todavia siguen aumentando. Sin embargo, ni la actualización de hardware ni el empleo de mecanismo de cálculo especial resuelve el problema de bajo rendimiento del sistema causado por el aumento drástico de los datos. En tal situación, Doug Cutting creó Hadoop, una plataforma del sistema de archivos distribuido que divide los datos en unidades aritméticas y unidades de almacenamiento para aliviar la carga de cada nodo.
Hadoop es nada más una plataforma. Los archivos se almacenan en HDFS(Hadoop Distributed File System) y se mantienen en forma de archivos. El sistema no tiene la función de escrituras y lecturas aleatorias. Por lo tanto, se creó Hbase para facilitar el acceso y almacenamiento de los datos. Hbase sirve como una base de almacenamiento y es sumamente diferente de las bases de datos relacionales. Este tipo de bases datos se llama NoSQL y cuenta con las siguietnes características :
1.Distribuido
Hbase se compone de tres elementos que son Master, Zookeeper y Region Server. Cada uno tiene su función especifíca. Master tiene la función de registrar Metadata. Zookeeper se encarga de la coordinación de las conexiones entre los nodos y Region Server gestiona y accesa al contenido de los archivos almacenados.
2.Multi-Dimensional
HBase almacena los datos con el concepto de Key-Value. Hbase puede especificar el contenido de los datos a través de Rowky, Column Family, Column Qualifier y Version. En comparación con la base de datos relacional que crea los espacios de almacenamiento de dos dimensiones por Row y Column, Hbase fue construida como una base multi-dimensional.
3.Alta Disponibilidad
Con respecto al almacenamiento de archivos, se puede establecer en el sistema de archivos distribuido y tiene copias de las informaciones. Si algún nodo está fuera de servicio, eso no afecta al acceso a los archivos . Con respecto a la gestión de la información, HBase clúster cuenta con varios Region Servers. Si algún Region Server está fuera de servcio, otro Region Server se va a encargar del servicio automáticamente.
4.Alto Rendimiento
Aparte de la capacidad de distribuir informaciones en bloques, cada bloque de archivos distribuidos posee la habilidad de calcular con independencia. Cuando los usuarios usan la base de archivos, cada bloque opera el cáculo por su cuenta, en el mismo tiempo, el bloque trata de satisfacer las demandas de cada usuario. De esta manera, se mejora el rendimiento del procesamiento de los datos.
5.Sistema de Almacenamiento
Hbase está estructurada con base del sistema de archivos distribuido.
6.Un Gran Mapa Clasificado
HBase almacena los los archivos con el concept de Key Value. La estructura de los datos es
Map<RowKey, Map <ColumnFamily, Map<ColumnQualifier, Map<Version, Data>>>>.
Los datos del mapa es una estructura de capas múltiples.
|