HareDB架構及功能

HareDB (www.HareDB.com) 是一個巨量資料分析的品牌,提供架構在 Hadoop 環境之上的解決方案, 運用其擴展容易及備援穩定的優勢,協助企業客戶建立快速敏捷、高整合度及大容量的新一代資料庫。 HareDB 系統包含從硬體、作業系統、Hadoop 系統、HBase 及相關工具、資料結構定義工具、資料庫轉換及分析工具等, 其架構如下圖:

HareDB 開發團隊在資料分析上有多年的經驗,為了整合客戶原有的關聯式資料庫, 透過發展具加值潛力的應用整合軟體,並以混合式 (Hybrid) 的整體解決方案提供給企業用戶, 大幅提升企業資料分析的決策能量,所以整體而言,是提供一系列的NoSQL資料庫開發及管理工具, 也就是架構圖上半部的工具組合,並定期發佈到開發軟體網站供使用者下載 (例如 SourceForge 網站), HareDB 系列產品包括定義資料模型的 Data Model Manager、 資料查詢及圖形化操作介面的 HBase Client、 關聯式資料庫轉換工具 RDB Converter 及 JackHare JDBC 等,可以協助及整合客戶的 Big Data, 這些工具主要的定位如下說明:

(一)Data Model Manager
NoSQL 資料庫結構與傳統的關聯式資料庫是不同的,如何設計 Schema 是令管理者困擾的問題, 我們提供資料模型的建構及定義工具,讓管理者可以參考原有關聯式結構以縮短建構時間, 並確保架構正確與高效能。

(二)HareDB HBase Client
不僅是 HBase 的視覺化 Client 工具,更是 Hadoop 檔案的檢視及查詢工具, 可以讓使用者不再局限於原有查詢方式的不便,進而增進資料分析與處理的效能。

(三)RDB Converter與JackHare JDBC
透過標準的 JDBC 通道與原有關聯式資料庫整合,可以保留原來資料庫相關的應用系統, 而非全部取代,大幅降低導入新技術的成本,也維持原有資料分析系統的能力。

除了以上的系列工具之外,整體系統基礎架構則為了確保系統的穩定及管理便利的考量, 採用驗證過的知名廠商 Hadoop 版本為系統核心,節省自行管理及改善 open source 的成本, 縮短分散式資料庫的上線時間,讓企業用戶有一個完整且開放的穩定架構。