Coprocessor是HBase的一項利器,利用早已分散的Region,以及做好排序的rowkey做運算,可以大大的提高,取資料與運算資料的效能~
Hive是一項在big data中做ETL相關工作不可或缺的工具,但卻礙於MapReduce,造成效能的相關問題。
當HBase coprocessor + Hive = Hare 一隻飛快的兔子馳騁在HBase的大資料草原上~
與大家分享,我們開發的思考,架構與實測數據~