草逼一级片 , 天天在线综合 , 亚洲三级电影免费观看 , 亚洲国产青草,国产高清对白,91偷拍精品一区二区三区,精品亚洲成a人在线观看青青

一圖簡述大數(shù)據(jù)技術(shù)生態(tài)圈

2018-12-18 09:10:32 不可錯過的大數(shù)據(jù)  點擊量: 評論 (0)
大數(shù)據(jù)技術(shù)生態(tài)圈主要的組件都是為了方便大家從底層的MapReduce模型中脫離出來,用高層語言來做分布式計算

下面是一張生態(tài)圖,主要的組件都是為了方便大家從底層的MapReduce模型中脫離出來,用高層語言來做分布式計算,下文將分別為你作簡述。

一圖簡述大數(shù)據(jù)技術(shù)生態(tài)圈

1、HBase

是一個高可靠性、高性能、面向列、可伸縮的分布式存儲系統(tǒng),利用HBase技術(shù)可在廉價PC Server上搭建起大規(guī)模結(jié)構(gòu)化數(shù)據(jù)集群。像Facebook,都拿它做大型實時應(yīng)用。

2、Hive

Facebook領(lǐng)導(dǎo)的一個數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供完整的sql查詢功能,可以將sql語句轉(zhuǎn)換為MapReduce任務(wù)進行運行。其優(yōu)點是學(xué)習(xí)成本低,可以通過類SQL語句快速實現(xiàn)簡單的MapReduce統(tǒng)計。像一些data scientist 就可以直接查詢,不需要學(xué)習(xí)其他編程接口。

3、Pig

Yahoo開發(fā)的,并行地執(zhí)行數(shù)據(jù)流處理的引擎,它包含了一種腳本語言,稱為Pig Latin,用來描述這些數(shù)據(jù)流。Pig Latin本身提供了許多傳統(tǒng)的數(shù)據(jù)操作,同時允許用戶自己開發(fā)一些自定義函數(shù)用來讀取、處理和寫數(shù)據(jù)。在LinkedIn也是大量使用。

4、Cascading/Scalding

Cascading是Twitter收購的一個公司技術(shù),主要是提供數(shù)據(jù)管道的一些抽象接口,然后又推出了基于Cascading的Scala版本就叫Scalding。Coursera是用Scalding作為MapReduce的編程接口放在Amazon的EMR運行。

5、Zookeeper

一個分布式的,開放源碼的分布式應(yīng)用程序協(xié)調(diào)服務(wù),是Google的Chubby一個開源的實現(xiàn)。

6、Oozie、Hadoop

一個基于工作流引擎的開源框架。由Cloudera公司貢獻給Apache的,它能夠提供對MapReduce和Pig Jobs的任務(wù)調(diào)度與協(xié)調(diào)。

7、Azkaban

跟上面很像,Linkedin開源的面向Hadoop的開源工作流系統(tǒng),提供了類似于cron 的管理任務(wù)。

8、Tez

Hortonworks主推的優(yōu)化MapReduce執(zhí)行引擎,與MapReduce相比較,Tez在性能方面更加出色。

大云網(wǎng)官方微信售電那點事兒

責(zé)任編輯:滄海一笑

免責(zé)聲明:本文僅代表作者個人觀點,與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。
我要收藏
個贊
?