您的位置: 首頁 >游戲 >

開源對Apache Hadoop生態(tài)系統(tǒng)的影響是什么

2022-08-19 21:00:41 編輯:蕭曼武 來源:
導(dǎo)讀 Hadoop生態(tài)系統(tǒng)取得如此巨大成功的一個主要原因是它是一個免費(fèi)開放的大數(shù)據(jù)軟件框架。軟件開發(fā)人員可以訪問和修改其源代碼,以創(chuàng)建自己的大...

Hadoop生態(tài)系統(tǒng)取得如此巨大成功的一個主要原因是它是一個免費(fèi)開放的大數(shù)據(jù)軟件框架。軟件開發(fā)人員可以訪問和修改其源代碼,以創(chuàng)建自己的大數(shù)據(jù)產(chǎn)品或應(yīng)用程序。Hadoop已經(jīng)創(chuàng)建了幾個大數(shù)據(jù)分析應(yīng)用程序。在大數(shù)據(jù)定義我們生活的時候,可以公平地說Hadoop一直在定義應(yīng)該如何分析大數(shù)據(jù)。這主要是因?yàn)锳pache Hadoop生態(tài)系統(tǒng)從開源軟件中獲得了原則值。在這種情況下,確定激發(fā)Hadoop生態(tài)系統(tǒng)的原則是非常恰當(dāng)?shù)?。突出原則將在下面討論。

啟發(fā)Apache Hadoop的突出開源原則

訪問源代碼 - 根據(jù)開源原則,任何人都可以使用開源軟件的源代碼進(jìn)行修改和增強(qiáng)。軟件開發(fā)人員甚至可以使用源代碼創(chuàng)建軟件應(yīng)用程序。因此,Hadoop框架正在被重用和修改,以圍繞它開發(fā)幾個軟件應(yīng)用程序。

協(xié)作 - 當(dāng)多個人聚在一起時,就會創(chuàng)建高質(zhì)量的開源軟件。協(xié)作可以產(chǎn)生新的想法,解決在孤島中工作的人可能無法解決的復(fù)雜問題,并發(fā)現(xiàn)查看問題的新方法。

不歧視任何利益 - 根據(jù)開源系統(tǒng),任何人都可以編輯源代碼,創(chuàng)建軟件應(yīng)用程序并免費(fèi)贈送,出售或用于研究目的。該原則激發(fā)了幾種軟件應(yīng)用程序的創(chuàng)建,這些應(yīng)用程序可以免費(fèi)獲得,也可以從商業(yè)上獲得。

許可證是技術(shù)中立的 - 開源許可證條款和條件不支持任何特定技術(shù)或編程語言。源代碼可用于在任何平臺上開發(fā)軟件應(yīng)用程序。

對使用的軟件沒有限制 - 任何訪問源代碼和開發(fā)其他軟件應(yīng)用程序的人都可以免費(fèi)使用其他軟件或其他源代碼。

開源對Hadoop生態(tài)系統(tǒng)的影響

Hadoop生態(tài)系統(tǒng)是一個全面,組織良好的安排,使大數(shù)據(jù)分析變得簡單而準(zhǔn)確。Hadoop生態(tài)系統(tǒng)包含多個軟件應(yīng)用程序,每個應(yīng)用程序都專門處理特定任務(wù)。然而,雖然整個生態(tài)系統(tǒng)是軟件工具的組合,但每個工具本身都能夠獨(dú)立完成專門的工作。這意味著您可以選擇實(shí)現(xiàn)目的所需的特定工具 - Hadoop非常靈活。Hadoop不會通過強(qiáng)制您以某種方式使用該軟件的規(guī)則來綁定您。您可以以任何您喜歡的方式使用源代碼。

讓我們來看看Hadoop生態(tài)系統(tǒng)如何工作的概述,以及它如何包含開源原則。

讓我們從Hadoop的基本定義開始。據(jù)IBM稱,“Apache Hadoop是一個開源軟件項(xiàng)目,可以跨商品服務(wù)器集群分布式處理大型數(shù)據(jù)集。它旨在從單個服務(wù)器擴(kuò)展到數(shù)千臺機(jī)器,具有非常高的容錯能力。這些集群的彈性不是依賴于高端硬件,而是來自軟件在應(yīng)用層檢測和處理故障的能力。“

Hadoop如何工作?Hadoop生態(tài)系統(tǒng)包含不同的單元,每個單元執(zhí)行不同的工作。不同的單位是:

Hadoop分布式文件系統(tǒng)(HDFS) - HDFS是Hadoop的大數(shù)據(jù)存儲系統(tǒng)。您可以存儲大量數(shù)據(jù)并在處理時取出數(shù)據(jù)。為了存儲數(shù)據(jù),Hadoop使用分布式框架,其中數(shù)據(jù)存儲在許多商品服務(wù)器上。這種安排是這樣的,即使服務(wù)器脫機(jī),它也不會干擾整個設(shè)置; 它照常營業(yè)。這就是使Hadoop成為一個彈性系統(tǒng)的原因。雖然HDFS是Hadoop自己的數(shù)據(jù)存儲工具,但它也可以使用外部文件系統(tǒng)來存儲數(shù)據(jù)。

MapReduce - MapReduce應(yīng)用程序分析和處理HDFS存儲的大數(shù)據(jù)。它從HDFS中提取數(shù)據(jù),而無需使用行業(yè)標(biāo)準(zhǔn)的SQL或其他查詢語言。MapReduce使用其他基于Java的應(yīng)用程序來處理數(shù)據(jù)。

Hadoop生態(tài)系統(tǒng)提供了速度和可靠性,因?yàn)閿?shù)據(jù)存儲和分析不依賴于托管數(shù)據(jù)的多個商用服務(wù)器中的任何一個。大數(shù)據(jù)以及HDFS和MapReduce存儲在每個商品服務(wù)器中。因此,即使一臺或多臺服務(wù)器出現(xiàn)故障,工作也不會中斷。這里的假設(shè)是服務(wù)器可能隨時出現(xiàn)故障并且無法停止。因此,系統(tǒng)需要到位,以確保在服務(wù)器出現(xiàn)故障時不會中斷工作。

Hadoop的一大特色是它的靈活性。要開發(fā)軟件應(yīng)用程序,Hadoop的用戶不一定需要使用HDFS或MapReduce。例如,Amazon Web Services系統(tǒng)已將其專有的S3文件系統(tǒng)與Hadoop相匹配,而無需使用HDFS。同樣,DataStax Brisk是一個不使用HDFS的Hadoop應(yīng)用程序。而是使用Apache Cassandra的 CassandraFS。因此,您已經(jīng)可以看到開源系統(tǒng)的原理如何激發(fā)了Hadoop生態(tài)系統(tǒng)。

確定開源對Hadoop的影響并不難??梢钥隙ǖ卣f,Hadoop生態(tài)系統(tǒng)將編寫將來如何處理大數(shù)據(jù)的規(guī)則。只要Hadoop忠于開源軟件的價值,就會出現(xiàn)這種情況。開源是Hadoop生態(tài)系統(tǒng)的精神和靈魂。無論軟件工具多么強(qiáng)大或智能,如果不向全球軟件社區(qū)提供或共享,它就無法獲得普遍接受。

目前,開源軟件是所有軟件社區(qū)的主要吸引力。Apache Hadoop是最成功的開源平臺之一。相關(guān)的Hadoop生態(tài)系統(tǒng)產(chǎn)品也基于開源軟件。開源哲學(xué)肯定會在不久的將來受歡迎,這意味著我們可以期待許多新的軟件平臺。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。