2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
Hadoop生態(tài)系統(tǒng)取得如此巨大成功的一個主要原因是它是一個免費(fèi)開放的大數(shù)據(jù)軟件框架。軟件開發(fā)人員可以訪問和修改其源代碼,以創(chuàng)建自己的大數(shù)據(jù)產(chǎn)品或應(yīng)用程序。Hadoop已經(jīng)創(chuàng)建了幾個大數(shù)據(jù)分析應(yīng)用程序。在大數(shù)據(jù)定義我們生活的時候,可以公平地說Hadoop一直在定義應(yīng)該如何分析大數(shù)據(jù)。這主要是因?yàn)锳pache Hadoop生態(tài)系統(tǒng)從開源軟件中獲得了原則值。在這種情況下,確定激發(fā)Hadoop生態(tài)系統(tǒng)的原則是非常恰當(dāng)?shù)?。突出原則將在下面討論。
啟發(fā)Apache Hadoop的突出開源原則
訪問源代碼 - 根據(jù)開源原則,任何人都可以使用開源軟件的源代碼進(jìn)行修改和增強(qiáng)。軟件開發(fā)人員甚至可以使用源代碼創(chuàng)建軟件應(yīng)用程序。因此,Hadoop框架正在被重用和修改,以圍繞它開發(fā)幾個軟件應(yīng)用程序。
協(xié)作 - 當(dāng)多個人聚在一起時,就會創(chuàng)建高質(zhì)量的開源軟件。協(xié)作可以產(chǎn)生新的想法,解決在孤島中工作的人可能無法解決的復(fù)雜問題,并發(fā)現(xiàn)查看問題的新方法。
不歧視任何利益 - 根據(jù)開源系統(tǒng),任何人都可以編輯源代碼,創(chuàng)建軟件應(yīng)用程序并免費(fèi)贈送,出售或用于研究目的。該原則激發(fā)了幾種軟件應(yīng)用程序的創(chuàng)建,這些應(yīng)用程序可以免費(fèi)獲得,也可以從商業(yè)上獲得。
許可證是技術(shù)中立的 - 開源許可證條款和條件不支持任何特定技術(shù)或編程語言。源代碼可用于在任何平臺上開發(fā)軟件應(yīng)用程序。
對使用的軟件沒有限制 - 任何訪問源代碼和開發(fā)其他軟件應(yīng)用程序的人都可以免費(fèi)使用其他軟件或其他源代碼。
開源對Hadoop生態(tài)系統(tǒng)的影響
Hadoop生態(tài)系統(tǒng)是一個全面,組織良好的安排,使大數(shù)據(jù)分析變得簡單而準(zhǔn)確。Hadoop生態(tài)系統(tǒng)包含多個軟件應(yīng)用程序,每個應(yīng)用程序都專門處理特定任務(wù)。然而,雖然整個生態(tài)系統(tǒng)是軟件工具的組合,但每個工具本身都能夠獨(dú)立完成專門的工作。這意味著您可以選擇實(shí)現(xiàn)目的所需的特定工具 - Hadoop非常靈活。Hadoop不會通過強(qiáng)制您以某種方式使用該軟件的規(guī)則來綁定您。您可以以任何您喜歡的方式使用源代碼。
讓我們來看看Hadoop生態(tài)系統(tǒng)如何工作的概述,以及它如何包含開源原則。
讓我們從Hadoop的基本定義開始。據(jù)IBM稱,“Apache Hadoop是一個開源軟件項(xiàng)目,可以跨商品服務(wù)器集群分布式處理大型數(shù)據(jù)集。它旨在從單個服務(wù)器擴(kuò)展到數(shù)千臺機(jī)器,具有非常高的容錯能力。這些集群的彈性不是依賴于高端硬件,而是來自軟件在應(yīng)用層檢測和處理故障的能力。“
Hadoop如何工作?Hadoop生態(tài)系統(tǒng)包含不同的單元,每個單元執(zhí)行不同的工作。不同的單位是:
Hadoop分布式文件系統(tǒng)(HDFS) - HDFS是Hadoop的大數(shù)據(jù)存儲系統(tǒng)。您可以存儲大量數(shù)據(jù)并在處理時取出數(shù)據(jù)。為了存儲數(shù)據(jù),Hadoop使用分布式框架,其中數(shù)據(jù)存儲在許多商品服務(wù)器上。這種安排是這樣的,即使服務(wù)器脫機(jī),它也不會干擾整個設(shè)置; 它照常營業(yè)。這就是使Hadoop成為一個彈性系統(tǒng)的原因。雖然HDFS是Hadoop自己的數(shù)據(jù)存儲工具,但它也可以使用外部文件系統(tǒng)來存儲數(shù)據(jù)。
MapReduce - MapReduce應(yīng)用程序分析和處理HDFS存儲的大數(shù)據(jù)。它從HDFS中提取數(shù)據(jù),而無需使用行業(yè)標(biāo)準(zhǔn)的SQL或其他查詢語言。MapReduce使用其他基于Java的應(yīng)用程序來處理數(shù)據(jù)。
Hadoop生態(tài)系統(tǒng)提供了速度和可靠性,因?yàn)閿?shù)據(jù)存儲和分析不依賴于托管數(shù)據(jù)的多個商用服務(wù)器中的任何一個。大數(shù)據(jù)以及HDFS和MapReduce存儲在每個商品服務(wù)器中。因此,即使一臺或多臺服務(wù)器出現(xiàn)故障,工作也不會中斷。這里的假設(shè)是服務(wù)器可能隨時出現(xiàn)故障并且無法停止。因此,系統(tǒng)需要到位,以確保在服務(wù)器出現(xiàn)故障時不會中斷工作。
Hadoop的一大特色是它的靈活性。要開發(fā)軟件應(yīng)用程序,Hadoop的用戶不一定需要使用HDFS或MapReduce。例如,Amazon Web Services系統(tǒng)已將其專有的S3文件系統(tǒng)與Hadoop相匹配,而無需使用HDFS。同樣,DataStax Brisk是一個不使用HDFS的Hadoop應(yīng)用程序。而是使用Apache Cassandra的 CassandraFS。因此,您已經(jīng)可以看到開源系統(tǒng)的原理如何激發(fā)了Hadoop生態(tài)系統(tǒng)。
確定開源對Hadoop的影響并不難??梢钥隙ǖ卣f,Hadoop生態(tài)系統(tǒng)將編寫將來如何處理大數(shù)據(jù)的規(guī)則。只要Hadoop忠于開源軟件的價值,就會出現(xiàn)這種情況。開源是Hadoop生態(tài)系統(tǒng)的精神和靈魂。無論軟件工具多么強(qiáng)大或智能,如果不向全球軟件社區(qū)提供或共享,它就無法獲得普遍接受。
目前,開源軟件是所有軟件社區(qū)的主要吸引力。Apache Hadoop是最成功的開源平臺之一。相關(guān)的Hadoop生態(tài)系統(tǒng)產(chǎn)品也基于開源軟件。開源哲學(xué)肯定會在不久的將來受歡迎,這意味著我們可以期待許多新的軟件平臺。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。