勵志

勵志人生知識庫

hadoop是什麼

分散式系統基礎架構

Hadoop是一個由Apache基金會開發的分散式系統基礎架構,旨在讓用戶能夠高效地利用集群資源進行海量數據的存儲和計算。

Hadoop提供了分散式檔案系統(HDFS),這個系統具有高容錯性,特別適合部署在低成本硬體上,並能提供高吞吐量的數據訪問,非常適合處理超大數據集。Hadoop的核心設計包括HDFS和MapReduce,其中HDFS負責海量數據的存儲,而MapReduce則提供計算能力。

此外,Hadoop是用Java語言編寫的,自2008年成為Apache的頂級項目以來,發展迅速,已經成為當前使用最廣泛的大數據處理框架之一。