Hadoopとは

Hadoop は、分散コンピューティングでデータ処理を実現する基盤を提供します。
Apacheでソース管理されているオープンソース・ソフトウェアです。

大きく2つの機能を有します。
(1)HDFS(Hadoop Distributed File System)
複数のスレーブコンピュータ内のローカルディスク上に作成した(各ノードに分散している)ファイル領域を共有する独自のファイルシステムです。

(2)Map/Reduce
分散コンピューティング処理を実現するJavaアプリケーション

Hadoopは元々Googleが検索エンジンのインデックスを作成するために開発された技術に端を発しています。

Googleのエンジニアがそのベースとなる技術を論文発表したことで、広く知られるようになりました。そのため、Hadoopの開発ソースは、Googleが開発したものとは全く別物です。

 

- Sponsored Link -