Doug Cutting hatte das Problem, das Internet (sprich alles HTML) herunterzuladen und zu speichern. Das war vor zehn Jahren eine Herausforderung, die mit dem exponentiellen Anwachsen der Daten heute nicht kleiner ist. Es wurde Cutting schnell klar, dass die klassische Batch-Verarbeitung hier nicht ausreichen würde. Dann stieß er im Internet auf MapReduce als Lösung. MapReduce beschreibt eine verteilte Ablaufumgebung, die grob gesagt in zwei Schritten aus Inputdaten neue Daten generiert. Cutting implementierte MapReduce Mitte des vergangenen Jahrzehnts als Open Source in Java und nannte das Projekt Hadoop.
Dieses shortcut der Big-Data-Experten Bernd Fondermann, Kai Spichaale und Lars George ist eine Einführung in MapReduce, Hadoop und die Hadoop-Datenbank Apache-HBase.
Dieses shortcut der Big-Data-Experten Bernd Fondermann, Kai Spichaale und Lars George ist eine Einführung in MapReduce, Hadoop und die Hadoop-Datenbank Apache-HBase.