Die Version 1.0 des "Big Data"-Frameworks haben die
Entwickler von Apache
Hadoop veröffentlicht. Hadoop 1.0 ist der Nachfolger der
Version 0.20.205 und entstammt dem Security-Branch 0.20 von Hadoop.
Das kürzlich veröffentlichte Release von Hadoop 0.23,
das eine neue Map-Reduce-Imlementierung mitbringt, soll zu Hadoop
2 werden.
Die Kerberos-basierte Nutzerauthentifizierung, Verbesserungen bei
der auf Hadoop aufsetzenden verteilten Datenbank HBase und Performanceverbesserungen
gehören zu den Neuerungen. Mit Webhdfs ist es jetzt möglich,
über HTTP auf das Hadoop-Dateisystem HDFS zuzugreifen. Die
Release Notes nennen weitere Details.
Hadoop ist ein freies Framework zur Entwicklung skalierbarer, verteilter
Anwendungen zur Analyse großer Datenmengen auf der Grundlage
des von Google entwickelten MapReduce-Algorithmus. Dabei werden
Daten über die Knoten eines Hadoop-Clusters verteilt redundant
gespeichert, die Analyseprogramme laufen parallel auf allen Knoten
und analysieren die jeweils dort vorgehaltenen Daten.
(ez, hannover)
(siehe auch Heise
News-Ticker :)
Hannover · EDV-Beratung ·
Linux · Novell · Microsoft · Seminar ·
IT-Consult · Netzwerk · LPIC · CLE
|