|
Version
1.0 des Apache Hive hat das Apache-Hive-Team freigegeben. Das
Framework Hadoop ist zum Speichern und Bearbeiten von Daten auf
dezentral gelagerter Hardware gedacht. Daten, die in Hadoops File-System
(HDFS) oder ähnlichen Systemen wie Apache HBase gespeichert
sind, lassen sich mit einer SQL-ähnlichen Abfragesprache, welche
die Hive-Software ergänzend zum Framework anbietet, extrahieren
und transformieren.
Im Zuge der Stinger Initiative hat das Hive-Team in den vergangenen
Jahren daran gearbeitet, den Funktionsumfang und die Leistungsfähigkeit
der Software zu verbessern. Mit Stinger.next
ist nun nach deren erfolgreichen Abschluss eine Neuauflage des Projekts
im Gange. Erreichen wollen sie, dass Hive als SQL-Interface für
Anfragen im Giga-, Tera- und Petabyte-Bereich etabliert und die
Reaktionszeiten für Anfragen unter eine Sekunde gedrückt
wird.
Die Freigabe der Version 1.0 bedeutet, dass ein Stand erreicht
ist, der sich als gute Grundlage für kommende Entwicklungsschritte
eignet, was Stabilität und Ausgereiftheit anbelangt. Vor allem
Bugfixes hat das aktuelle Release erhalten. Die Release
Notes weisen den nun als öffentliche API freigelegten HiveMetaStoreClient
als Verbesserung aus. Da es nicht gewünscht ist, dass ein Build
Abhängigkeiten zu Snapshots aufweist, soll nun intern immer
geprüft werden, ob dieser Umstand vorliegt.
(nd, hannover)
(siehe auch heise-News-Ticker:)
Hannover · EDV-Beratung ·
Linux · Novell · Microsoft · Seminar ·
IT-Consult · Netzwerk · LPIC · CLE
|