|
Apache Drill ist zum Top-Level-Projekt der Apache
Software Foundation aufgestiegen. Es ist eine Schema-freie SQL
Query Engine für NoSQL-Datenbanken und Hadoop.
Die von Googles
Analysewerkzeug Dremel inspirierte Engine ist sowohl beim Einsatz
von Batch-Prozessen und ihrer Pipelines mit schnellen und umfangreichen
Berechnungen als auch bei der Analyse hilfreich. Die Software besteht
aus einem skalierbaren Datenquellen-Layer, einem Abfrage-Layer (mit
Ausführungsplaner, Abfragesprache und Parser), einer Ausführungs-Engine
für die Abfragepläne und geschachtelten Datenformaten
zur Datenablage. Bei dem Abfrage-Layer liegt der Schwerpunkt auf
der eigenen Abfragesprache von Drill namens DrQL. Standard-SQL wird
ebenfalls unterstützt, sodass Entwickler mit dem Werkzeug ihre
SQL-Kenntnisse nutzen können. Hadoop dient als Grundlage für
den Datenquellen-Layer. Dadurch werden HBase und Hadoops Dateisystem
inklusive deren Datenformate genutzt.
Die hinter dem Softwareprojekt stehenden Entwickler haben bewiesen,
dass Drill
gemäß den Qualitätskriterien und den Prinzipien
der Apache Software Foundation betrieben wird. Dadurch wurde es
zum Top-Level-Projekt der Open-Source-Organisation ernannt.
(kt, hannover)
(siehe auch heise-News-Ticker:)
Hannover · EDV-Beratung ·
Linux · Novell · Microsoft · Seminar ·
IT-Consult · Netzwerk · LPIC · CLE
|