Das US-Unternehmen Comet
hat sein erstes quelloffenes Tool "Kangas" herausgegeben.
Kangas diene der Exploration, Analyse und Visualisierung von Daten.
Es soll Entwicklern in einer frühen Phase des Machine-Learning-Lebenszyklus
helfen, mehr Klarheit über diese zu erlangen, und soll ergänzend
zu anderen Tools - etwa Pandas
oder TensorBoard - genutzt werden können.
Das Standalone-Open-Source-Projekt habe derzeit den Status einer
öffentlichen Beta. Eine Python-API für das Logging Datentabellen
sowie ein visuelles Interface zur Anwendung komplexer Queries auf
einem Datensatz stehen bereit. Die Klasse "DataGrid" diene
der Repräsentation von Datensätzen mit Millionen von Reihen.
Auf Github zeigt das Entwicklungsteam, wie eine öffentliche
DataGrid-Datei importiert werden kann. Jedoch sollen auch CSV-Dateien,
Pandas DataFrames oder HuggingFace-Datensätze verwendet werden
können.
Der Einsatz von Kangas als Standolone-Anwendung sei auf neueren
Versionen von Windows und macOS sowie auf den gängigsten Linux-Distributionen
möglich. Auch die Verwendung in einer Jupyter-Notebook-Umgebung
sei möglich.
Dem zugehörigen GitHub-Repository
und einem Blogeintrag
sind weitere Informationen zum Projekt zu entnehmen.
(jb, hannover)
(siehe auch: Heise-News-Ticker)
Hannover
· EDV-Beratung · Linux · Novell · Microsoft ·
Seminar · IT-Consult · Netzwerk · LPIC · CLE
|