Ein Projekt mit dem Namen ML Metadata (MLMD), welches für
das Speichern von Metadaten zum Training von Machine-Learning-Modellen
eingesetzt wird, wurde nun von dem Team hinter TensorFlow
Extended (TFX) veröffentlicht. Dieses soll Hilfe beim Versionieren
des Trainings und der Analyse von Zusammenhängen leisten. Zudem
bringt das Projekt eine API zum Speichern und Abrufen von Metadaten
mit und kann mit unterschiedlichen Datenbanken arbeiten.
TensorFlow Extended dient dem Erstellen und Verwalten von Machine-Learning-Pipelines.
ML Metadata soll nun das Training von ML-Modellen, ähnlich
wie Sourcecode mit Versionsverwaltungssystemen, versionieren und
analysieren. Verfügbar ist das Projekt als Integration in die
TFX-Plattform, sowie auch als eigenständige Library.
Informationen zum verwendeten Datensatz und der verwendeten Hyperparameter
werden von ML Metadata für die einzelnen Trainingsschritte
gespeichert. Jeder Schritt in der Pipeline wird, genauso wie auch
Eingabe- und Ausgabe-Artefakte von Client-Libraries, von MLMD überwacht
und verwaltet. Eine GUI hilft bei der Daten-Verwaltung und -Analyse.
Als Backend zum Speichern lassen sich verschiedene Datenbank-Librarys,
wie MySQL oder SQLite verwenden. Data Scientists können mithilfe
der Analysefunktionen Artefakte nach bestimmten Vorgaben filtern
und Experimente oder Trainingsabläufe vergleichen. Die Schritte
einzelner Artefakte lassen sich schließlich rückverfolgen,
um etwa zu erkennen, welche Daten in das Training eingeflossen sind.
Dem TensorFlow-Blog
sind weitere Details zu entnehmen. Ein von dem TFX-Team veröffentlichtes
Tutorial soll beim Einstieg helfen.
(jb, hannover)
(siehe auch: Heise-News-Ticker)
Hannover · EDV-Beratung ·
Linux · Novell · Microsoft · Seminar ·
IT-Consult · Netzwerk · LPIC · CLE
|