Mit Tribuo hat
Oracle nun eine Machine-Learning-Bibliothek für Java veröffentlicht.
Sie ist quelloffen unter der Apache 2.0 License auf GitHub verfügbar
und hat Ihren Ursprung in der Oracle Labs Machine Learning Research
Group, wo sie wahrscheinlich schon seit einigen Jahren in der Produktion
innerhalb von Oracle eingesetzt wird.
Die Library soll Forschern helfen, auf die Beobachtung zu reagieren,
dass große Softwaresysteme sich selbst beschreibende Building
Blocks verwenden wollen, welche zudem wissen, wann ihre Inputs oder
Outputs ungültig sind. Laut Oracle
kommen die meisten ML-Frameworks dieser Anforderung nicht angemessen
nach, da sie einen Stapel von Float-Arrays für das Training
eines Modells erwarten.
Das Verfolgen von Modellen soll in der Produktion zudem deshalb
schwierig sein, weil externe Systeme erforderlich sind, welche die
Verbindung zwischen Modell, Schulungsverfahren und Daten aufrechterhalten.
Die Einbettung dieser Aufgabe in die ML-Bibliothek selbst sei hierbei
eine bessere Lösung. Schließlich sind die meisten anderen
ML-Bibliotheken in dynamisch typisierten Sprachen wie Python
und R geschrieben, worin die Entwickler einen erheblichen Code-Wartungs-
und System-Overhead sehen, da der Code in mehreren Sprachen geschrieben
werden und in mehreren Laufzeite ausgeführt werden muss.
Neben ML-Standardfeatures wie Klassifizierung, Clustering, Anomalieerkennung
und Regressionsalgorithmen bietet Tribua auch Pipelines zur Daten-
und Textverarbeitung, Transformationen der Feature-Ebene, sowie
Schnittstellen zur ONNX Runtime sowie zu den ML-Bibliotheken TensorFlow
und XGBoost.
Nähere Informationen zur Library sind auf der Website von
Tribuo und im zugehörigen
Blog-Beitrag zu finden.
(jb, hannover)
(siehe auch: Heise-News-Ticker)
Hannover · EDV-Beratung ·
Linux · Novell · Microsoft · Seminar ·
IT-Consult · Netzwerk · LPIC · CLE
|