|
Facebook gibt im Bereich maschinelles Lernen nach und nach Software
als Open Source frei. Nun folgen, nach der Veröffentlichung
des Torch-Frameworks Torchnet
im Juni, drei Bibliotheken, die der Identifizierung einzelner Objekte
innerhalb von Bildern dienen. SharpMask, DeepMask und MultiPathNet
verwenden als Basis die quelloffene Bibliothek Torch, die für
Deep Learning zahlreiche Algorithmen bietet.
DeepMask unterteilt das Bild im ersten Schritt der Analyse mithilfe
binärer Klassifikationsalgorithmen in Segmente. Dabei kommen,
wie der Name vermuten lässt, Deep Neural Networks (tiefe künstliche
Neuronale Netze) zum Einsatz. Die erstellten Masken umreißen
die Objekte, haben jedoch noch recht unscharfe Grenzen. SharpMask
versucht im zweiten Schritt die Umrisse zu schärfen.
Das Ergebnis ist eine, noch keinen Aufschluss über die tatsächlichen
Objekte gebende, Reihe von Segmenten. Im dritten Schritt kommt deswegen
MultiPathNet zum Einsatz, das ebenfalls auf künstliche neuronale
Netze setzt. Die Bibliothek untersucht die Objekte im Kontext des
restlichen Bildes und auf unterschiedlichen Ebenen. Der Algorithmus
sortiert gleichzeitig Segmente, die DeepMask erkannt hat, MultiPathNet
aber für nicht relevant erachtet, heraus.
Die großen Unternehmen wetteifern im Bereich des maschinellen
Lernens zur Bildanalyse seit geraumer Zeit. Zu Facebooks namhaften
Konkurrenten gehören Microsofts Cognitive
Services (vormals Projekt Oxford), IBMs Watson
API und Googles Cloud
Vision.
(mt, hannover)
(siehe auch heise-News-Ticker:)
Hannover · EDV-Beratung ·
Linux · Novell · Microsoft · Seminar ·
IT-Consult · Netzwerk · LPIC · CLE
|