Deep Learning in der maschinellen Bildverarbeitung

Deep Learning in der maschinellen Bildverarbeitung
Grossansicht Bild
31.07.2019 | Die Qualität und Quantität der Bilder, die Erfahrung beim Labeln, Konfigurieren und Evaluieren von neuronalen Netzen sowie die richtige Wahl des Software Development Kits sind massgebliche Erfolgsfaktoren von Deep Learning in der industriellen Bildverarbeitung.

In den Medien liest man teilweise, dass das Resultat von Deep Learning Anwendungen nicht oder nur geringfügig beeinflusst werden kann und Daten zufällig ausgewertet werden. Auch wenn ggü. der klassischen parametrisierten Bildverarbeitung nie alle Resultate zu 100% erklärt und logisch nachvollzogen werden können, so gibt es doch mindestens drei substantielle Hebel, welche die Genauigkeit der Resultate und den Erfolg von Deep Learning in der Bildverarbeitung massgeblich beeinflussen können.

Drei Erfolgsfaktoren für Deep Learning

Die Qualität der Daten bestimmt das Resultat 

Die Prüfung von unklaren oder inkonsistenten Bildern führt auch bei Deep Learning zu fehlerhaften Resultaten. Die Verfügbarkeit von «guten» Bildern ist ein erster Erfolgsfaktor, qualitativ sowie quantitativ.
  • Die Bilder müssen repräsentativ, mit genügend Auflösung und konstanter Qualität zur Verfügung gestellt werden.
  • Die Menge der Daten, d.h. die Anzahl der zu trainierenden Bilder muss ausreichend sein. Hier gilt eine Faustregel:
    1. Für eine Vorstudie werden mindestens 100 Bilder pro Label empfohlen, je nach Anwendung auch mehr.
    2. Für das Training eines operativen Netzes werden mind. 1’000+ Bilder pro Label empfohlen.
Es kann bezweifelt werden, dass neuronale Netze welche mit weniger als 1’000 Bildern trainiert wurden, für industrielle, also hochverfügbare Anwendungen, mit einer Genauigkeit von bis zu 99% geeignet sind.

 
Labelling und Klassifizieren der Daten, Konfigurierung, Evaluation eines Netzes 

Sind die Daten einmal qualitativ und quantitativ vorhanden, sind die folgenden beinflussbaren Faktoren zu berücksichtigen:
  • die Definition von sinnvollen und minimal benötigten Label-Kategorien und Klassen. Sinnvolle Label geben bspw. Aufschluss über einen fehlerverursachenden Produktionsschritt. Dabei sind Klassen zu wählen, welche klar abgrenzbar und eindeutig sind.
  • das sorgfältige und korrekte Labelling und Klassifizieren der Daten. Eine häufige Ursache für unklare oder falsche Resultate eines Netzes sind falsch gelabelte Bilder beim Trainieren.
  • Die Konfiguration sowie die Definition von Restriktionen beim Training. Die effektive Konfiguration eines Netzes beruht auf Erfahrungswerten. Das beginnt bei der zielführenden Selektion der Funktionen, führt über eine effektive Augmentierung der Daten, bis zur Evaluation von Netzen und deren Resultate. Kann diese Evaluation richtig interpretiert und in das Trainieren von weiteren Netzen einfliessen, so gewinnt der Trainingsprozess an Effizienz.
 
 
Wahl des Software Development Kits und Service 

Zu guter Letzt ist die Auswahl eines kunden- oder projektspezifischen Deep Learning Frameworks einer der wichtigsten Erfolgsfaktoren
  • Eine Möglichkeit besteht darin mit Hilfe von Open Source Libraries eine eigene, industriell taugliche Applikation zu entwickeln. Diese Option ist jedoch äusserst Zeitintensiv und dazu sind hochqualifizierte Ressourcen auf ungewisse Zeit einzuplanen.
  • Alternativ zur eigenen Entwicklung gibt es heute diverse industriespezifische vorkonfigurierte Lösungen inkl. SDK und GUI
Ein Vorteil von solchen Software-Development Kits ist, dass (sicherheitsrelevante) Updates und neue Features nicht selber entwickelt werden müssen, sondern vom Anbieter zur Verfügung gestellt und ausgerollt werden.
Schulungen und Support über die verschiedenen Level ist dabei genauso wichtig wie ein intuitives und benutzerfreundliches GUI für den Nicht-Softwareentwickler.
 
Der Erfolg und die Resultate von Deep Neural Networks in der Bildverarbeitung können durchaus gesteuert werden. Mindestens drei Faktoren sind dabei zentral, damit Deep Learning keiner Blackbox gleichkommt: Es sind dies Daten und Datenqualität, die Erfahrung bei der Konfigurierung des Netzes und die Wahl des SDK’s als solches.

Fabrimex Systems – Deep Learning Lösungen aus einer Hand

Seit über 30 Jahren bietet Fabrimex Systems erfolgreich Dienstleistungen und Systeme im Bereich der industriellen Bildverarbeitung an. Mit dem SDK Suakit von der Firma Sualab hat Fabrimex Systems eine Deep Learning Lösung im Angebot, welche zu den führenden Bildverarbeitungslösungen in der industriellen Umgebung zählt. Dazu bietet Fabrimex Systems die passende industrielle High Performance Computing Hardwareplattform an, welche mit bis zu 4 GPU’s ausgerüstet werden kann.

Autor unbekannt
Bewertung Ø:
   
Meine Bewertung:

Fragen und Kommentare (0)