Logo Leibniz Universität Hannover
Logo: Institut für Mikroelektronische Systeme
Logo Leibniz Universität Hannover
Logo: Institut für Mikroelektronische Systeme
  • Zielgruppen
  • Suche
 

Implementierung eines automatischen Tools zur effizienten Abbildung von CNNs auf eine Vektorprozessorarchitektur

Student:

Xingrui Li

Betreuer:

Guillermo Payá Vayá

Stephan Nolting

Art der Arbeit:

Master-/Diplomarbeit

Abteilung:

Fachgebiet für Architekturen und Systeme

Status:

abgeschlossen

Bild Implementierung eines automatischen Tools zur effizienten Abbildung von CNNs auf eine Vektorprozessorarchitektur

Komplexe Berechnungen unter harten Echtzeitbedingungen sind eine elementare Voraussetzung für den aufkommenden Bereich der Fahrerassistenzsysteme (Advanced Driver Assistance Systems, ADAS). Ein wichtiges Anwendungsfeld ist die intelligente Szenenanalyse. Convolutional Neuronal Networks (CNNs) sind eine vielversprechende Bild- und Videoerkennungstechnik aus diesem Bereich. Um den gewaltigen Verarbeitungsanforderungen heutiger CNNs gerecht zu werden, bietet die am Institut für Mikroelektronische Systeme entwickelte VPRO-Vektorprozessorarchitektur eine geeignete Implementierungsplattform. Über die eigentliche Hardwarearchitektur hinaus ist die Abbildung der tatsächlichen CNN-Operationen auf die zugrunde liegende Plattform eine sehr komplexe Aufgabe, da wichtige Aspekte wie Speicherzuordnung und Parallelisierung bereits zu einem sehr frühen Zeitpunkt der Konvertierung berücksichtigt werden müssen.

Herrn Lis Aufgabe besteht darin, ein CNN-Mapping-Tool zu implementieren, das eine allgemeine CNN-Beschreibung (z. B. für Tensorflow) als Eingabe verwendet und den entsprechenden C-Code für den VPRO-Prozessor erzeugt. Die Parallelisierung und die Generierung des Speicherlayouts sind die Hauptfaktoren für eine effiziente Konvertierung. Das Tool muss konfigurierbar sein, so dass unterschiedliche CNN-Architekturen (z. B. Kernelgröße oder Anzahl der Schichten) und Szenarien (z. B. Bildgröße oder Anzahl eingegebene Bilder) auf verschiedene Konfigurationen der VPRO-Prozessorplattform abgebildet werden können (z. B. Anzahl der Verarbeitungseinheiten oder lokale Speichergröße). Das resultierende Werkzeug soll auf der Grundlage der Framerate bewertet werden, wenn mehrere verschiedene CNN-Architekturen und VPRO-Konfigurationen verwendet werden. Neue Hardware-Mechanismen (z. B. bezüglich der Speichersysteme oder des Befehlssatzes), die für eine effizientere Abbildung erforderlich sein könnten, sollen  implementiert und ausgewertet werden.

Eine gute Dokumentation des Quellcodes ist zwingend erforderlich. Die eingereichten Kopien sowie die Ergebnisse der Arbeiten bleiben Eigentum des Instituts.


zurück