Institute of Microelectronic Systems Studies Final exams and theses Abgeschlossene Arbeiten
Implementierung eines automatischen Tools zur effizienten Abbildung von CNNs auf eine Vektorprozessorarchitektur

Implementierung eines automatischen Tools zur effizienten Abbildung von CNNs auf eine Vektorprozessorarchitektur

Led by:  Payá Vayá, Guillermo; Nolting, Stephan
Team:  Xingrui Li

Komplexe Berechnungen unter harten Echtzeitbedingungen sind eine elementare Voraussetzung für den aufkommenden Bereich der Fahrerassistenzsysteme (Advanced Driver Assistance Systems, ADAS). Ein wichtiges Anwendungsfeld ist die intelligente Szenenanalyse. Convolutional Neuronal Networks (CNNs) sind eine vielversprechende Bild- und Videoerkennungstechnik aus diesem Bereich. Um den gewaltigen Verarbeitungsanforderungen heutiger CNNs gerecht zu werden, bietet die am Institut für Mikroelektronische Systeme entwickelte VPRO-Vektorprozessorarchitektur eine geeignete Implementierungsplattform. Über die eigentliche Hardwarearchitektur hinaus ist die Abbildung der tatsächlichen CNN-Operationen auf die zugrunde liegende Plattform eine sehr komplexe Aufgabe, da wichtige Aspekte wie Speicherzuordnung und Parallelisierung bereits zu einem sehr frühen Zeitpunkt der Konvertierung berücksichtigt werden müssen.

Herrn Lis Aufgabe besteht darin, ein CNN-Mapping-Tool zu implementieren, das eine allgemeine CNN-Beschreibung (z. B. für Tensorflow) als Eingabe verwendet und den entsprechenden C-Code für den VPRO-Prozessor erzeugt. Die Parallelisierung und die Generierung des Speicherlayouts sind die Hauptfaktoren für eine effiziente Konvertierung. Das Tool muss konfigurierbar sein, so dass unterschiedliche CNN-Architekturen (z. B. Kernelgröße oder Anzahl der Schichten) und Szenarien (z. B. Bildgröße oder Anzahl eingegebene Bilder) auf verschiedene Konfigurationen der VPRO-Prozessorplattform abgebildet werden können (z. B. Anzahl der Verarbeitungseinheiten oder lokale Speichergröße). Das resultierende Werkzeug soll auf der Grundlage der Framerate bewertet werden, wenn mehrere verschiedene CNN-Architekturen und VPRO-Konfigurationen verwendet werden. Neue Hardware-Mechanismen (z. B. bezüglich der Speichersysteme oder des Befehlssatzes), die für eine effizientere Abbildung erforderlich sein könnten, sollen  implementiert und ausgewertet werden.

Eine gute Dokumentation des Quellcodes ist zwingend erforderlich. Die eingereichten Kopien sowie die Ergebnisse der Arbeiten bleiben Eigentum des Instituts.