Institut für Mikroelektronische Systeme Studium Studien- & Abschlussarbeiten Abgeschlossene Arbeiten
Design und Evaluierung einer Hochleistungs-Vektorprozessor-Speicherarchitektur für CNN-basierte Szenenanalysesalgorithmen

Design und Evaluierung einer Hochleistungs-Vektorprozessor-Speicherarchitektur für CNN-basierte Szenenanalysesalgorithmen

Betreuung:  Nolting, Stephan
Student/in:  Somer Kelef
Jahr:  2019
Ist abgeschlossen:  ja

In der Forschungsgruppe "Architekturen und Systeme" des Instituts für Mikroelektronische Systeme werden Prozessorarchitekturen für hochrechenintensive Aufgaben analysiert. Zum Beispiel sind komplexe Berechnungen unter harten Echtzeitbedingungen für den aufkommenden Bereich von Fahrerassistenzsystemen (Advanced Driver Assistance Systems, ADAS) ein entscheidendes Kriterium. Ein wichtiges Anwendungsfeld ist die intelligente Szenenklassifikation. Convolutional Neuronal Networks (CNNs) sind eine vielversprechende Bild- und Videoerkennungstechnik hierfür. Um die enormen Rechenanforderungen zu erfüllen, stellen parallele Prozessorarchitekturen eine mögliche Lösung dar. Verschiedene kommerzielle Plattformen, wie GPU-basierte Ansätze oder Mehrkern-CPUs mit parallelen Datenverarbeitungserweiterungen, können eine ausreichende Verarbeitungsleistung bereitstellen, um die Rechenanforderungen zu erfüllen. Diesen Architekturen fehlt es jedoch an Energieeffizienz, was gerade für die Bereiche der Embedded-Automotive-Anwendungen von entscheidender Bedeutung ist. Daher ist die Implementierung paralleler energieeffizienter ASPs (Application-Specific Processor) ein aktuelles Forschungsthema.

Die Aufgabe in dieser Arbeit ist es, die Speicherstrukturanforderungen eines vordefinierten CNN-Algorithmus zu bewerten. Auf Basis dieses Profilings sollen verschiedene Ansätze zur Steigerung der Leistungsfähigkeit des am Institut für Mikroelektronische Systeme entwickelten Speichersystems des VPRO Vektorprozessors entworfen und evaluiert werden. Zunächst soll ein intelligenter Direct-Memory-Access-Controller (DMA) entworfen und implementiert werden, der in der Lage ist, komplex angeordnete Datenblöcke automatisch zu übertragen. Darüber hinaus sollen hierarchische Speicherstrukturen untersucht und auch implementiert werden. Die Leistung des Systems soll durch Ausführen bestimmter Kernel des CNN-Algorithmus (z. B. 2D-Windungen) bewertet werden.

Eine gute Dokumentation des Codes ist obligatorisch. Die eingereichten Kopien sowie die Ergebnisse der Arbeiten bleiben Eigentum des Instituts.