Thread Block Lock Free Format für dünnbesetzte Matrix-Vektor-Produkte auf Grafikkarten.

Keywords

Abstract

Diese Arbeit stellt das neues Datenformat Thread Block Lock Free (TBLF) für die effiziente Berechnung von Matrix-Vektor-Produkten für dünnbesetzte Matrizen vor. Wir zeigen die Ergebnisse der Implementierung des neuen Datenformats TBLF auf Grafikkarten mittels CUDA C und vergleichen diese mit einer aus der Literatur bekannten Implementierung des Compressed Sparse Row (CSR) Formats. Bei der Verwendung von zufälligen dünnbesetzen Matrizen mit einem maximalen Besetztheitsgrad von 10% wird ein Speed-Up gegenüber CSR von bis zu 6 erreicht.