Autor der Publikation

CLSIFT: An Optimization Study of the Scale Invariance Feature Transform on GPUs.

, , , , und . HPCC/EUC, Seite 93-100. IEEE, (2013)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Towards Distributed Machine Learning in Shared Clusters: A Dynamically-Partitioned Approach., , , und . SMARTCOMP, Seite 1-6. IEEE Computer Society, (2017)StreamScan: fast scan algorithms for GPUs without global barrier synchronization., , und . PPOPP, Seite 229-238. ACM, (2013)yaSpMV: yet another SpMV framework on GPUs., , , und . PPOPP, Seite 107-118. ACM, (2014)A Cross-Platform SpMV Framework on Many-Core Architectures., , , und . TACO, 13 (4): 33:1-33:25 (2016)A coordinated tiling and batching framework for efficient GEMM on GPUs., , , , und . PPoPP, Seite 229-241. ACM, (2019)GPURoofline: A Model for Guiding Performance Optimizations on GPUs., , , , , und . Euro-Par, Volume 7484 von Lecture Notes in Computer Science, Seite 920-932. Springer, (2012)An Insightful Program Performance Tuning Chain for GPU Computing., , , und . ICA3PP (1), Volume 7439 von Lecture Notes in Computer Science, Seite 502-516. Springer, (2012)Timed Dataflow: Reducing Communication Overhead for Distributed Machine Learning Systems., , , und . ICPADS, Seite 1110-1117. IEEE Computer Society, (2016)Understanding the tradeoffs between software-managed vs. hardware-managed caches in GPUs., , , , , und . ISPASS, Seite 231-242. IEEE Computer Society, (2014)CLSIFT: An Optimization Study of the Scale Invariance Feature Transform on GPUs., , , , und . HPCC/EUC, Seite 93-100. IEEE, (2013)