fidel1ti,
Ну тут проблема в том, что трассировка там выполняется на вычислительных ядрах целиком, в том числе расчет пересечений с треугольниками, а RT-ядра никак не задействованы, и потому просто стоят там и ничего не делают. Выполнение поиска пересечений (и навигации по BVH/K-D дереву) на RT ядрах сильно быстрее, чем на обычных CUDA ядрах, и при этом может выполняться параллельно (пока RT-ядро ищет пересечение, CUDA ядро выполняет hit/miss шейдер). Понятно, что если заставить CUDA-ядро делать и то и другое, будет сильно медленнее.