Set CU_FUNC_ATTRIBUTE_MAX_DYNAMIC_SHARED_SIZE_BYTES attribute for dynamic shared memory allocation

This commit is contained in:
Captain Jack Sparrow 2022-10-04 15:08:37 -07:00
Родитель 8d4c04632b
Коммит 743e81d1ac
1 изменённых файлов: 4 добавлений и 0 удалений

Просмотреть файл

@ -214,6 +214,10 @@ class CudaCallableFunc(CallableFunc):
self.ptrs = device_args_to_ptr_list(self.device_mem) self.ptrs = device_args_to_ptr_list(self.device_mem)
if self.hat_func.dynamic_shared_mem_bytes > 0:
err, = cuda.cuFuncSetAttribute(self.kernel, cuda.CUfunction_attribute.CU_FUNC_ATTRIBUTE_MAX_DYNAMIC_SHARED_SIZE_BYTES, self.hat_func.dynamic_shared_mem_bytes)
ASSERT_DRV(err)
err, self.start_event = cuda.cuEventCreate(cuda.CUevent_flags.CU_EVENT_DEFAULT) err, self.start_event = cuda.cuEventCreate(cuda.CUevent_flags.CU_EVENT_DEFAULT)
ASSERT_DRV(err) ASSERT_DRV(err)
err, self.stop_event = cuda.cuEventCreate(cuda.CUevent_flags.CU_EVENT_DEFAULT) err, self.stop_event = cuda.cuEventCreate(cuda.CUevent_flags.CU_EVENT_DEFAULT)