[OpenMP][NFC] clang-format the OpenMP device runtime

These files aren't fully formatted. I'm guessing this was a holdover
from when `clang-format` was totally broken for OpenMP offloading.
Format the files to be more consistent.

Reviewed By: tianshilei1992

Differential Revision: https://reviews.llvm.org/D151226
This commit is contained in:
Joseph Huber 2023-05-23 11:09:16 -05:00
parent e826762a08
commit 47800a12dc
8 changed files with 223 additions and 358 deletions

View File

@ -136,7 +136,7 @@ using LaneMaskTy = uint64_t;
#pragma omp end declare variant #pragma omp end declare variant
#pragma omp begin declare variant match( \ #pragma omp begin declare variant match( \
device = {arch(amdgcn)}, implementation = {extension(match_none)}) device = {arch(amdgcn)}, implementation = {extension(match_none)})
using LaneMaskTy = uint64_t; using LaneMaskTy = uint64_t;
#pragma omp end declare variant #pragma omp end declare variant

View File

@ -1,405 +1,267 @@
case 0: case 0:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *))fn)(&global_tid, &bound_tid);
))fn)(&global_tid, &bound_tid
);
break; break;
case 1: case 1:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *))fn)(&global_tid, &bound_tid, args[0]);
, void *))fn)(&global_tid, &bound_tid
, args[0]);
break; break;
case 2: case 2:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *))fn)(&global_tid, &bound_tid,
, void *, void *))fn)(&global_tid, &bound_tid args[0], args[1]);
, args[0], args[1]);
break; break;
case 3: case 3:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *,
, void *, void *, void *))fn)(&global_tid, &bound_tid void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2]);
, args[0], args[1], args[2]);
break; break;
case 4: case 4:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
))fn)(&global_tid, &bound_tid args[3]);
, args[0], args[1], args[2], args[3]
);
break; break;
case 5: case 5:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *))fn)(&global_tid, &bound_tid args[3], args[4]);
, args[0], args[1], args[2], args[3]
, args[4]);
break; break;
case 6: case 6:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *))fn)(&global_tid, &bound_tid args[3], args[4], args[5]);
, args[0], args[1], args[2], args[3]
, args[4], args[5]);
break; break;
case 7: case 7:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *))fn)(&global_tid, &bound_tid args[3], args[4], args[5], args[6]);
, args[0], args[1], args[2], args[3]
, args[4], args[5], args[6]);
break; break;
case 8: case 8:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *))fn)(&global_tid, &bound_tid, args[0], args[1],
, void *, void *, void *, void * args[2], args[3], args[4], args[5], args[6],
))fn)(&global_tid, &bound_tid args[7]);
, args[0], args[1], args[2], args[3]
, args[4], args[5], args[6], args[7]
);
break; break;
case 9: case 9:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *))fn)(&global_tid, &bound_tid, args[0],
, void *, void *, void *, void * args[1], args[2], args[3], args[4],
, void *))fn)(&global_tid, &bound_tid args[5], args[6], args[7], args[8]);
, args[0], args[1], args[2], args[3]
, args[4], args[5], args[6], args[7]
, args[8]);
break; break;
case 10: case 10:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *))fn)(&global_tid, &bound_tid, args[0],
, void *, void *, void *, void * args[1], args[2], args[3],
, void *, void *))fn)(&global_tid, &bound_tid args[4], args[5], args[6],
, args[0], args[1], args[2], args[3] args[7], args[8], args[9]);
, args[4], args[5], args[6], args[7]
, args[8], args[9]);
break; break;
case 11: case 11:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *))fn)(&global_tid, &bound_tid args[3], args[4], args[5], args[6], args[7], args[8],
, args[0], args[1], args[2], args[3] args[9], args[10]);
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10]);
break; break;
case 12: case 12:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
))fn)(&global_tid, &bound_tid args[9], args[10], args[11]);
, args[0], args[1], args[2], args[3]
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
);
break; break;
case 13: case 13:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
, void *))fn)(&global_tid, &bound_tid args[9], args[10], args[11], args[12]);
, args[0], args[1], args[2], args[3]
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12]);
break; break;
case 14: case 14:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
, void *, void *))fn)(&global_tid, &bound_tid args[9], args[10], args[11], args[12], args[13]);
, args[0], args[1], args[2], args[3]
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13]);
break; break;
case 15: case 15:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
, void *, void *, void *))fn)(&global_tid, &bound_tid args[9], args[10], args[11], args[12], args[13],
, args[0], args[1], args[2], args[3] args[14]);
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14]);
break; break;
case 16: case 16:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *))fn)(&global_tid, &bound_tid, args[0], args[1],
, void *, void *, void *, void * args[2], args[3], args[4], args[5], args[6],
, void *, void *, void *, void * args[7], args[8], args[9], args[10], args[11],
))fn)(&global_tid, &bound_tid args[12], args[13], args[14], args[15]);
, args[0], args[1], args[2], args[3]
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
);
break; break;
case 17: case 17:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *))fn)(&global_tid, &bound_tid, args[0],
, void *, void *, void *, void * args[1], args[2], args[3], args[4],
, void *, void *, void *, void * args[5], args[6], args[7], args[8],
, void *))fn)(&global_tid, &bound_tid args[9], args[10], args[11], args[12],
, args[0], args[1], args[2], args[3] args[13], args[14], args[15], args[16]);
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16]);
break; break;
case 18: case 18:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
, void *, void *))fn)(&global_tid, &bound_tid args[9], args[10], args[11], args[12], args[13],
, args[0], args[1], args[2], args[3] args[14], args[15], args[16], args[17]);
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17]);
break; break;
case 19: case 19:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
, void *, void *, void *))fn)(&global_tid, &bound_tid args[9], args[10], args[11], args[12], args[13],
, args[0], args[1], args[2], args[3] args[14], args[15], args[16], args[17], args[18]);
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18]);
break; break;
case 20: case 20:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *))fn)(
, void *, void *, void *, void * &global_tid, &bound_tid, args[0], args[1], args[2], args[3], args[4],
, void *, void *, void *, void * args[5], args[6], args[7], args[8], args[9], args[10], args[11], args[12],
, void *, void *, void *, void * args[13], args[14], args[15], args[16], args[17], args[18], args[19]);
))fn)(&global_tid, &bound_tid
, args[0], args[1], args[2], args[3]
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
);
break; break;
case 21: case 21:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
, void *, void *, void *, void * args[9], args[10], args[11], args[12], args[13],
, void *))fn)(&global_tid, &bound_tid args[14], args[15], args[16], args[17], args[18],
, args[0], args[1], args[2], args[3] args[19], args[20]);
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20]);
break; break;
case 22: case 22:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
, void *, void *, void *, void * args[9], args[10], args[11], args[12], args[13],
, void *, void *))fn)(&global_tid, &bound_tid args[14], args[15], args[16], args[17], args[18],
, args[0], args[1], args[2], args[3] args[19], args[20], args[21]);
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20], args[21]);
break; break;
case 23: case 23:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
, void *, void *, void *, void * args[9], args[10], args[11], args[12], args[13],
, void *, void *, void *))fn)(&global_tid, &bound_tid args[14], args[15], args[16], args[17], args[18],
, args[0], args[1], args[2], args[3] args[19], args[20], args[21], args[22]);
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20], args[21], args[22]);
break; break;
case 24: case 24:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *))fn)(&global_tid, &bound_tid, args[0], args[1],
, void *, void *, void *, void * args[2], args[3], args[4], args[5], args[6],
, void *, void *, void *, void * args[7], args[8], args[9], args[10], args[11],
, void *, void *, void *, void * args[12], args[13], args[14], args[15], args[16],
))fn)(&global_tid, &bound_tid args[17], args[18], args[19], args[20], args[21],
, args[0], args[1], args[2], args[3] args[22], args[23]);
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20], args[21], args[22], args[23]
);
break; break;
case 25: case 25:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *))fn)(&global_tid, &bound_tid, args[0],
, void *, void *, void *, void * args[1], args[2], args[3], args[4],
, void *, void *, void *, void * args[5], args[6], args[7], args[8],
, void *, void *, void *, void * args[9], args[10], args[11], args[12],
, void *))fn)(&global_tid, &bound_tid args[13], args[14], args[15], args[16],
, args[0], args[1], args[2], args[3] args[17], args[18], args[19], args[20],
, args[4], args[5], args[6], args[7] args[21], args[22], args[23], args[24]);
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20], args[21], args[22], args[23]
, args[24]);
break; break;
case 26: case 26:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *))fn)(
, void *, void *, void *, void * &global_tid, &bound_tid, args[0], args[1], args[2], args[3], args[4],
, void *, void *, void *, void * args[5], args[6], args[7], args[8], args[9], args[10], args[11], args[12],
, void *, void *, void *, void * args[13], args[14], args[15], args[16], args[17], args[18], args[19],
, void *, void *))fn)(&global_tid, &bound_tid args[20], args[21], args[22], args[23], args[24], args[25]);
, args[0], args[1], args[2], args[3]
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20], args[21], args[22], args[23]
, args[24], args[25]);
break; break;
case 27: case 27:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *))fn)(
, void *, void *, void *, void * &global_tid, &bound_tid, args[0], args[1], args[2], args[3], args[4],
, void *, void *, void *, void * args[5], args[6], args[7], args[8], args[9], args[10], args[11], args[12],
, void *, void *, void *, void * args[13], args[14], args[15], args[16], args[17], args[18], args[19],
, void *, void *, void *))fn)(&global_tid, &bound_tid args[20], args[21], args[22], args[23], args[24], args[25], args[26]);
, args[0], args[1], args[2], args[3]
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20], args[21], args[22], args[23]
, args[24], args[25], args[26]);
break; break;
case 28: case 28:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
, void *, void *, void *, void * args[9], args[10], args[11], args[12], args[13],
, void *, void *, void *, void * args[14], args[15], args[16], args[17], args[18],
))fn)(&global_tid, &bound_tid args[19], args[20], args[21], args[22], args[23],
, args[0], args[1], args[2], args[3] args[24], args[25], args[26], args[27]);
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20], args[21], args[22], args[23]
, args[24], args[25], args[26], args[27]
);
break; break;
case 29: case 29:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
, void *, void *, void *, void * args[9], args[10], args[11], args[12], args[13],
, void *, void *, void *, void * args[14], args[15], args[16], args[17], args[18],
, void *))fn)(&global_tid, &bound_tid args[19], args[20], args[21], args[22], args[23],
, args[0], args[1], args[2], args[3] args[24], args[25], args[26], args[27], args[28]);
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20], args[21], args[22], args[23]
, args[24], args[25], args[26], args[27]
, args[28]);
break; break;
case 30: case 30:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *))fn)(
, void *, void *, void *, void * &global_tid, &bound_tid, args[0], args[1], args[2], args[3], args[4],
, void *, void *, void *, void * args[5], args[6], args[7], args[8], args[9], args[10], args[11], args[12],
, void *, void *, void *, void * args[13], args[14], args[15], args[16], args[17], args[18], args[19],
, void *, void *, void *, void * args[20], args[21], args[22], args[23], args[24], args[25], args[26],
, void *, void *))fn)(&global_tid, &bound_tid args[27], args[28], args[29]);
, args[0], args[1], args[2], args[3]
, args[4], args[5], args[6], args[7]
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20], args[21], args[22], args[23]
, args[24], args[25], args[26], args[27]
, args[28], args[29]);
break; break;
case 31: case 31:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *))fn)(&global_tid, &bound_tid, args[0], args[1], args[2],
, void *, void *, void *, void * args[3], args[4], args[5], args[6], args[7], args[8],
, void *, void *, void *, void * args[9], args[10], args[11], args[12], args[13],
, void *, void *, void *, void * args[14], args[15], args[16], args[17], args[18],
, void *, void *, void *))fn)(&global_tid, &bound_tid args[19], args[20], args[21], args[22], args[23],
, args[0], args[1], args[2], args[3] args[24], args[25], args[26], args[27], args[28],
, args[4], args[5], args[6], args[7] args[29], args[30]);
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20], args[21], args[22], args[23]
, args[24], args[25], args[26], args[27]
, args[28], args[29], args[30]);
break; break;
case 32: case 32:
((void (*)(int32_t *, int32_t * ((void (*)(int32_t *, int32_t *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *, void *, void *, void *, void *, void *, void *,
, void *, void *, void *, void * void *, void *))fn)(&global_tid, &bound_tid, args[0], args[1],
, void *, void *, void *, void * args[2], args[3], args[4], args[5], args[6],
, void *, void *, void *, void * args[7], args[8], args[9], args[10], args[11],
, void *, void *, void *, void * args[12], args[13], args[14], args[15], args[16],
, void *, void *, void *, void * args[17], args[18], args[19], args[20], args[21],
))fn)(&global_tid, &bound_tid args[22], args[23], args[24], args[25], args[26],
, args[0], args[1], args[2], args[3] args[27], args[28], args[29], args[30],
, args[4], args[5], args[6], args[7] args[31]);
, args[8], args[9], args[10], args[11]
, args[12], args[13], args[14], args[15]
, args[16], args[17], args[18], args[19]
, args[20], args[21], args[22], args[23]
, args[24], args[25], args[26], args[27]
, args[28], args[29], args[30], args[31]
);
break; break;

View File

@ -15,7 +15,8 @@ int32_t omp_vprintf(const char *Format, void *Arguments, uint32_t);
} }
#pragma omp begin declare variant match( \ #pragma omp begin declare variant match( \
device = {arch(nvptx, nvptx64)}, implementation = {extension(match_any)}) device = {arch(nvptx, nvptx64)}, \
implementation = {extension(match_any)})
extern "C" int32_t vprintf(const char *, void *); extern "C" int32_t vprintf(const char *, void *);
namespace impl { namespace impl {
int32_t omp_vprintf(const char *Format, void *Arguments, uint32_t) { int32_t omp_vprintf(const char *Format, void *Arguments, uint32_t) {

View File

@ -98,7 +98,8 @@ uint32_t getNumberOfWarpsInBlock() {
/// ///
///{ ///{
#pragma omp begin declare variant match( \ #pragma omp begin declare variant match( \
device = {arch(nvptx, nvptx64)}, implementation = {extension(match_any)}) device = {arch(nvptx, nvptx64)}, \
implementation = {extension(match_any)})
uint32_t getNumHardwareThreadsInBlock() { uint32_t getNumHardwareThreadsInBlock() {
return __nvvm_read_ptx_sreg_ntid_x(); return __nvvm_read_ptx_sreg_ntid_x();

View File

@ -43,7 +43,8 @@ double getWTime() {
/// ///
///{ ///{
#pragma omp begin declare variant match( \ #pragma omp begin declare variant match( \
device = {arch(nvptx, nvptx64)}, implementation = {extension(match_any)}) device = {arch(nvptx, nvptx64)}, \
implementation = {extension(match_any)})
double getWTick() { double getWTick() {
// Timer precision is 1ns // Timer precision is 1ns

View File

@ -291,7 +291,7 @@ void setCriticalLock(omp_lock_t *Lock) {
if (mapping::getThreadIdInWarp() == LowestActiveThread) { if (mapping::getThreadIdInWarp() == LowestActiveThread) {
fenceKernel(atomic::release); fenceKernel(atomic::release);
while (!atomicCAS((uint32_t *)Lock, UNSET, SET, atomic::relaxed, while (!atomicCAS((uint32_t *)Lock, UNSET, SET, atomic::relaxed,
atomic::relaxed)) { atomic::relaxed)) {
__builtin_amdgcn_s_sleep(32); __builtin_amdgcn_s_sleep(32);
} }
fenceKernel(atomic::aquire); fenceKernel(atomic::aquire);
@ -305,7 +305,8 @@ void setCriticalLock(omp_lock_t *Lock) {
/// ///
///{ ///{
#pragma omp begin declare variant match( \ #pragma omp begin declare variant match( \
device = {arch(nvptx, nvptx64)}, implementation = {extension(match_any)}) device = {arch(nvptx, nvptx64)}, \
implementation = {extension(match_any)})
uint32_t atomicInc(uint32_t *Address, uint32_t Val, uint32_t atomicInc(uint32_t *Address, uint32_t Val,
atomic::OrderingTy Ordering) { atomic::OrderingTy Ordering) {
@ -483,13 +484,9 @@ uint32_t atomic::inc(uint32_t *Addr, uint32_t V, atomic::OrderingTy Ordering) {
return impl::atomicInc(Addr, V, Ordering); return impl::atomicInc(Addr, V, Ordering);
} }
void unsetCriticalLock(omp_lock_t *Lock) { void unsetCriticalLock(omp_lock_t *Lock) { impl::unsetLock(Lock); }
impl::unsetLock(Lock);
}
void setCriticalLock(omp_lock_t *Lock) { void setCriticalLock(omp_lock_t *Lock) { impl::setLock(Lock); }
impl::setLock(Lock);
}
extern "C" { extern "C" {
void __kmpc_ordered(IdentTy *Loc, int32_t TId) { FunctionTracingRAII(); } void __kmpc_ordered(IdentTy *Loc, int32_t TId) { FunctionTracingRAII(); }

View File

@ -59,7 +59,8 @@ uint64_t Pack(uint32_t LowBits, uint32_t HighBits) {
/// ///
///{ ///{
#pragma omp begin declare variant match( \ #pragma omp begin declare variant match( \
device = {arch(nvptx, nvptx64)}, implementation = {extension(match_any)}) device = {arch(nvptx, nvptx64)}, \
implementation = {extension(match_any)})
void Unpack(uint64_t Val, uint32_t *LowBits, uint32_t *HighBits) { void Unpack(uint64_t Val, uint32_t *LowBits, uint32_t *HighBits) {
uint32_t LowBitsLocal, HighBitsLocal; uint32_t LowBitsLocal, HighBitsLocal;
@ -103,8 +104,9 @@ int32_t shuffleDown(uint64_t Mask, int32_t Var, uint32_t LaneDelta,
return __builtin_amdgcn_ds_bpermute(Index << 2, Var); return __builtin_amdgcn_ds_bpermute(Index << 2, Var);
} }
bool isSharedMemPtr(const void * Ptr) { bool isSharedMemPtr(const void *Ptr) {
return __builtin_amdgcn_is_shared((const __attribute__((address_space(0))) void *)Ptr); return __builtin_amdgcn_is_shared(
(const __attribute__((address_space(0))) void *)Ptr);
} }
#pragma omp end declare variant #pragma omp end declare variant
///} ///}
@ -113,7 +115,8 @@ bool isSharedMemPtr(const void * Ptr) {
/// ///
///{ ///{
#pragma omp begin declare variant match( \ #pragma omp begin declare variant match( \
device = {arch(nvptx, nvptx64)}, implementation = {extension(match_any)}) device = {arch(nvptx, nvptx64)}, \
implementation = {extension(match_any)})
int32_t shuffle(uint64_t Mask, int32_t Var, int32_t SrcLane) { int32_t shuffle(uint64_t Mask, int32_t Var, int32_t SrcLane) {
return __nvvm_shfl_sync_idx_i32(Mask, Var, SrcLane, 0x1f); return __nvvm_shfl_sync_idx_i32(Mask, Var, SrcLane, 0x1f);

View File

@ -114,9 +114,9 @@ template <typename T, typename ST> struct omptarget_nvptx_LoopSupport {
//////////////////////////////////////////////////////////////////////////////// ////////////////////////////////////////////////////////////////////////////////
// Support for Static Init // Support for Static Init
static void for_static_init(int32_t, int32_t schedtype, static void for_static_init(int32_t, int32_t schedtype, int32_t *plastiter,
int32_t *plastiter, T *plower, T *pupper, T *plower, T *pupper, ST *pstride, ST chunk,
ST *pstride, ST chunk, bool IsSPMDExecutionMode) { bool IsSPMDExecutionMode) {
int32_t gtid = omp_get_thread_num(); int32_t gtid = omp_get_thread_num();
int numberOfActiveOMPThreads = omp_get_num_threads(); int numberOfActiveOMPThreads = omp_get_num_threads();