Members/Moririn: src/test/twice.cc annotate

annotate src/test/twice.cc @ 502:8d997f0c9b2c

stack.agda comment

author	Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date	Mon, 01 Jan 2018 18:58:05 +0900
parents	1839586f5b41
children

rev	line source
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	1 #include <stdio.h>
625a19d81ed7 add Cmake ikkun parents: diff changeset	2 #include <sys/time.h>
625a19d81ed7 add Cmake ikkun parents: diff changeset	3 #include <string.h>
625a19d81ed7 add Cmake ikkun parents: diff changeset	4 #include <stdlib.h>
314 1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	5 extern "C" {
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	6 #include <pthread.h>
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	7 }
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	8
292 2bc63a22dd21 add twice ikkun parents: 291 diff changeset	9 #include <cuda.h>
2bc63a22dd21 add twice ikkun parents: 291 diff changeset	10
291 87128b876c63 add test ikkun parents: 290 diff changeset	11 #include <cuda_runtime.h>
292 2bc63a22dd21 add twice ikkun parents: 291 diff changeset	12 #include "helper_cuda.h"
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	13
625a19d81ed7 add Cmake ikkun parents: diff changeset	14 #define LENGTH (10)
625a19d81ed7 add Cmake ikkun parents: diff changeset	15 #define THREAD (10)
625a19d81ed7 add Cmake ikkun parents: diff changeset	16
625a19d81ed7 add Cmake ikkun parents: diff changeset	17 double
625a19d81ed7 add Cmake ikkun parents: diff changeset	18 getTime() {
625a19d81ed7 add Cmake ikkun parents: diff changeset	19 struct timeval tv;
625a19d81ed7 add Cmake ikkun parents: diff changeset	20 gettimeofday(&tv, NULL);
625a19d81ed7 add Cmake ikkun parents: diff changeset	21 return tv.tv_sec + (double)tv.tv_usec*1e-6;
625a19d81ed7 add Cmake ikkun parents: diff changeset	22 }
625a19d81ed7 add Cmake ikkun parents: diff changeset	23
625a19d81ed7 add Cmake ikkun parents: diff changeset	24 void
625a19d81ed7 add Cmake ikkun parents: diff changeset	25 check_data(float* A, float B, float* C) {
625a19d81ed7 add Cmake ikkun parents: diff changeset	26 for (int i=0; i<LENGTH*THREAD; i++) {
625a19d81ed7 add Cmake ikkun parents: diff changeset	27 if (A[i]*B!=C[i]) {
625a19d81ed7 add Cmake ikkun parents: diff changeset	28 puts("multiply failure.");
625a19d81ed7 add Cmake ikkun parents: diff changeset	29 return;
625a19d81ed7 add Cmake ikkun parents: diff changeset	30 }
625a19d81ed7 add Cmake ikkun parents: diff changeset	31 }
625a19d81ed7 add Cmake ikkun parents: diff changeset	32 puts("success.");
625a19d81ed7 add Cmake ikkun parents: diff changeset	33 }
625a19d81ed7 add Cmake ikkun parents: diff changeset	34
625a19d81ed7 add Cmake ikkun parents: diff changeset	35 void print_result(float* C) {
625a19d81ed7 add Cmake ikkun parents: diff changeset	36 for (int i=0; i<LENGTH*THREAD; i++) {
625a19d81ed7 add Cmake ikkun parents: diff changeset	37 printf("%f\n",C[i]);
625a19d81ed7 add Cmake ikkun parents: diff changeset	38 }
625a19d81ed7 add Cmake ikkun parents: diff changeset	39 }
625a19d81ed7 add Cmake ikkun parents: diff changeset	40
314 1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	41 int num_stream = 1; // number of stream
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	42 int num_exec = 16; // number of executed kernel
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	43
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	44 static void start_cuda(void ) ;
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	45
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	46 int main(int args, char* argv[]) {
625a19d81ed7 add Cmake ikkun parents: diff changeset	47
625a19d81ed7 add Cmake ikkun parents: diff changeset	48 for (int i=1;argv[i];i++) {
625a19d81ed7 add Cmake ikkun parents: diff changeset	49 if (strcmp(argv[i], "--stream") == 0 \|\| strcmp(argv[i], "-s") == 0) {
625a19d81ed7 add Cmake ikkun parents: diff changeset	50 num_stream = atoi(argv[++i]);
625a19d81ed7 add Cmake ikkun parents: diff changeset	51 }
300 8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	52 if (strcmp(argv[i], "--numExec") == 0 \|\| strcmp(argv[i], "-e") == 0) {
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	53 num_exec = atoi(argv[++i]);
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	54 }
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	55 }
314 1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	56 #if 0
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	57 start_cuda(NULL);
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	58 #else
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	59 pthread_t thread;
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	60 pthread_create(&thread, NULL, start_cuda, NULL);
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	61 pthread_join(thread,NULL);
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	62 #endif
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	63 return 0;
1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	64 }
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	65
314 1839586f5b41 pthread CUDA test Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 301 diff changeset	66 static void start_cuda(void args) {
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	67 // initialize and load kernel
625a19d81ed7 add Cmake ikkun parents: diff changeset	68 CUdevice device;
625a19d81ed7 add Cmake ikkun parents: diff changeset	69 CUcontext context;
625a19d81ed7 add Cmake ikkun parents: diff changeset	70 CUmodule module;
625a19d81ed7 add Cmake ikkun parents: diff changeset	71 CUfunction function;
625a19d81ed7 add Cmake ikkun parents: diff changeset	72 CUstream stream[num_stream];
625a19d81ed7 add Cmake ikkun parents: diff changeset	73
292 2bc63a22dd21 add twice ikkun parents: 291 diff changeset	74 checkCudaErrors(cuInit(0));
2bc63a22dd21 add twice ikkun parents: 291 diff changeset	75 checkCudaErrors(cuDeviceGet(&device, 0));
2bc63a22dd21 add twice ikkun parents: 291 diff changeset	76 checkCudaErrors(cuCtxCreate(&context, CU_CTX_SCHED_SPIN, device));
2bc63a22dd21 add twice ikkun parents: 291 diff changeset	77 checkCudaErrors(cuModuleLoad(&module, "multiply.ptx"));
2bc63a22dd21 add twice ikkun parents: 291 diff changeset	78 checkCudaErrors(cuModuleGetFunction(&function, module, "multiply"));
300 8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	79 if (num_stream) {
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	80 for (int i=0;i<num_stream;i++)
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	81 checkCudaErrors(cuStreamCreate(&stream[i],0));
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	82 }
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	83
625a19d81ed7 add Cmake ikkun parents: diff changeset	84 // memory allocate
625a19d81ed7 add Cmake ikkun parents: diff changeset	85 CUdeviceptr devA;
625a19d81ed7 add Cmake ikkun parents: diff changeset	86 CUdeviceptr devB[num_exec];
625a19d81ed7 add Cmake ikkun parents: diff changeset	87 CUdeviceptr devOut[num_exec];
625a19d81ed7 add Cmake ikkun parents: diff changeset	88
292 2bc63a22dd21 add twice ikkun parents: 291 diff changeset	89 checkCudaErrors(cuMemAlloc(&devA, LENGTHTHREADsizeof(float)));
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	90 for (int i=0;i<num_exec;i++) {
292 2bc63a22dd21 add twice ikkun parents: 291 diff changeset	91 checkCudaErrors(cuMemAlloc(&devB[i], sizeof(float)));
2bc63a22dd21 add twice ikkun parents: 291 diff changeset	92 checkCudaErrors(cuMemAlloc(&devOut[i], LENGTHTHREADsizeof(float)));
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	93 }
625a19d81ed7 add Cmake ikkun parents: diff changeset	94
625a19d81ed7 add Cmake ikkun parents: diff changeset	95 // input buffer
625a19d81ed7 add Cmake ikkun parents: diff changeset	96 float* A = new float[LENGTH*THREAD];
625a19d81ed7 add Cmake ikkun parents: diff changeset	97 float* B = new float[num_exec];
625a19d81ed7 add Cmake ikkun parents: diff changeset	98
625a19d81ed7 add Cmake ikkun parents: diff changeset	99 for (int i=0; i<LENGTH*THREAD; i++)
625a19d81ed7 add Cmake ikkun parents: diff changeset	100 A[i] = (float)(i+1000);
625a19d81ed7 add Cmake ikkun parents: diff changeset	101
625a19d81ed7 add Cmake ikkun parents: diff changeset	102 // output buffer
625a19d81ed7 add Cmake ikkun parents: diff changeset	103 float** result = new float* [num_exec];
625a19d81ed7 add Cmake ikkun parents: diff changeset	104
625a19d81ed7 add Cmake ikkun parents: diff changeset	105 for (int i=0;i<num_exec;i++)
625a19d81ed7 add Cmake ikkun parents: diff changeset	106 result[i] = new float[LENGTH*THREAD];
625a19d81ed7 add Cmake ikkun parents: diff changeset	107
625a19d81ed7 add Cmake ikkun parents: diff changeset	108 // Synchronous data transfer(host to device)
292 2bc63a22dd21 add twice ikkun parents: 291 diff changeset	109 checkCudaErrors(cuMemcpyHtoD(devA, A, LENGTHTHREADsizeof(float)));
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	110
625a19d81ed7 add Cmake ikkun parents: diff changeset	111 // Asynchronous data transfer(host to device)
625a19d81ed7 add Cmake ikkun parents: diff changeset	112 int cur = 0;
625a19d81ed7 add Cmake ikkun parents: diff changeset	113
625a19d81ed7 add Cmake ikkun parents: diff changeset	114 for (int i=0;i<num_exec;i++,cur++) {
625a19d81ed7 add Cmake ikkun parents: diff changeset	115 if (num_stream <= cur)
625a19d81ed7 add Cmake ikkun parents: diff changeset	116 cur = 0;
625a19d81ed7 add Cmake ikkun parents: diff changeset	117 B[i] = (float)(i+1);
300 8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	118 if (num_stream) {
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	119 checkCudaErrors(cuMemcpyHtoDAsync(devB[i], &B[i], sizeof(float), stream[cur]));
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	120 } else {
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	121 checkCudaErrors(cuMemcpyHtoD(devB[i], &B[i], sizeof(float)));
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	122 }
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	123 }
625a19d81ed7 add Cmake ikkun parents: diff changeset	124
625a19d81ed7 add Cmake ikkun parents: diff changeset	125 cur = 0;
625a19d81ed7 add Cmake ikkun parents: diff changeset	126
625a19d81ed7 add Cmake ikkun parents: diff changeset	127 // Asynchronous launch kernel
625a19d81ed7 add Cmake ikkun parents: diff changeset	128 for (int i=0;i<num_exec;i++,cur++) {
625a19d81ed7 add Cmake ikkun parents: diff changeset	129 if (num_stream <= cur)
625a19d81ed7 add Cmake ikkun parents: diff changeset	130 cur=0;
301 609bf62768b9 add -DUSE_CUDA=1 flag to cmake Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 300 diff changeset	131 //B[i] = (float)(i+1);
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	132 //cuMemcpyHtoDAsync(devB[i], &B[i], sizeof(float), stream[cur]);
625a19d81ed7 add Cmake ikkun parents: diff changeset	133 void* args[] = {&devA, &devB[i], &devOut[i]};
292 2bc63a22dd21 add twice ikkun parents: 291 diff changeset	134 checkCudaErrors(cuLaunchKernel(function,
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	135 LENGTH, 1, 1,
625a19d81ed7 add Cmake ikkun parents: diff changeset	136 THREAD, 1, 1,
301 609bf62768b9 add -DUSE_CUDA=1 flag to cmake Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 300 diff changeset	137 0, num_stream ? stream[cur] : NULL , args, NULL));
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	138 //cuMemcpyDtoHAsync(result[i], devOut[i], LENGTHTHREADsizeof(float), stream[cur]);
625a19d81ed7 add Cmake ikkun parents: diff changeset	139 }
625a19d81ed7 add Cmake ikkun parents: diff changeset	140
625a19d81ed7 add Cmake ikkun parents: diff changeset	141 cur = 0;
625a19d81ed7 add Cmake ikkun parents: diff changeset	142
625a19d81ed7 add Cmake ikkun parents: diff changeset	143
625a19d81ed7 add Cmake ikkun parents: diff changeset	144 // Asynchronous data transfer(device to host)
625a19d81ed7 add Cmake ikkun parents: diff changeset	145 for (int i=0;i<num_exec;i++,cur++) {
625a19d81ed7 add Cmake ikkun parents: diff changeset	146 if (num_stream <= cur)
625a19d81ed7 add Cmake ikkun parents: diff changeset	147 cur = 0;
300 8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	148 if (num_stream) {
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	149 checkCudaErrors(cuMemcpyDtoHAsync(result[i], devOut[i], LENGTHTHREADsizeof(float), stream[cur]));
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	150 } else {
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	151 checkCudaErrors(cuMemcpyDtoH(result[i], devOut[i], LENGTHTHREADsizeof(float)));
8bbc0012e1a4 checkErrors on an example Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 299 diff changeset	152 }
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	153 }
625a19d81ed7 add Cmake ikkun parents: diff changeset	154
625a19d81ed7 add Cmake ikkun parents: diff changeset	155 // wait for stream
625a19d81ed7 add Cmake ikkun parents: diff changeset	156 for (int i=0;i<num_stream;i++)
292 2bc63a22dd21 add twice ikkun parents: 291 diff changeset	157 checkCudaErrors(cuStreamSynchronize(stream[i]));
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	158
625a19d81ed7 add Cmake ikkun parents: diff changeset	159 //printf("%0.6f\n",getTime()-start);
625a19d81ed7 add Cmake ikkun parents: diff changeset	160
625a19d81ed7 add Cmake ikkun parents: diff changeset	161 for (int i=0;i<num_exec;i++)
625a19d81ed7 add Cmake ikkun parents: diff changeset	162 check_data(A,(float)(i+1),result[i]);
625a19d81ed7 add Cmake ikkun parents: diff changeset	163
625a19d81ed7 add Cmake ikkun parents: diff changeset	164 // memory release
292 2bc63a22dd21 add twice ikkun parents: 291 diff changeset	165 checkCudaErrors(cuMemFree(devA));
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	166 for (int i=0;i<num_exec;i++) {
292 2bc63a22dd21 add twice ikkun parents: 291 diff changeset	167 checkCudaErrors(cuMemFree(devB[i]));
2bc63a22dd21 add twice ikkun parents: 291 diff changeset	168 checkCudaErrors(cuMemFree(devOut[i]));
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	169 }
625a19d81ed7 add Cmake ikkun parents: diff changeset	170 for (int i=0;i<num_stream;i++)
292 2bc63a22dd21 add twice ikkun parents: 291 diff changeset	171 checkCudaErrors(cuStreamDestroy(stream[i]));
2bc63a22dd21 add twice ikkun parents: 291 diff changeset	172 checkCudaErrors(cuModuleUnload(module));
2bc63a22dd21 add twice ikkun parents: 291 diff changeset	173 checkCudaErrors(cuCtxDestroy(context));
290 625a19d81ed7 add Cmake ikkun parents: diff changeset	174
625a19d81ed7 add Cmake ikkun parents: diff changeset	175 delete[] A;
625a19d81ed7 add Cmake ikkun parents: diff changeset	176 delete[] B;
625a19d81ed7 add Cmake ikkun parents: diff changeset	177 for (int i=0;i<num_exec;i++)
625a19d81ed7 add Cmake ikkun parents: diff changeset	178 delete[] result[i];
625a19d81ed7 add Cmake ikkun parents: diff changeset	179 delete[] result;
625a19d81ed7 add Cmake ikkun parents: diff changeset	180 return 0;
625a19d81ed7 add Cmake ikkun parents: diff changeset	181 }
299 b387b224790c merge Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 298 diff changeset	182

Mercurial > hg > Members > Moririn

annotate src/test/twice.cc @ 502:8d997f0c9b2c