Members/tobaru/cbc/CbC_llvm: test/CodeGen/AMDGPU/private-memory-r600.ll annotate

annotate test/CodeGen/AMDGPU/private-memory-r600.ll @ 128:c347d3398279 default tip

fix

author	mir3636
date	Wed, 06 Dec 2017 14:37:17 +0900
parents	803732b1fca8
children

rev	line source
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	1 ; RUN: llc -march=r600 -mcpu=redwood < %s \| FileCheck %s -check-prefix=R600 -check-prefix=FUNC
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	2 ; RUN: opt -S -mtriple=r600-unknown-unknown -mcpu=redwood -amdgpu-promote-alloca < %s \| FileCheck -check-prefix=OPT %s
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	3
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	4 declare i32 @llvm.r600.read.tidig.x() nounwind readnone
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	5
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	6 ; FUNC-LABEL: {{^}}mova_same_clause:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	7
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	8 ; R600: LDS_WRITE
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	9 ; R600: LDS_WRITE
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	10 ; R600: LDS_READ
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	11 ; R600: LDS_READ
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	12
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	13 ; OPT: call i32 @llvm.r600.read.local.size.y(), !range !0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	14 ; OPT: call i32 @llvm.r600.read.local.size.z(), !range !0
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	15 ; OPT: call i32 @llvm.r600.read.tidig.x(), !range !1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	16 ; OPT: call i32 @llvm.r600.read.tidig.y(), !range !1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	17 ; OPT: call i32 @llvm.r600.read.tidig.z(), !range !1
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	18
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	19 define amdgpu_kernel void @mova_same_clause(i32 addrspace(1)* nocapture %out, i32 addrspace(1)* nocapture %in) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	20 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	21 %stack = alloca [5 x i32], align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	22 %0 = load i32, i32 addrspace(1)* %in, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	23 %arrayidx1 = getelementptr inbounds [5 x i32], [5 x i32]* %stack, i32 0, i32 %0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	24 store i32 4, i32* %arrayidx1, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	25 %arrayidx2 = getelementptr inbounds i32, i32 addrspace(1)* %in, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	26 %1 = load i32, i32 addrspace(1)* %arrayidx2, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	27 %arrayidx3 = getelementptr inbounds [5 x i32], [5 x i32]* %stack, i32 0, i32 %1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	28 store i32 5, i32* %arrayidx3, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	29 %arrayidx10 = getelementptr inbounds [5 x i32], [5 x i32]* %stack, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	30 %2 = load i32, i32* %arrayidx10, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	31 store i32 %2, i32 addrspace(1)* %out, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	32 %arrayidx12 = getelementptr inbounds [5 x i32], [5 x i32]* %stack, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	33 %3 = load i32, i32* %arrayidx12
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	34 %arrayidx13 = getelementptr inbounds i32, i32 addrspace(1)* %out, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	35 store i32 %3, i32 addrspace(1)* %arrayidx13
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	36 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	37 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	38
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	39 ; This test checks that the stack offset is calculated correctly for structs.
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	40 ; All register loads/stores should be optimized away, so there shouldn't be
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	41 ; any MOVA instructions.
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	42 ;
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	43 ; XXX: This generated code has unnecessary MOVs, we should be able to optimize
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	44 ; this.
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	45
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	46 ; FUNC-LABEL: {{^}}multiple_structs:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	47 ; R600-NOT: MOVA_INT
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	48 %struct.point = type { i32, i32 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	49
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	50 define amdgpu_kernel void @multiple_structs(i32 addrspace(1)* %out) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	51 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	52 %a = alloca %struct.point
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	53 %b = alloca %struct.point
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	54 %a.x.ptr = getelementptr inbounds %struct.point, %struct.point* %a, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	55 %a.y.ptr = getelementptr inbounds %struct.point, %struct.point* %a, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	56 %b.x.ptr = getelementptr inbounds %struct.point, %struct.point* %b, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	57 %b.y.ptr = getelementptr inbounds %struct.point, %struct.point* %b, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	58 store i32 0, i32* %a.x.ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	59 store i32 1, i32* %a.y.ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	60 store i32 2, i32* %b.x.ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	61 store i32 3, i32* %b.y.ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	62 %a.indirect.ptr = getelementptr inbounds %struct.point, %struct.point* %a, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	63 %b.indirect.ptr = getelementptr inbounds %struct.point, %struct.point* %b, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	64 %a.indirect = load i32, i32* %a.indirect.ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	65 %b.indirect = load i32, i32* %b.indirect.ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	66 %0 = add i32 %a.indirect, %b.indirect
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	67 store i32 %0, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	68 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	69 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	70
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	71 ; Test direct access of a private array inside a loop. The private array
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	72 ; loads and stores should be lowered to copies, so there shouldn't be any
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	73 ; MOVA instructions.
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	74
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	75 ; FUNC-LABEL: {{^}}direct_loop:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	76 ; R600-NOT: MOVA_INT
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	77
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	78 define amdgpu_kernel void @direct_loop(i32 addrspace(1)* %out, i32 addrspace(1)* %in) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	79 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	80 %prv_array_const = alloca [2 x i32]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	81 %prv_array = alloca [2 x i32]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	82 %a = load i32, i32 addrspace(1)* %in
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	83 %b_src_ptr = getelementptr inbounds i32, i32 addrspace(1)* %in, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	84 %b = load i32, i32 addrspace(1)* %b_src_ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	85 %a_dst_ptr = getelementptr inbounds [2 x i32], [2 x i32]* %prv_array_const, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	86 store i32 %a, i32* %a_dst_ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	87 %b_dst_ptr = getelementptr inbounds [2 x i32], [2 x i32]* %prv_array_const, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	88 store i32 %b, i32* %b_dst_ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	89 br label %for.body
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	90
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	91 for.body:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	92 %inc = phi i32 [0, %entry], [%count, %for.body]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	93 %x_ptr = getelementptr inbounds [2 x i32], [2 x i32]* %prv_array_const, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	94 %x = load i32, i32* %x_ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	95 %y_ptr = getelementptr inbounds [2 x i32], [2 x i32]* %prv_array, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	96 %y = load i32, i32* %y_ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	97 %xy = add i32 %x, %y
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	98 store i32 %xy, i32* %y_ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	99 %count = add i32 %inc, 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	100 %done = icmp eq i32 %count, 4095
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	101 br i1 %done, label %for.end, label %for.body
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	102
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	103 for.end:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	104 %value_ptr = getelementptr inbounds [2 x i32], [2 x i32]* %prv_array, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	105 %value = load i32, i32* %value_ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	106 store i32 %value, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	107 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	108 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	109
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	110 ; FUNC-LABEL: {{^}}short_array:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	111
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	112 ; R600: MOVA_INT
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	113 define amdgpu_kernel void @short_array(i32 addrspace(1)* %out, i32 %index) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	114 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	115 %0 = alloca [2 x i16]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	116 %1 = getelementptr inbounds [2 x i16], [2 x i16]* %0, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	117 %2 = getelementptr inbounds [2 x i16], [2 x i16]* %0, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	118 store i16 0, i16* %1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	119 store i16 1, i16* %2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	120 %3 = getelementptr inbounds [2 x i16], [2 x i16]* %0, i32 0, i32 %index
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	121 %4 = load i16, i16* %3
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	122 %5 = sext i16 %4 to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	123 store i32 %5, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	124 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	125 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	126
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	127 ; FUNC-LABEL: {{^}}char_array:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	128
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	129 ; R600: MOVA_INT
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	130 define amdgpu_kernel void @char_array(i32 addrspace(1)* %out, i32 %index) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	131 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	132 %0 = alloca [2 x i8]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	133 %1 = getelementptr inbounds [2 x i8], [2 x i8]* %0, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	134 %2 = getelementptr inbounds [2 x i8], [2 x i8]* %0, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	135 store i8 0, i8* %1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	136 store i8 1, i8* %2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	137 %3 = getelementptr inbounds [2 x i8], [2 x i8]* %0, i32 0, i32 %index
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	138 %4 = load i8, i8* %3
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	139 %5 = sext i8 %4 to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	140 store i32 %5, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	141 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	142
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	143 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	144
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	145 ; Make sure we don't overwrite workitem information with private memory
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	146
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	147 ; FUNC-LABEL: {{^}}work_item_info:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	148 ; R600-NOT: MOV T0.X
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	149 ; Additional check in case the move ends up in the last slot
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	150 ; R600-NOT: MOV * TO.X
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	151 define amdgpu_kernel void @work_item_info(i32 addrspace(1)* %out, i32 %in) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	152 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	153 %0 = alloca [2 x i32]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	154 %1 = getelementptr inbounds [2 x i32], [2 x i32]* %0, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	155 %2 = getelementptr inbounds [2 x i32], [2 x i32]* %0, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	156 store i32 0, i32* %1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	157 store i32 1, i32* %2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	158 %3 = getelementptr inbounds [2 x i32], [2 x i32]* %0, i32 0, i32 %in
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	159 %4 = load i32, i32* %3
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	160 %5 = call i32 @llvm.r600.read.tidig.x()
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	161 %6 = add i32 %4, %5
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	162 store i32 %6, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	163 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	164 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	165
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	166 ; Test that two stack objects are not stored in the same register
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	167 ; The second stack object should be in T3.X
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	168 ; FUNC-LABEL: {{^}}no_overlap:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	169 ; R600_CHECK: MOV
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	170 ; R600_CHECK: [[CHAN:[XYZW]]]+
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	171 ; R600-NOT: [[CHAN]]+
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	172 define amdgpu_kernel void @no_overlap(i32 addrspace(1)* %out, i32 %in) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	173 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	174 %0 = alloca [3 x i8], align 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	175 %1 = alloca [2 x i8], align 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	176 %2 = getelementptr inbounds [3 x i8], [3 x i8]* %0, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	177 %3 = getelementptr inbounds [3 x i8], [3 x i8]* %0, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	178 %4 = getelementptr inbounds [3 x i8], [3 x i8]* %0, i32 0, i32 2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	179 %5 = getelementptr inbounds [2 x i8], [2 x i8]* %1, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	180 %6 = getelementptr inbounds [2 x i8], [2 x i8]* %1, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	181 store i8 0, i8* %2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	182 store i8 1, i8* %3
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	183 store i8 2, i8* %4
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	184 store i8 1, i8* %5
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	185 store i8 0, i8* %6
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	186 %7 = getelementptr inbounds [3 x i8], [3 x i8]* %0, i32 0, i32 %in
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	187 %8 = getelementptr inbounds [2 x i8], [2 x i8]* %1, i32 0, i32 %in
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	188 %9 = load i8, i8* %7
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	189 %10 = load i8, i8* %8
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	190 %11 = add i8 %9, %10
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	191 %12 = sext i8 %11 to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	192 store i32 %12, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	193 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	194 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	195
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	196 define amdgpu_kernel void @char_array_array(i32 addrspace(1)* %out, i32 %index) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	197 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	198 %alloca = alloca [2 x [2 x i8]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	199 %gep0 = getelementptr inbounds [2 x [2 x i8]], [2 x [2 x i8]]* %alloca, i32 0, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	200 %gep1 = getelementptr inbounds [2 x [2 x i8]], [2 x [2 x i8]]* %alloca, i32 0, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	201 store i8 0, i8* %gep0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	202 store i8 1, i8* %gep1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	203 %gep2 = getelementptr inbounds [2 x [2 x i8]], [2 x [2 x i8]]* %alloca, i32 0, i32 0, i32 %index
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	204 %load = load i8, i8* %gep2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	205 %sext = sext i8 %load to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	206 store i32 %sext, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	207 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	208 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	209
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	210 define amdgpu_kernel void @i32_array_array(i32 addrspace(1)* %out, i32 %index) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	211 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	212 %alloca = alloca [2 x [2 x i32]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	213 %gep0 = getelementptr inbounds [2 x [2 x i32]], [2 x [2 x i32]]* %alloca, i32 0, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	214 %gep1 = getelementptr inbounds [2 x [2 x i32]], [2 x [2 x i32]]* %alloca, i32 0, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	215 store i32 0, i32* %gep0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	216 store i32 1, i32* %gep1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	217 %gep2 = getelementptr inbounds [2 x [2 x i32]], [2 x [2 x i32]]* %alloca, i32 0, i32 0, i32 %index
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	218 %load = load i32, i32* %gep2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	219 store i32 %load, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	220 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	221 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	222
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	223 define amdgpu_kernel void @i64_array_array(i64 addrspace(1)* %out, i32 %index) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	224 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	225 %alloca = alloca [2 x [2 x i64]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	226 %gep0 = getelementptr inbounds [2 x [2 x i64]], [2 x [2 x i64]]* %alloca, i32 0, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	227 %gep1 = getelementptr inbounds [2 x [2 x i64]], [2 x [2 x i64]]* %alloca, i32 0, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	228 store i64 0, i64* %gep0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	229 store i64 1, i64* %gep1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	230 %gep2 = getelementptr inbounds [2 x [2 x i64]], [2 x [2 x i64]]* %alloca, i32 0, i32 0, i32 %index
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	231 %load = load i64, i64* %gep2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	232 store i64 %load, i64 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	233 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	234 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	235
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	236 %struct.pair32 = type { i32, i32 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	237
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	238 define amdgpu_kernel void @struct_array_array(i32 addrspace(1)* %out, i32 %index) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	239 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	240 %alloca = alloca [2 x [2 x %struct.pair32]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	241 %gep0 = getelementptr inbounds [2 x [2 x %struct.pair32]], [2 x [2 x %struct.pair32]]* %alloca, i32 0, i32 0, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	242 %gep1 = getelementptr inbounds [2 x [2 x %struct.pair32]], [2 x [2 x %struct.pair32]]* %alloca, i32 0, i32 0, i32 1, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	243 store i32 0, i32* %gep0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	244 store i32 1, i32* %gep1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	245 %gep2 = getelementptr inbounds [2 x [2 x %struct.pair32]], [2 x [2 x %struct.pair32]]* %alloca, i32 0, i32 0, i32 %index, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	246 %load = load i32, i32* %gep2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	247 store i32 %load, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	248 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	249 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	250
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	251 define amdgpu_kernel void @struct_pair32_array(i32 addrspace(1)* %out, i32 %index) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	252 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	253 %alloca = alloca [2 x %struct.pair32]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	254 %gep0 = getelementptr inbounds [2 x %struct.pair32], [2 x %struct.pair32]* %alloca, i32 0, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	255 %gep1 = getelementptr inbounds [2 x %struct.pair32], [2 x %struct.pair32]* %alloca, i32 0, i32 1, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	256 store i32 0, i32* %gep0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	257 store i32 1, i32* %gep1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	258 %gep2 = getelementptr inbounds [2 x %struct.pair32], [2 x %struct.pair32]* %alloca, i32 0, i32 %index, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	259 %load = load i32, i32* %gep2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	260 store i32 %load, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	261 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	262 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	263
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	264 define amdgpu_kernel void @select_private(i32 addrspace(1)* %out, i32 %in) nounwind {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	265 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	266 %tmp = alloca [2 x i32]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	267 %tmp1 = getelementptr inbounds [2 x i32], [2 x i32]* %tmp, i32 0, i32 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	268 %tmp2 = getelementptr inbounds [2 x i32], [2 x i32]* %tmp, i32 0, i32 1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	269 store i32 0, i32* %tmp1
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	270 store i32 1, i32* %tmp2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	271 %cmp = icmp eq i32 %in, 0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	272 %sel = select i1 %cmp, i32* %tmp1, i32* %tmp2
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	273 %load = load i32, i32* %sel
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	274 store i32 %load, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	275 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	276 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	277
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	278 ; AMDGPUPromoteAlloca does not know how to handle ptrtoint. When it
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	279 ; finds one, it should stop trying to promote.
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	280
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	281 ; FUNC-LABEL: ptrtoint:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	282 ; SI-NOT: ds_write
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	283 ; SI: buffer_store_dword v{{[0-9]+}}, v{{[0-9]+}}, s[{{[0-9]+:[0-9]+}}], s{{[0-9]+}} offen
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	284 ; SI: buffer_load_dword v{{[0-9]+}}, v{{[0-9]+}}, s[{{[0-9]+:[0-9]+}}], s{{[0-9]+}} offen ;
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	285 define amdgpu_kernel void @ptrtoint(i32 addrspace(1)* %out, i32 %a, i32 %b) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	286 %alloca = alloca [16 x i32]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	287 %tmp0 = getelementptr inbounds [16 x i32], [16 x i32]* %alloca, i32 0, i32 %a
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	288 store i32 5, i32* %tmp0
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	289 %tmp1 = ptrtoint [16 x i32]* %alloca to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	290 %tmp2 = add i32 %tmp1, 5
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	291 %tmp3 = inttoptr i32 %tmp2 to i32*
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	292 %tmp4 = getelementptr inbounds i32, i32* %tmp3, i32 %b
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	293 %tmp5 = load i32, i32* %tmp4
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	294 store i32 %tmp5, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	295 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	296 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	297
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	298 ; OPT: !0 = !{i32 0, i32 257}
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	299 ; OPT: !1 = !{i32 0, i32 256}
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	300
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	301 attributes #0 = { nounwind "amdgpu-waves-per-eu"="1,2" }

Mercurial > hg > Members > tobaru > cbc > CbC_llvm

annotate test/CodeGen/AMDGPU/private-memory-r600.ll @ 128:c347d3398279 default tip