Members/tobaru/cbc/CbC_llvm: test/CodeGen/AMDGPU/mul

annotate test/CodeGen/AMDGPU/mul_uint24-amdgcn.ll @ 128:c347d3398279 default tip

fix

author	mir3636
date	Wed, 06 Dec 2017 14:37:17 +0900
parents	803732b1fca8
children

rev	line source
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	1 ; RUN: llc -march=amdgcn -verify-machineinstrs < %s \| FileCheck -check-prefix=GCN -check-prefix=SI -check-prefix=FUNC %s
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	2 ; RUN: llc -march=amdgcn -mcpu=tonga -mattr=-flat-for-global -verify-machineinstrs < %s \| FileCheck -check-prefix=GCN -check-prefix=VI -check-prefix=FUNC %s
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	3
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	4 declare i32 @llvm.amdgcn.workitem.id.x() nounwind readnone
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	5 declare i32 @llvm.amdgcn.workitem.id.y() nounwind readnone
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	6
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	7 ; FUNC-LABEL: {{^}}test_umul24_i32:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	8 ; GCN: v_mul_u32_u24
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	9 define amdgpu_kernel void @test_umul24_i32(i32 addrspace(1)* %out, i32 %a, i32 %b) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	10 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	11 %0 = shl i32 %a, 8
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	12 %a_24 = lshr i32 %0, 8
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	13 %1 = shl i32 %b, 8
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	14 %b_24 = lshr i32 %1, 8
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	15 %2 = mul i32 %a_24, %b_24
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	16 store i32 %2, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	17 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	18 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	19
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	20 ; FUNC-LABEL: {{^}}test_umul24_i16_sext:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	21 ; SI: v_mul_u32_u24_e{{(32\|64)}} [[VI_MUL:v[0-9]]], {{[sv][0-9], [sv][0-9]}}
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	22 ; SI: v_bfe_i32 v{{[0-9]}}, [[VI_MUL]], 0, 16
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	23 ; VI: s_mul_i32 [[SI_MUL:s[0-9]]], s{{[0-9]}}, s{{[0-9]}}
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	24 ; VI: s_sext_i32_i16 s{{[0-9]}}, [[SI_MUL]]
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	25 define amdgpu_kernel void @test_umul24_i16_sext(i32 addrspace(1)* %out, i16 %a, i16 %b) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	26 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	27 %mul = mul i16 %a, %b
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	28 %ext = sext i16 %mul to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	29 store i32 %ext, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	30 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	31 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	33 ; FUNC-LABEL: {{^}}test_umul24_i16_vgpr_sext:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	34 ; SI: v_mul_u32_u24_e{{(32\|64)}} [[MUL:v[0-9]]], {{[sv][0-9], [sv][0-9]}}
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	35 ; VI: v_mul_lo_u16_e{{(32\|64)}} [[MUL:v[0-9]]], {{[sv][0-9], [sv][0-9]}}
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	36 ; GCN: v_bfe_i32 v{{[0-9]}}, [[MUL]], 0, 16
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	37 define amdgpu_kernel void @test_umul24_i16_vgpr_sext(i32 addrspace(1)* %out, i16 addrspace(1)* %in) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	38 %tid.x = call i32 @llvm.amdgcn.workitem.id.x()
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	39 %tid.y = call i32 @llvm.amdgcn.workitem.id.y()
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	40 %ptr_a = getelementptr i16, i16 addrspace(1)* %in, i32 %tid.x
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	41 %ptr_b = getelementptr i16, i16 addrspace(1)* %in, i32 %tid.y
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	42 %a = load i16, i16 addrspace(1)* %ptr_a
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	43 %b = load i16, i16 addrspace(1)* %ptr_b
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	44 %mul = mul i16 %a, %b
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	45 %val = sext i16 %mul to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	46 store i32 %val, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	47 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	48 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	49
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	50 ; FUNC-LABEL: {{^}}test_umul24_i16:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	51 ; SI: s_and_b32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	52 ; SI: v_mul_u32_u24_e32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	53 ; SI: v_and_b32_e32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	54 ; VI: s_mul_i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	55 ; VI: s_and_b32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	56 ; VI: v_mov_b32_e32
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	57 define amdgpu_kernel void @test_umul24_i16(i32 addrspace(1)* %out, i16 %a, i16 %b) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	58 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	59 %mul = mul i16 %a, %b
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	60 %ext = zext i16 %mul to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	61 store i32 %ext, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	62 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	63 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	64
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	65 ; FUNC-LABEL: {{^}}test_umul24_i16_vgpr:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	66 ; SI: v_mul_u32_u24_e32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	67 ; SI: v_and_b32_e32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	68 ; VI: v_mul_lo_u16
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	69 define amdgpu_kernel void @test_umul24_i16_vgpr(i32 addrspace(1)* %out, i16 addrspace(1)* %in) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	70 %tid.x = call i32 @llvm.amdgcn.workitem.id.x()
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	71 %tid.y = call i32 @llvm.amdgcn.workitem.id.y()
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	72 %ptr_a = getelementptr i16, i16 addrspace(1)* %in, i32 %tid.x
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	73 %ptr_b = getelementptr i16, i16 addrspace(1)* %in, i32 %tid.y
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	74 %a = load i16, i16 addrspace(1)* %ptr_a
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	75 %b = load i16, i16 addrspace(1)* %ptr_b
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	76 %mul = mul i16 %a, %b
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	77 %val = zext i16 %mul to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	78 store i32 %val, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	79 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	80 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	81
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	82 ; FUNC-LABEL: {{^}}test_umul24_i8_vgpr:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	83 ; SI: v_mul_u32_u24_e{{(32\|64)}} [[MUL:v[0-9]]], {{[sv][0-9], [sv][0-9]}}
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	84 ; VI: v_mul_lo_u16_e{{(32\|64)}} [[MUL:v[0-9]]], {{[sv][0-9], [sv][0-9]}}
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	85 ; GCN: v_bfe_i32 v{{[0-9]}}, [[MUL]], 0, 8
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	86 define amdgpu_kernel void @test_umul24_i8_vgpr(i32 addrspace(1)* %out, i8 addrspace(1)* %a, i8 addrspace(1)* %b) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	87 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	88 %tid.x = call i32 @llvm.amdgcn.workitem.id.x()
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	89 %tid.y = call i32 @llvm.amdgcn.workitem.id.y()
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	90 %a.ptr = getelementptr i8, i8 addrspace(1)* %a, i32 %tid.x
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	91 %b.ptr = getelementptr i8, i8 addrspace(1)* %b, i32 %tid.y
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	92 %a.l = load i8, i8 addrspace(1)* %a.ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	93 %b.l = load i8, i8 addrspace(1)* %b.ptr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	94 %mul = mul i8 %a.l, %b.l
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	95 %ext = sext i8 %mul to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	96 store i32 %ext, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	97 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	98 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	99
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	100 ; FUNC-LABEL: {{^}}test_umulhi24_i32_i64:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	101 ; GCN-NOT: and
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	102 ; GCN: v_mul_hi_u32_u24_e32 [[RESULT:v[0-9]+]],
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	103 ; GCN-NEXT: buffer_store_dword [[RESULT]]
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	104 define amdgpu_kernel void @test_umulhi24_i32_i64(i32 addrspace(1)* %out, i32 %a, i32 %b) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	105 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	106 %a.24 = and i32 %a, 16777215
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	107 %b.24 = and i32 %b, 16777215
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	108 %a.24.i64 = zext i32 %a.24 to i64
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	109 %b.24.i64 = zext i32 %b.24 to i64
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	110 %mul48 = mul i64 %a.24.i64, %b.24.i64
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	111 %mul48.hi = lshr i64 %mul48, 32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	112 %mul24hi = trunc i64 %mul48.hi to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	113 store i32 %mul24hi, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	114 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	115 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	116
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	117 ; FUNC-LABEL: {{^}}test_umulhi24:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	118 ; GCN-NOT: and
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	119 ; GCN: v_mul_hi_u32_u24_e32 [[RESULT:v[0-9]+]],
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	120 ; GCN-NEXT: buffer_store_dword [[RESULT]]
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	121 define amdgpu_kernel void @test_umulhi24(i32 addrspace(1)* %out, i64 %a, i64 %b) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	122 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	123 %a.24 = and i64 %a, 16777215
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	124 %b.24 = and i64 %b, 16777215
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	125 %mul48 = mul i64 %a.24, %b.24
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	126 %mul48.hi = lshr i64 %mul48, 32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	127 %mul24.hi = trunc i64 %mul48.hi to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	128 store i32 %mul24.hi, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	129 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	130 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	131
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	132 ; Multiply with 24-bit inputs and 64-bit output.
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	133 ; FUNC-LABEL: {{^}}test_umul24_i64:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	134 ; GCN-NOT: and
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	135 ; GCN-NOT: lshr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	136 ; GCN-DAG: v_mul_u32_u24_e32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	137 ; GCN-DAG: v_mul_hi_u32_u24_e32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	138 ; GCN: buffer_store_dwordx2
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	139 define amdgpu_kernel void @test_umul24_i64(i64 addrspace(1)* %out, i64 %a, i64 %b) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	140 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	141 %tmp0 = shl i64 %a, 40
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	142 %a_24 = lshr i64 %tmp0, 40
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	143 %tmp1 = shl i64 %b, 40
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	144 %b_24 = lshr i64 %tmp1, 40
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	145 %tmp2 = mul i64 %a_24, %b_24
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	146 store i64 %tmp2, i64 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	147 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	148 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	149
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	150 ; FUNC-LABEL: {{^}}test_umul24_i64_square:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	151 ; GCN: s_load_dword [[A:s[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	152 ; GCN-NOT: s_and_b32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	153 ; GCN-DAG: v_mul_hi_u32_u24_e64 v{{[0-9]+}}, [[A]], [[A]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	154 ; GCN-DAG: v_mul_u32_u24_e64 v{{[0-9]+}}, [[A]], [[A]]
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	155 define amdgpu_kernel void @test_umul24_i64_square(i64 addrspace(1)* %out, i64 %a) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	156 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	157 %tmp0 = shl i64 %a, 40
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	158 %a.24 = lshr i64 %tmp0, 40
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	159 %tmp2 = mul i64 %a.24, %a.24
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	160 store i64 %tmp2, i64 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	161 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	162 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	163
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	164 ; FUNC-LABEL: {{^}}test_umulhi16_i32:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	165 ; GCN: s_and_b32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	166 ; GCN: s_and_b32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	167 ; GCN: v_mul_u32_u24_e32 [[MUL24:v[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	168 ; GCN: v_lshrrev_b32_e32 v{{[0-9]+}}, 16, [[MUL24]]
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	169 define amdgpu_kernel void @test_umulhi16_i32(i16 addrspace(1)* %out, i32 %a, i32 %b) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	170 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	171 %a.16 = and i32 %a, 65535
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	172 %b.16 = and i32 %b, 65535
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	173 %mul = mul i32 %a.16, %b.16
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	174 %hi = lshr i32 %mul, 16
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	175 %mulhi = trunc i32 %hi to i16
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	176 store i16 %mulhi, i16 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	177 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	178 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	179
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	180 ; FUNC-LABEL: {{^}}test_umul24_i33:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	181 ; GCN: s_load_dword s
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	182 ; GCN: s_load_dword s
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	183 ; GCN-NOT: and
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	184 ; GCN-NOT: lshr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	185 ; GCN-DAG: v_mul_u32_u24_e32 v[[MUL_LO:[0-9]+]],
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	186 ; GCN-DAG: v_mul_hi_u32_u24_e32 v[[MUL_HI:[0-9]+]],
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	187 ; GCN-DAG: v_and_b32_e32 v[[HI:[0-9]+]], 1, v[[MUL_HI]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	188 ; GCN: buffer_store_dwordx2 v{{\[}}[[MUL_LO]]:[[HI]]{{\]}}
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	189 define amdgpu_kernel void @test_umul24_i33(i64 addrspace(1)* %out, i33 %a, i33 %b) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	190 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	191 %tmp0 = shl i33 %a, 9
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	192 %a_24 = lshr i33 %tmp0, 9
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	193 %tmp1 = shl i33 %b, 9
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	194 %b_24 = lshr i33 %tmp1, 9
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	195 %tmp2 = mul i33 %a_24, %b_24
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	196 %ext = zext i33 %tmp2 to i64
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	197 store i64 %ext, i64 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	198 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	199 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	200
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	201 ; FUNC-LABEL: {{^}}test_umulhi24_i33:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	202 ; GCN: s_load_dword s
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	203 ; GCN: s_load_dword s
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	204 ; GCN-NOT: and
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	205 ; GCN-NOT: lshr
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	206 ; GCN: v_mul_hi_u32_u24_e32 v[[MUL_HI:[0-9]+]],
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	207 ; GCN-NEXT: v_and_b32_e32 v[[HI:[0-9]+]], 1, v[[MUL_HI]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	208 ; GCN-NEXT: buffer_store_dword v[[HI]]
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	209 define amdgpu_kernel void @test_umulhi24_i33(i32 addrspace(1)* %out, i33 %a, i33 %b) {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	210 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	211 %tmp0 = shl i33 %a, 9
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	212 %a_24 = lshr i33 %tmp0, 9
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	213 %tmp1 = shl i33 %b, 9
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	214 %b_24 = lshr i33 %tmp1, 9
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	215 %tmp2 = mul i33 %a_24, %b_24
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	216 %hi = lshr i33 %tmp2, 32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	217 %trunc = trunc i33 %hi to i32
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	218 store i32 %trunc, i32 addrspace(1)* %out
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	219 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	220 }

Mercurial > hg > Members > tobaru > cbc > CbC_llvm

annotate test/CodeGen/AMDGPU/mul_uint24-amdgcn.ll @ 128:c347d3398279 default tip