CbC/CbC_llvm: llvm/test/CodeGen/AMDGPU/llvm.amdgcn.class.ll annotate

annotate llvm/test/CodeGen/AMDGPU/llvm.amdgcn.class.ll @ 206:f17a3b42b08b

Added tag before-12 for changeset b7591485f4cd

author	Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date	Mon, 07 Jun 2021 21:25:57 +0900
parents	1d019706d866
children	c4bab56944e8

rev	line source
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1 ; RUN: llc -amdgpu-scalarize-global-loads=false -march=amdgcn -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefix=SI %s
1d019706d866 LLVM10 anatofuz parents: diff changeset	2
1d019706d866 LLVM10 anatofuz parents: diff changeset	3 declare i1 @llvm.amdgcn.class.f32(float, i32) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	4 declare i1 @llvm.amdgcn.class.f64(double, i32) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	5 declare i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	6 declare float @llvm.fabs.f32(float) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	7 declare double @llvm.fabs.f64(double) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	8
1d019706d866 LLVM10 anatofuz parents: diff changeset	9 ; SI-LABEL: {{^}}test_class_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	10 ; SI-DAG: s_load_dword [[SA:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x13
1d019706d866 LLVM10 anatofuz parents: diff changeset	11 ; SI-DAG: s_load_dword [[SB:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x1c
1d019706d866 LLVM10 anatofuz parents: diff changeset	12 ; SI: v_mov_b32_e32 [[VB:v[0-9]+]], [[SB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	13 ; SI: v_cmp_class_f32_e32 vcc, [[SA]], [[VB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	14 ; SI-NEXT: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, vcc
1d019706d866 LLVM10 anatofuz parents: diff changeset	15 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	16 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	17 define amdgpu_kernel void @test_class_f32(i32 addrspace(1)* %out, [8 x i32], float %a, [8 x i32], i32 %b) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	18 %result = call i1 @llvm.amdgcn.class.f32(float %a, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	19 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	20 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	21 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	22 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	23
1d019706d866 LLVM10 anatofuz parents: diff changeset	24 ; SI-LABEL: {{^}}test_class_fabs_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	25 ; SI-DAG: s_load_dword [[SA:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x13
1d019706d866 LLVM10 anatofuz parents: diff changeset	26 ; SI-DAG: s_load_dword [[SB:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x1c
1d019706d866 LLVM10 anatofuz parents: diff changeset	27 ; SI: v_mov_b32_e32 [[VB:v[0-9]+]], [[SB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	28 ; SI: v_cmp_class_f32_e64 [[CMP:s\[[0-9]+:[0-9]+\]]], \|[[SA]]\|, [[VB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	29 ; SI-NEXT: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, [[CMP]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	30 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	31 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	32 define amdgpu_kernel void @test_class_fabs_f32(i32 addrspace(1)* %out, [8 x i32], float %a, [8 x i32], i32 %b) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	33 %a.fabs = call float @llvm.fabs.f32(float %a) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	34 %result = call i1 @llvm.amdgcn.class.f32(float %a.fabs, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	35 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	36 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	37 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	38 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	39
1d019706d866 LLVM10 anatofuz parents: diff changeset	40 ; SI-LABEL: {{^}}test_class_fneg_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	41 ; SI-DAG: s_load_dword [[SA:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x13
1d019706d866 LLVM10 anatofuz parents: diff changeset	42 ; SI-DAG: s_load_dword [[SB:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x1c
1d019706d866 LLVM10 anatofuz parents: diff changeset	43 ; SI: v_mov_b32_e32 [[VB:v[0-9]+]], [[SB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	44 ; SI: v_cmp_class_f32_e64 [[CMP:s\[[0-9]+:[0-9]+\]]], -[[SA]], [[VB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	45 ; SI-NEXT: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, [[CMP]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	46 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	47 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	48 define amdgpu_kernel void @test_class_fneg_f32(i32 addrspace(1)* %out, [8 x i32], float %a, [8 x i32], i32 %b) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	49 %a.fneg = fsub float -0.0, %a
1d019706d866 LLVM10 anatofuz parents: diff changeset	50 %result = call i1 @llvm.amdgcn.class.f32(float %a.fneg, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	51 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	52 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	53 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	54 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	55
1d019706d866 LLVM10 anatofuz parents: diff changeset	56 ; SI-LABEL: {{^}}test_class_fneg_fabs_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	57 ; SI-DAG: s_load_dword [[SA:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x13
1d019706d866 LLVM10 anatofuz parents: diff changeset	58 ; SI-DAG: s_load_dword [[SB:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x1c
1d019706d866 LLVM10 anatofuz parents: diff changeset	59 ; SI: v_mov_b32_e32 [[VB:v[0-9]+]], [[SB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	60 ; SI: v_cmp_class_f32_e64 [[CMP:s\[[0-9]+:[0-9]+\]]], -\|[[SA]]\|, [[VB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	61 ; SI-NEXT: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, [[CMP]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	62 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	63 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	64 define amdgpu_kernel void @test_class_fneg_fabs_f32(i32 addrspace(1)* %out, [8 x i32], float %a, [8 x i32], i32 %b) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	65 %a.fabs = call float @llvm.fabs.f32(float %a) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	66 %a.fneg.fabs = fsub float -0.0, %a.fabs
1d019706d866 LLVM10 anatofuz parents: diff changeset	67 %result = call i1 @llvm.amdgcn.class.f32(float %a.fneg.fabs, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	68 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	69 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	70 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	71 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	72
1d019706d866 LLVM10 anatofuz parents: diff changeset	73 ; SI-LABEL: {{^}}test_class_1_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	74 ; SI: s_load_dword [[SA:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0xb
1d019706d866 LLVM10 anatofuz parents: diff changeset	75 ; SI: v_cmp_class_f32_e64 [[COND:s\[[0-9]+:[0-9]+\]]], [[SA]], 1{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	76 ; SI-NEXT: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, [[COND]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	77 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	78 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	79 define amdgpu_kernel void @test_class_1_f32(i32 addrspace(1)* %out, float %a) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	80 %result = call i1 @llvm.amdgcn.class.f32(float %a, i32 1) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	81 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	82 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	83 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	84 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	85
1d019706d866 LLVM10 anatofuz parents: diff changeset	86 ; SI-LABEL: {{^}}test_class_64_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	87 ; SI: s_load_dword [[SA:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0xb
1d019706d866 LLVM10 anatofuz parents: diff changeset	88 ; SI: v_cmp_class_f32_e64 [[COND:s\[[0-9]+:[0-9]+\]]], [[SA]], 64{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	89 ; SI-NEXT: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, [[COND]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	90 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	91 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	92 define amdgpu_kernel void @test_class_64_f32(i32 addrspace(1)* %out, float %a) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	93 %result = call i1 @llvm.amdgcn.class.f32(float %a, i32 64) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	94 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	95 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	96 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	97 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	98
1d019706d866 LLVM10 anatofuz parents: diff changeset	99 ; Set all 10 bits of mask
1d019706d866 LLVM10 anatofuz parents: diff changeset	100 ; SI-LABEL: {{^}}test_class_full_mask_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	101 ; SI: s_load_dword [[SA:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0xb
1d019706d866 LLVM10 anatofuz parents: diff changeset	102 ; SI: v_mov_b32_e32 [[MASK:v[0-9]+]], 0x3ff{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	103 ; SI: v_cmp_class_f32_e32 vcc, [[SA]], [[MASK]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	104 ; SI-NEXT: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, vcc
1d019706d866 LLVM10 anatofuz parents: diff changeset	105 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	106 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	107 define amdgpu_kernel void @test_class_full_mask_f32(i32 addrspace(1)* %out, float %a) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	108 %result = call i1 @llvm.amdgcn.class.f32(float %a, i32 1023) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	109 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	110 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	111 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	112 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	113
1d019706d866 LLVM10 anatofuz parents: diff changeset	114 ; SI-LABEL: {{^}}test_class_9bit_mask_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	115 ; SI: s_load_dword [[SA:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0xb
1d019706d866 LLVM10 anatofuz parents: diff changeset	116 ; SI: v_mov_b32_e32 [[MASK:v[0-9]+]], 0x1ff{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	117 ; SI: v_cmp_class_f32_e32 vcc, [[SA]], [[MASK]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	118 ; SI-NEXT: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, vcc
1d019706d866 LLVM10 anatofuz parents: diff changeset	119 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	120 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	121 define amdgpu_kernel void @test_class_9bit_mask_f32(i32 addrspace(1)* %out, float %a) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	122 %result = call i1 @llvm.amdgcn.class.f32(float %a, i32 511) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	123 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	124 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	125 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	126 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	127
1d019706d866 LLVM10 anatofuz parents: diff changeset	128 ; SI-LABEL: {{^}}v_test_class_full_mask_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	129 ; SI-DAG: buffer_load_dword [[VA:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	130 ; SI-DAG: s_movk_i32 [[MASK:s[0-9]+]], 0x1ff{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	131 ; SI: v_cmp_class_f32_e64 s[{{[0-9]}}:{{[0-9]}}], [[VA]], [[MASK]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	132 ; SI-NEXT: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, s[{{[0-9]}}:{{[0-9]}}]
1d019706d866 LLVM10 anatofuz parents: diff changeset	133 ; SI: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	134 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	135 define amdgpu_kernel void @v_test_class_full_mask_f32(i32 addrspace(1)* %out, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	136 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	137 %gep.in = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	138 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	139 %a = load float, float addrspace(1)* %gep.in
1d019706d866 LLVM10 anatofuz parents: diff changeset	140
1d019706d866 LLVM10 anatofuz parents: diff changeset	141 %result = call i1 @llvm.amdgcn.class.f32(float %a, i32 511) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	142 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	143 store i32 %sext, i32 addrspace(1)* %gep.out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	144 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	145 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	146
1d019706d866 LLVM10 anatofuz parents: diff changeset	147 ; SI-LABEL: {{^}}test_class_inline_imm_constant_dynamic_mask_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	148 ; SI-DAG: buffer_load_dword [[VB:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	149 ; SI: v_cmp_class_f32_e32 vcc, 1.0, [[VB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	150 ; SI-NEXT: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, vcc
1d019706d866 LLVM10 anatofuz parents: diff changeset	151 ; SI: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	152 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	153 define amdgpu_kernel void @test_class_inline_imm_constant_dynamic_mask_f32(i32 addrspace(1)* %out, i32 addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	154 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	155 %gep.in = getelementptr i32, i32 addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	156 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	157 %b = load i32, i32 addrspace(1)* %gep.in
1d019706d866 LLVM10 anatofuz parents: diff changeset	158
1d019706d866 LLVM10 anatofuz parents: diff changeset	159 %result = call i1 @llvm.amdgcn.class.f32(float 1.0, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	160 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	161 store i32 %sext, i32 addrspace(1)* %gep.out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	162 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	163 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	164
1d019706d866 LLVM10 anatofuz parents: diff changeset	165 ; FIXME: Why isn't this using a literal constant operand?
1d019706d866 LLVM10 anatofuz parents: diff changeset	166 ; SI-LABEL: {{^}}test_class_lit_constant_dynamic_mask_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	167 ; SI-DAG: buffer_load_dword [[VB:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	168 ; SI-DAG: s_mov_b32 [[VK:s[0-9]+]], 0x44800000
1d019706d866 LLVM10 anatofuz parents: diff changeset	169 ; SI: v_cmp_class_f32_e32 vcc, [[VK]], [[VB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	170 ; SI-NEXT: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, vcc
1d019706d866 LLVM10 anatofuz parents: diff changeset	171 ; SI: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	172 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	173 define amdgpu_kernel void @test_class_lit_constant_dynamic_mask_f32(i32 addrspace(1)* %out, i32 addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	174 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	175 %gep.in = getelementptr i32, i32 addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	176 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	177 %b = load i32, i32 addrspace(1)* %gep.in
1d019706d866 LLVM10 anatofuz parents: diff changeset	178
1d019706d866 LLVM10 anatofuz parents: diff changeset	179 %result = call i1 @llvm.amdgcn.class.f32(float 1024.0, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	180 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	181 store i32 %sext, i32 addrspace(1)* %gep.out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	182 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	183 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	184
1d019706d866 LLVM10 anatofuz parents: diff changeset	185 ; SI-LABEL: {{^}}test_class_f64:
1d019706d866 LLVM10 anatofuz parents: diff changeset	186 ; SI-DAG: s_load_dwordx2 [[SA:s\[[0-9]+:[0-9]+\]]], s{{\[[0-9]+:[0-9]+\]}}, 0x13
1d019706d866 LLVM10 anatofuz parents: diff changeset	187 ; SI-DAG: s_load_dword [[SB:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x1d
1d019706d866 LLVM10 anatofuz parents: diff changeset	188 ; SI-DAG: v_mov_b32_e32 [[VB:v[0-9]+]], [[SB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	189 ; SI: v_cmp_class_f64_e32 vcc, [[SA]], [[VB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	190 ; SI: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, vcc
1d019706d866 LLVM10 anatofuz parents: diff changeset	191 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	192 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	193 define amdgpu_kernel void @test_class_f64(i32 addrspace(1)* %out, [8 x i32], double %a, [8 x i32], i32 %b) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	194 %result = call i1 @llvm.amdgcn.class.f64(double %a, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	195 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	196 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	197 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	198 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	199
1d019706d866 LLVM10 anatofuz parents: diff changeset	200 ; SI-LABEL: {{^}}test_class_fabs_f64:
1d019706d866 LLVM10 anatofuz parents: diff changeset	201 ; SI-DAG: s_load_dwordx2 [[SA:s\[[0-9]+:[0-9]+\]]], s{{\[[0-9]+:[0-9]+\]}}, 0x13
1d019706d866 LLVM10 anatofuz parents: diff changeset	202 ; SI-DAG: s_load_dword [[SB:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x1d
1d019706d866 LLVM10 anatofuz parents: diff changeset	203 ; SI-DAG: v_mov_b32_e32 [[VB:v[0-9]+]], [[SB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	204 ; SI: v_cmp_class_f64_e64 [[CMP:s\[[0-9]+:[0-9]+\]]], \|[[SA]]\|, [[VB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	205 ; SI: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, [[CMP]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	206 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	207 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	208 define amdgpu_kernel void @test_class_fabs_f64(i32 addrspace(1)* %out, [8 x i32], double %a, [8 x i32], i32 %b) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	209 %a.fabs = call double @llvm.fabs.f64(double %a) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	210 %result = call i1 @llvm.amdgcn.class.f64(double %a.fabs, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	211 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	212 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	213 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	214 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	215
1d019706d866 LLVM10 anatofuz parents: diff changeset	216 ; SI-LABEL: {{^}}test_class_fneg_f64:
1d019706d866 LLVM10 anatofuz parents: diff changeset	217 ; SI-DAG: s_load_dwordx2 [[SA:s\[[0-9]+:[0-9]+\]]], s{{\[[0-9]+:[0-9]+\]}}, 0x13
1d019706d866 LLVM10 anatofuz parents: diff changeset	218 ; SI-DAG: s_load_dword [[SB:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x1d
1d019706d866 LLVM10 anatofuz parents: diff changeset	219 ; SI-DAG: v_mov_b32_e32 [[VB:v[0-9]+]], [[SB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	220 ; SI: v_cmp_class_f64_e64 [[CMP:s\[[0-9]+:[0-9]+\]]], -[[SA]], [[VB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	221 ; SI: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, [[CMP]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	222 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	223 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	224 define amdgpu_kernel void @test_class_fneg_f64(i32 addrspace(1)* %out, [8 x i32], double %a, [8 x i32], i32 %b) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	225 %a.fneg = fsub double -0.0, %a
1d019706d866 LLVM10 anatofuz parents: diff changeset	226 %result = call i1 @llvm.amdgcn.class.f64(double %a.fneg, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	227 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	228 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	229 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	230 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	231
1d019706d866 LLVM10 anatofuz parents: diff changeset	232 ; SI-LABEL: {{^}}test_class_fneg_fabs_f64:
1d019706d866 LLVM10 anatofuz parents: diff changeset	233 ; SI-DAG: s_load_dwordx2 [[SA:s\[[0-9]+:[0-9]+\]]], s{{\[[0-9]+:[0-9]+\]}}, 0x13
1d019706d866 LLVM10 anatofuz parents: diff changeset	234 ; SI-DAG: s_load_dword [[SB:s[0-9]+]], s{{\[[0-9]+:[0-9]+\]}}, 0x1d
1d019706d866 LLVM10 anatofuz parents: diff changeset	235 ; SI-DAG: v_mov_b32_e32 [[VB:v[0-9]+]], [[SB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	236 ; SI: v_cmp_class_f64_e64 [[CMP:s\[[0-9]+:[0-9]+\]]], -\|[[SA]]\|, [[VB]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	237 ; SI: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, [[CMP]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	238 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	239 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	240 define amdgpu_kernel void @test_class_fneg_fabs_f64(i32 addrspace(1)* %out, [8 x i32], double %a, [8 x i32], i32 %b) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	241 %a.fabs = call double @llvm.fabs.f64(double %a) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	242 %a.fneg.fabs = fsub double -0.0, %a.fabs
1d019706d866 LLVM10 anatofuz parents: diff changeset	243 %result = call i1 @llvm.amdgcn.class.f64(double %a.fneg.fabs, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	244 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	245 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	246 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	247 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	248
1d019706d866 LLVM10 anatofuz parents: diff changeset	249 ; SI-LABEL: {{^}}test_class_1_f64:
1d019706d866 LLVM10 anatofuz parents: diff changeset	250 ; SI: v_cmp_class_f64_e64 {{s\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 1{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	251 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	252 define amdgpu_kernel void @test_class_1_f64(i32 addrspace(1)* %out, double %a) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	253 %result = call i1 @llvm.amdgcn.class.f64(double %a, i32 1) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	254 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	255 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	256 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	257 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	258
1d019706d866 LLVM10 anatofuz parents: diff changeset	259 ; SI-LABEL: {{^}}test_class_64_f64:
1d019706d866 LLVM10 anatofuz parents: diff changeset	260 ; SI: v_cmp_class_f64_e64 {{s\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 64{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	261 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	262 define amdgpu_kernel void @test_class_64_f64(i32 addrspace(1)* %out, double %a) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	263 %result = call i1 @llvm.amdgcn.class.f64(double %a, i32 64) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	264 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	265 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	266 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	267 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	268
1d019706d866 LLVM10 anatofuz parents: diff changeset	269 ; Set all 9 bits of mask
1d019706d866 LLVM10 anatofuz parents: diff changeset	270 ; SI-LABEL: {{^}}test_class_full_mask_f64:
1d019706d866 LLVM10 anatofuz parents: diff changeset	271 ; SI-DAG: s_load_dwordx2 [[SA:s\[[0-9]+:[0-9]+\]]], s{{\[[0-9]+:[0-9]+\]}}, 0x13
1d019706d866 LLVM10 anatofuz parents: diff changeset	272 ; SI: v_mov_b32_e32 [[MASK:v[0-9]+]], 0x1ff{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	273 ; SI: v_cmp_class_f64_e32 vcc, [[SA]], [[MASK]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	274 ; SI-NOT: vcc
1d019706d866 LLVM10 anatofuz parents: diff changeset	275 ; SI: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, vcc
1d019706d866 LLVM10 anatofuz parents: diff changeset	276 ; SI-NEXT: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	277 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	278 define amdgpu_kernel void @test_class_full_mask_f64(i32 addrspace(1)* %out, [8 x i32], double %a) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	279 %result = call i1 @llvm.amdgcn.class.f64(double %a, i32 511) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	280 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	281 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	282 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	283 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	284
1d019706d866 LLVM10 anatofuz parents: diff changeset	285 ; SI-LABEL: {{^}}v_test_class_full_mask_f64:
1d019706d866 LLVM10 anatofuz parents: diff changeset	286 ; SI-DAG: buffer_load_dwordx2 [[VA:v\[[0-9]+:[0-9]+\]]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	287 ; SI-DAG: s_movk_i32 [[MASK:s[0-9]+]], 0x1ff{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	288 ; SI: v_cmp_class_f64_e64 s[{{[0-9]}}:{{[0-9]}}], [[VA]], [[MASK]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	289 ; SI-NOT: vcc
1d019706d866 LLVM10 anatofuz parents: diff changeset	290 ; SI: v_cndmask_b32_e64 [[RESULT:v[0-9]+]], 0, -1, s[{{[0-9]}}:{{[0-9]}}]
1d019706d866 LLVM10 anatofuz parents: diff changeset	291 ; SI: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	292 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	293 define amdgpu_kernel void @v_test_class_full_mask_f64(i32 addrspace(1)* %out, double addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	294 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	295 %gep.in = getelementptr double, double addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	296 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	297 %a = load double, double addrspace(1)* %in
1d019706d866 LLVM10 anatofuz parents: diff changeset	298
1d019706d866 LLVM10 anatofuz parents: diff changeset	299 %result = call i1 @llvm.amdgcn.class.f64(double %a, i32 511) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	300 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	301 store i32 %sext, i32 addrspace(1)* %gep.out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	302 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	303 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	304
1d019706d866 LLVM10 anatofuz parents: diff changeset	305 ; SI-LABEL: {{^}}test_class_inline_imm_constant_dynamic_mask_f64:
1d019706d866 LLVM10 anatofuz parents: diff changeset	306 ; XSI: v_cmp_class_f64_e32 vcc, 1.0,
1d019706d866 LLVM10 anatofuz parents: diff changeset	307 ; SI: v_cmp_class_f64_e32 vcc,
1d019706d866 LLVM10 anatofuz parents: diff changeset	308 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	309 define amdgpu_kernel void @test_class_inline_imm_constant_dynamic_mask_f64(i32 addrspace(1)* %out, i32 addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	310 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	311 %gep.in = getelementptr i32, i32 addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	312 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	313 %b = load i32, i32 addrspace(1)* %gep.in
1d019706d866 LLVM10 anatofuz parents: diff changeset	314
1d019706d866 LLVM10 anatofuz parents: diff changeset	315 %result = call i1 @llvm.amdgcn.class.f64(double 1.0, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	316 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	317 store i32 %sext, i32 addrspace(1)* %gep.out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	318 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	319 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	320
1d019706d866 LLVM10 anatofuz parents: diff changeset	321 ; SI-LABEL: {{^}}test_class_lit_constant_dynamic_mask_f64:
1d019706d866 LLVM10 anatofuz parents: diff changeset	322 ; SI: v_cmp_class_f64_e32 vcc, s{{\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	323 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	324 define amdgpu_kernel void @test_class_lit_constant_dynamic_mask_f64(i32 addrspace(1)* %out, i32 addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	325 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	326 %gep.in = getelementptr i32, i32 addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	327 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	328 %b = load i32, i32 addrspace(1)* %gep.in
1d019706d866 LLVM10 anatofuz parents: diff changeset	329
1d019706d866 LLVM10 anatofuz parents: diff changeset	330 %result = call i1 @llvm.amdgcn.class.f64(double 1024.0, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	331 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	332 store i32 %sext, i32 addrspace(1)* %gep.out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	333 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	334 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	335
1d019706d866 LLVM10 anatofuz parents: diff changeset	336 ; SI-LABEL: {{^}}test_fold_or_class_f32_0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	337 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	338 ; SI: v_cmp_class_f32_e64 {{s\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, 3{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	339 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	340 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	341 define amdgpu_kernel void @test_fold_or_class_f32_0(i32 addrspace(1)* %out, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	342 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	343 %gep.in = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	344 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	345 %a = load float, float addrspace(1)* %gep.in
1d019706d866 LLVM10 anatofuz parents: diff changeset	346
1d019706d866 LLVM10 anatofuz parents: diff changeset	347 %class0 = call i1 @llvm.amdgcn.class.f32(float %a, i32 1) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	348 %class1 = call i1 @llvm.amdgcn.class.f32(float %a, i32 3) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	349 %or = or i1 %class0, %class1
1d019706d866 LLVM10 anatofuz parents: diff changeset	350
1d019706d866 LLVM10 anatofuz parents: diff changeset	351 %sext = sext i1 %or to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	352 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	353 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	354 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	355
1d019706d866 LLVM10 anatofuz parents: diff changeset	356 ; SI-LABEL: {{^}}test_fold_or3_class_f32_0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	357 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	358 ; SI: v_cmp_class_f32_e64 s{{\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, 7{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	359 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	360 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	361 define amdgpu_kernel void @test_fold_or3_class_f32_0(i32 addrspace(1)* %out, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	362 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	363 %gep.in = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	364 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	365 %a = load float, float addrspace(1)* %gep.in
1d019706d866 LLVM10 anatofuz parents: diff changeset	366
1d019706d866 LLVM10 anatofuz parents: diff changeset	367 %class0 = call i1 @llvm.amdgcn.class.f32(float %a, i32 1) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	368 %class1 = call i1 @llvm.amdgcn.class.f32(float %a, i32 2) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	369 %class2 = call i1 @llvm.amdgcn.class.f32(float %a, i32 4) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	370 %or.0 = or i1 %class0, %class1
1d019706d866 LLVM10 anatofuz parents: diff changeset	371 %or.1 = or i1 %or.0, %class2
1d019706d866 LLVM10 anatofuz parents: diff changeset	372
1d019706d866 LLVM10 anatofuz parents: diff changeset	373 %sext = sext i1 %or.1 to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	374 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	375 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	376 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	377
1d019706d866 LLVM10 anatofuz parents: diff changeset	378 ; SI-LABEL: {{^}}test_fold_or_all_tests_class_f32_0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	379 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	380 ; SI: s_movk_i32 [[MASK:s[0-9]+]], 0x3ff{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	381 ; SI: v_cmp_class_f32_e64 s[0:1], v{{[0-9]+}}, [[MASK]]{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	382 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	383 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	384 define amdgpu_kernel void @test_fold_or_all_tests_class_f32_0(i32 addrspace(1)* %out, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	385 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	386 %gep.in = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	387 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	388 %a = load float, float addrspace(1)* %gep.in
1d019706d866 LLVM10 anatofuz parents: diff changeset	389
1d019706d866 LLVM10 anatofuz parents: diff changeset	390 %class0 = call i1 @llvm.amdgcn.class.f32(float %a, i32 1) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	391 %class1 = call i1 @llvm.amdgcn.class.f32(float %a, i32 2) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	392 %class2 = call i1 @llvm.amdgcn.class.f32(float %a, i32 4) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	393 %class3 = call i1 @llvm.amdgcn.class.f32(float %a, i32 8) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	394 %class4 = call i1 @llvm.amdgcn.class.f32(float %a, i32 16) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	395 %class5 = call i1 @llvm.amdgcn.class.f32(float %a, i32 32) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	396 %class6 = call i1 @llvm.amdgcn.class.f32(float %a, i32 64) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	397 %class7 = call i1 @llvm.amdgcn.class.f32(float %a, i32 128) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	398 %class8 = call i1 @llvm.amdgcn.class.f32(float %a, i32 256) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	399 %class9 = call i1 @llvm.amdgcn.class.f32(float %a, i32 512) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	400 %or.0 = or i1 %class0, %class1
1d019706d866 LLVM10 anatofuz parents: diff changeset	401 %or.1 = or i1 %or.0, %class2
1d019706d866 LLVM10 anatofuz parents: diff changeset	402 %or.2 = or i1 %or.1, %class3
1d019706d866 LLVM10 anatofuz parents: diff changeset	403 %or.3 = or i1 %or.2, %class4
1d019706d866 LLVM10 anatofuz parents: diff changeset	404 %or.4 = or i1 %or.3, %class5
1d019706d866 LLVM10 anatofuz parents: diff changeset	405 %or.5 = or i1 %or.4, %class6
1d019706d866 LLVM10 anatofuz parents: diff changeset	406 %or.6 = or i1 %or.5, %class7
1d019706d866 LLVM10 anatofuz parents: diff changeset	407 %or.7 = or i1 %or.6, %class8
1d019706d866 LLVM10 anatofuz parents: diff changeset	408 %or.8 = or i1 %or.7, %class9
1d019706d866 LLVM10 anatofuz parents: diff changeset	409 %sext = sext i1 %or.8 to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	410 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	411 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	412 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	413
1d019706d866 LLVM10 anatofuz parents: diff changeset	414 ; SI-LABEL: {{^}}test_fold_or_class_f32_1:
1d019706d866 LLVM10 anatofuz parents: diff changeset	415 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	416 ; SI: v_cmp_class_f32_e64 {{s\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, 12{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	417 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	418 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	419 define amdgpu_kernel void @test_fold_or_class_f32_1(i32 addrspace(1)* %out, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	420 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	421 %gep.in = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	422 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	423 %a = load float, float addrspace(1)* %gep.in
1d019706d866 LLVM10 anatofuz parents: diff changeset	424
1d019706d866 LLVM10 anatofuz parents: diff changeset	425 %class0 = call i1 @llvm.amdgcn.class.f32(float %a, i32 4) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	426 %class1 = call i1 @llvm.amdgcn.class.f32(float %a, i32 8) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	427 %or = or i1 %class0, %class1
1d019706d866 LLVM10 anatofuz parents: diff changeset	428
1d019706d866 LLVM10 anatofuz parents: diff changeset	429 %sext = sext i1 %or to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	430 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	431 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	432 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	433
1d019706d866 LLVM10 anatofuz parents: diff changeset	434 ; SI-LABEL: {{^}}test_fold_or_class_f32_2:
1d019706d866 LLVM10 anatofuz parents: diff changeset	435 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	436 ; SI: v_cmp_class_f32_e64 {{s\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, 7{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	437 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	438 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	439 define amdgpu_kernel void @test_fold_or_class_f32_2(i32 addrspace(1)* %out, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	440 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	441 %gep.in = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	442 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	443 %a = load float, float addrspace(1)* %gep.in
1d019706d866 LLVM10 anatofuz parents: diff changeset	444
1d019706d866 LLVM10 anatofuz parents: diff changeset	445 %class0 = call i1 @llvm.amdgcn.class.f32(float %a, i32 7) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	446 %class1 = call i1 @llvm.amdgcn.class.f32(float %a, i32 7) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	447 %or = or i1 %class0, %class1
1d019706d866 LLVM10 anatofuz parents: diff changeset	448
1d019706d866 LLVM10 anatofuz parents: diff changeset	449 %sext = sext i1 %or to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	450 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	451 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	452 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	453
1d019706d866 LLVM10 anatofuz parents: diff changeset	454 ; SI-LABEL: {{^}}test_no_fold_or_class_f32_0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	455 ; SI-DAG: v_cmp_class_f32_e64 {{s\[[0-9]+:[0-9]+\]}}, v{{[0-9]+}}, 4{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	456 ; SI-DAG: v_cmp_class_f32_e64 {{s\[[0-9]+:[0-9]+\]}}, s{{[0-9]+}}, 8{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	457 ; SI: s_or_b64
1d019706d866 LLVM10 anatofuz parents: diff changeset	458 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	459 define amdgpu_kernel void @test_no_fold_or_class_f32_0(i32 addrspace(1)* %out, float addrspace(1)* %in, float %b) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	460 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	461 %gep.in = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	462 %gep.out = getelementptr i32, i32 addrspace(1)* %out, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	463 %a = load float, float addrspace(1)* %gep.in
1d019706d866 LLVM10 anatofuz parents: diff changeset	464
1d019706d866 LLVM10 anatofuz parents: diff changeset	465 %class0 = call i1 @llvm.amdgcn.class.f32(float %a, i32 4) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	466 %class1 = call i1 @llvm.amdgcn.class.f32(float %b, i32 8) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	467 %or = or i1 %class0, %class1
1d019706d866 LLVM10 anatofuz parents: diff changeset	468
1d019706d866 LLVM10 anatofuz parents: diff changeset	469 %sext = sext i1 %or to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	470 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	471 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	472 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	473
1d019706d866 LLVM10 anatofuz parents: diff changeset	474 ; SI-LABEL: {{^}}test_class_0_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	475 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	476 ; SI: v_mov_b32_e32 [[RESULT:v[0-9]+]], 0{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	477 ; SI: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	478 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	479 define amdgpu_kernel void @test_class_0_f32(i32 addrspace(1)* %out, float %a) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	480 %result = call i1 @llvm.amdgcn.class.f32(float %a, i32 0) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	481 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	482 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	483 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	484 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	485
1d019706d866 LLVM10 anatofuz parents: diff changeset	486 ; SI-LABEL: {{^}}test_class_0_f64:
1d019706d866 LLVM10 anatofuz parents: diff changeset	487 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	488 ; SI: v_mov_b32_e32 [[RESULT:v[0-9]+]], 0{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	489 ; SI: buffer_store_dword [[RESULT]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	490 ; SI: s_endpgm
1d019706d866 LLVM10 anatofuz parents: diff changeset	491 define amdgpu_kernel void @test_class_0_f64(i32 addrspace(1)* %out, double %a) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	492 %result = call i1 @llvm.amdgcn.class.f64(double %a, i32 0) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	493 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	494 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	495 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	496 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	497
1d019706d866 LLVM10 anatofuz parents: diff changeset	498 ; FIXME: Why is the extension still here?
1d019706d866 LLVM10 anatofuz parents: diff changeset	499 ; SI-LABEL: {{^}}test_class_undef_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	500 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	501 ; SI: v_cndmask_b32_e64 v{{[0-9]+}}, 0, -1,
1d019706d866 LLVM10 anatofuz parents: diff changeset	502 ; SI: buffer_store_dword
1d019706d866 LLVM10 anatofuz parents: diff changeset	503 define amdgpu_kernel void @test_class_undef_f32(i32 addrspace(1)* %out, float %a, i32 %b) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	504 %result = call i1 @llvm.amdgcn.class.f32(float undef, i32 %b) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	505 %sext = sext i1 %result to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	506 store i32 %sext, i32 addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	507 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	508 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	509
1d019706d866 LLVM10 anatofuz parents: diff changeset	510 ; SI-LABEL: {{^}}test_fold_and_ord:
1d019706d866 LLVM10 anatofuz parents: diff changeset	511 ; SI: s_waitcnt
1d019706d866 LLVM10 anatofuz parents: diff changeset	512 ; SI-NEXT: v_cmp_class_f32_e64 [[COND:s\[[0-9]+:[0-9]+\]]], v0, 32{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	513 ; SI-NEXT: v_cndmask_b32_e64 v0, 0, 1, [[COND]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	514 ; SI-NEXT: s_setpc_b64
1d019706d866 LLVM10 anatofuz parents: diff changeset	515 define i1 @test_fold_and_ord(float %a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	516 %class = call i1 @llvm.amdgcn.class.f32(float %a, i32 35) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	517 %ord = fcmp ord float %a, %a
1d019706d866 LLVM10 anatofuz parents: diff changeset	518 %and = and i1 %ord, %class
1d019706d866 LLVM10 anatofuz parents: diff changeset	519 ret i1 %and
1d019706d866 LLVM10 anatofuz parents: diff changeset	520 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	521
1d019706d866 LLVM10 anatofuz parents: diff changeset	522 ; SI-LABEL: {{^}}test_fold_and_unord:
1d019706d866 LLVM10 anatofuz parents: diff changeset	523 ; SI: s_waitcnt
1d019706d866 LLVM10 anatofuz parents: diff changeset	524 ; SI-NEXT: v_cmp_class_f32_e64 [[COND:s\[[0-9]+:[0-9]+\]]], v0, 3{{$}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	525 ; SI-NEXT: v_cndmask_b32_e64 v0, 0, 1, [[COND]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	526 ; SI-NEXT: s_setpc_b64
1d019706d866 LLVM10 anatofuz parents: diff changeset	527 define i1 @test_fold_and_unord(float %a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	528 %class = call i1 @llvm.amdgcn.class.f32(float %a, i32 35) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	529 %ord = fcmp uno float %a, %a
1d019706d866 LLVM10 anatofuz parents: diff changeset	530 %and = and i1 %ord, %class
1d019706d866 LLVM10 anatofuz parents: diff changeset	531 ret i1 %and
1d019706d866 LLVM10 anatofuz parents: diff changeset	532 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	533
1d019706d866 LLVM10 anatofuz parents: diff changeset	534 ; SI-LABEL: {{^}}test_fold_and_ord_multi_use:
1d019706d866 LLVM10 anatofuz parents: diff changeset	535 ; SI: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	536 ; SI-NOT: v_cmp_class
1d019706d866 LLVM10 anatofuz parents: diff changeset	537 ; SI: v_cmp_o
1d019706d866 LLVM10 anatofuz parents: diff changeset	538 ; SI: s_and_b64
1d019706d866 LLVM10 anatofuz parents: diff changeset	539 define i1 @test_fold_and_ord_multi_use(float %a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	540 %class = call i1 @llvm.amdgcn.class.f32(float %a, i32 35) #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	541 store volatile i1 %class, i1 addrspace(1)* undef
1d019706d866 LLVM10 anatofuz parents: diff changeset	542 %ord = fcmp ord float %a, %a
1d019706d866 LLVM10 anatofuz parents: diff changeset	543 %and = and i1 %ord, %class
1d019706d866 LLVM10 anatofuz parents: diff changeset	544 ret i1 %and
1d019706d866 LLVM10 anatofuz parents: diff changeset	545 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	546
1d019706d866 LLVM10 anatofuz parents: diff changeset	547 attributes #0 = { nounwind }
1d019706d866 LLVM10 anatofuz parents: diff changeset	548 attributes #1 = { nounwind readnone }

Mercurial > hg > CbC > CbC_llvm

annotate llvm/test/CodeGen/AMDGPU/llvm.amdgcn.class.ll @ 206:f17a3b42b08b