CbC/CbC_llvm: llvm/test/CodeGen/AMDGPU/fmax

annotate llvm/test/CodeGen/AMDGPU/fmax_legacy.ll @ 221:79ff65ed7e25

LLVM12 Original

author	Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date	Tue, 15 Jun 2021 19:15:29 +0900
parents	1d019706d866
children	c4bab56944e8

rev	line source
221 79ff65ed7e25 LLVM12 Original Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 150 diff changeset	1 ; RUN: llc -march=amdgcn -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=SI-SAFE,GCN,FUNC %s
79ff65ed7e25 LLVM12 Original Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 150 diff changeset	2 ; RUN: llc -enable-no-nans-fp-math -enable-no-signed-zeros-fp-math -march=amdgcn -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GCN-NONAN,GCN,FUNC %s
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	3
221 79ff65ed7e25 LLVM12 Original Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 150 diff changeset	4 ; RUN: llc -march=amdgcn -mcpu=fiji -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=VI-SAFE,GCN,FUNC %s
79ff65ed7e25 LLVM12 Original Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 150 diff changeset	5 ; RUN: llc -enable-no-nans-fp-math -enable-no-signed-zeros-fp-math -march=amdgcn -mcpu=fiji -verify-machineinstrs < %s \| FileCheck -enable-var-scope -check-prefixes=GCN-NONAN,GCN,FUNC %s
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	6
221 79ff65ed7e25 LLVM12 Original Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 150 diff changeset	7 ; RUN: llc -march=r600 -mcpu=redwood < %s \| FileCheck -enable-var-scope --check-prefixes=EG,FUNC %s
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	8
1d019706d866 LLVM10 anatofuz parents: diff changeset	9 declare i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	10
1d019706d866 LLVM10 anatofuz parents: diff changeset	11 ; FUNC-LABEL: {{^}}test_fmax_legacy_uge_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	12 ; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	13 ; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	14
1d019706d866 LLVM10 anatofuz parents: diff changeset	15 ; SI-SAFE: v_max_legacy_f32_e32 {{v[0-9]+}}, [[B]], [[A]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	16
1d019706d866 LLVM10 anatofuz parents: diff changeset	17 ; VI-SAFE: v_cmp_nlt_f32_e32 vcc, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	18 ; VI-SAFE: v_cndmask_b32_e32 v{{[0-9]+}}, [[B]], [[A]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	19
1d019706d866 LLVM10 anatofuz parents: diff changeset	20 ; GCN-NONAN: v_max_f32_e32 {{v[0-9]+}}, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	21
1d019706d866 LLVM10 anatofuz parents: diff changeset	22 ; EG: MAX
1d019706d866 LLVM10 anatofuz parents: diff changeset	23 define amdgpu_kernel void @test_fmax_legacy_uge_f32(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	24 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	25 %gep.0 = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	26 %gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1
1d019706d866 LLVM10 anatofuz parents: diff changeset	27
1d019706d866 LLVM10 anatofuz parents: diff changeset	28 %a = load volatile float, float addrspace(1)* %gep.0, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	29 %b = load volatile float, float addrspace(1)* %gep.1, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	30
1d019706d866 LLVM10 anatofuz parents: diff changeset	31 %cmp = fcmp uge float %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	32 %val = select i1 %cmp, float %a, float %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	33 store float %val, float addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	34 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	35 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	36
1d019706d866 LLVM10 anatofuz parents: diff changeset	37 ; FUNC-LABEL: {{^}}test_fmax_legacy_uge_f32_nnan_src:
1d019706d866 LLVM10 anatofuz parents: diff changeset	38 ; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	39 ; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	40 ; GCN-DAG: v_add_f32_e32 [[ADD_A:v[0-9]+]], 1.0, [[A]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	41 ; GCN-DAG: v_add_f32_e32 [[ADD_B:v[0-9]+]], 2.0, [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	42
1d019706d866 LLVM10 anatofuz parents: diff changeset	43 ; SI-SAFE: v_max_legacy_f32_e32 {{v[0-9]+}}, [[ADD_B]], [[ADD_A]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	44
1d019706d866 LLVM10 anatofuz parents: diff changeset	45 ; VI-SAFE: v_cmp_nlt_f32_e32 vcc, [[ADD_A]], [[ADD_B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	46 ; VI-SAFE: v_cndmask_b32_e32 v{{[0-9]+}}, [[ADD_B]], [[ADD_A]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	47
1d019706d866 LLVM10 anatofuz parents: diff changeset	48 ; GCN-NONAN: v_max_f32_e32 {{v[0-9]+}}, [[ADD_A]], [[ADD_B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	49
1d019706d866 LLVM10 anatofuz parents: diff changeset	50 ; EG: MAX
1d019706d866 LLVM10 anatofuz parents: diff changeset	51 define amdgpu_kernel void @test_fmax_legacy_uge_f32_nnan_src(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	52 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	53 %gep.0 = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	54 %gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1
1d019706d866 LLVM10 anatofuz parents: diff changeset	55
1d019706d866 LLVM10 anatofuz parents: diff changeset	56 %a = load volatile float, float addrspace(1)* %gep.0, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	57 %b = load volatile float, float addrspace(1)* %gep.1, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	58 %a.nnan = fadd nnan float %a, 1.0
1d019706d866 LLVM10 anatofuz parents: diff changeset	59 %b.nnan = fadd nnan float %b, 2.0
1d019706d866 LLVM10 anatofuz parents: diff changeset	60
1d019706d866 LLVM10 anatofuz parents: diff changeset	61 %cmp = fcmp uge float %a.nnan, %b.nnan
1d019706d866 LLVM10 anatofuz parents: diff changeset	62 %val = select i1 %cmp, float %a.nnan, float %b.nnan
1d019706d866 LLVM10 anatofuz parents: diff changeset	63 store float %val, float addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	64 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	65 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	66
1d019706d866 LLVM10 anatofuz parents: diff changeset	67 ; FUNC-LABEL: {{^}}test_fmax_legacy_oge_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	68 ; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	69 ; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	70
1d019706d866 LLVM10 anatofuz parents: diff changeset	71 ; SI-SAFE: v_max_legacy_f32_e32 {{v[0-9]+}}, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	72
1d019706d866 LLVM10 anatofuz parents: diff changeset	73 ; VI-SAFE: v_cmp_ge_f32_e32 vcc, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	74 ; VI-SAFE: v_cndmask_b32_e32 v{{[0-9]+}}, [[B]], [[A]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	75
1d019706d866 LLVM10 anatofuz parents: diff changeset	76 ; GCN-NONAN: v_max_f32_e32 {{v[0-9]+}}, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	77 ; EG: MAX
1d019706d866 LLVM10 anatofuz parents: diff changeset	78 define amdgpu_kernel void @test_fmax_legacy_oge_f32(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	79 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	80 %gep.0 = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	81 %gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1
1d019706d866 LLVM10 anatofuz parents: diff changeset	82
1d019706d866 LLVM10 anatofuz parents: diff changeset	83 %a = load volatile float, float addrspace(1)* %gep.0, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	84 %b = load volatile float, float addrspace(1)* %gep.1, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	85
1d019706d866 LLVM10 anatofuz parents: diff changeset	86 %cmp = fcmp oge float %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	87 %val = select i1 %cmp, float %a, float %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	88 store float %val, float addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	89 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	90 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	91
1d019706d866 LLVM10 anatofuz parents: diff changeset	92 ; FUNC-LABEL: {{^}}test_fmax_legacy_ugt_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	93 ; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	94 ; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	95
1d019706d866 LLVM10 anatofuz parents: diff changeset	96 ; SI-SAFE: v_max_legacy_f32_e32 {{v[0-9]+}}, [[B]], [[A]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	97
1d019706d866 LLVM10 anatofuz parents: diff changeset	98 ; VI-SAFE: v_cmp_nle_f32_e32 vcc, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	99 ; VI-SAFE: v_cndmask_b32_e32 v{{[0-9]+}}, [[B]], [[A]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	100
1d019706d866 LLVM10 anatofuz parents: diff changeset	101
1d019706d866 LLVM10 anatofuz parents: diff changeset	102 ; GCN-NONAN: v_max_f32_e32 {{v[0-9]+}}, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	103 ; EG: MAX
1d019706d866 LLVM10 anatofuz parents: diff changeset	104 define amdgpu_kernel void @test_fmax_legacy_ugt_f32(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	105 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	106 %gep.0 = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	107 %gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1
1d019706d866 LLVM10 anatofuz parents: diff changeset	108
1d019706d866 LLVM10 anatofuz parents: diff changeset	109 %a = load volatile float, float addrspace(1)* %gep.0, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	110 %b = load volatile float, float addrspace(1)* %gep.1, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	111
1d019706d866 LLVM10 anatofuz parents: diff changeset	112 %cmp = fcmp ugt float %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	113 %val = select i1 %cmp, float %a, float %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	114 store float %val, float addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	115 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	116 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	117
1d019706d866 LLVM10 anatofuz parents: diff changeset	118 ; FUNC-LABEL: {{^}}test_fmax_legacy_ogt_f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	119 ; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	120 ; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	121
1d019706d866 LLVM10 anatofuz parents: diff changeset	122 ; SI-SAFE: v_max_legacy_f32_e32 {{v[0-9]+}}, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	123
1d019706d866 LLVM10 anatofuz parents: diff changeset	124 ; VI-SAFE: v_cmp_gt_f32_e32 vcc, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	125 ; VI-SAFE: v_cndmask_b32_e32 v{{[0-9]+}}, [[B]], [[A]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	126
1d019706d866 LLVM10 anatofuz parents: diff changeset	127 ; GCN-NONAN: v_max_f32_e32 {{v[0-9]+}}, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	128 ; EG: MAX
1d019706d866 LLVM10 anatofuz parents: diff changeset	129 define amdgpu_kernel void @test_fmax_legacy_ogt_f32(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	130 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	131 %gep.0 = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	132 %gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1
1d019706d866 LLVM10 anatofuz parents: diff changeset	133
1d019706d866 LLVM10 anatofuz parents: diff changeset	134 %a = load volatile float, float addrspace(1)* %gep.0, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	135 %b = load volatile float, float addrspace(1)* %gep.1, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	136
1d019706d866 LLVM10 anatofuz parents: diff changeset	137 %cmp = fcmp ogt float %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	138 %val = select i1 %cmp, float %a, float %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	139 store float %val, float addrspace(1)* %out, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	140 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	141 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	142
1d019706d866 LLVM10 anatofuz parents: diff changeset	143 ; FUNC-LABEL: {{^}}test_fmax_legacy_ogt_v1f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	144 ; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	145 ; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	146
1d019706d866 LLVM10 anatofuz parents: diff changeset	147 ; SI-SAFE: v_max_legacy_f32_e32 {{v[0-9]+}}, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	148
1d019706d866 LLVM10 anatofuz parents: diff changeset	149 ; VI-SAFE: v_cmp_gt_f32_e32 vcc, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	150 ; VI-SAFE: v_cndmask_b32_e32 v{{[0-9]+}}, [[B]], [[A]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	151
1d019706d866 LLVM10 anatofuz parents: diff changeset	152
1d019706d866 LLVM10 anatofuz parents: diff changeset	153 ; GCN-NONAN: v_max_f32_e32 {{v[0-9]+}}, [[A]], [[B]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	154 ; EG: MAX
1d019706d866 LLVM10 anatofuz parents: diff changeset	155 define amdgpu_kernel void @test_fmax_legacy_ogt_v1f32(<1 x float> addrspace(1)* %out, <1 x float> addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	156 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	157 %gep.0 = getelementptr <1 x float>, <1 x float> addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	158 %gep.1 = getelementptr <1 x float>, <1 x float> addrspace(1)* %gep.0, i32 1
1d019706d866 LLVM10 anatofuz parents: diff changeset	159
1d019706d866 LLVM10 anatofuz parents: diff changeset	160 %a = load <1 x float>, <1 x float> addrspace(1)* %gep.0
1d019706d866 LLVM10 anatofuz parents: diff changeset	161 %b = load <1 x float>, <1 x float> addrspace(1)* %gep.1
1d019706d866 LLVM10 anatofuz parents: diff changeset	162
1d019706d866 LLVM10 anatofuz parents: diff changeset	163 %cmp = fcmp ogt <1 x float> %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	164 %val = select <1 x i1> %cmp, <1 x float> %a, <1 x float> %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	165 store <1 x float> %val, <1 x float> addrspace(1)* %out
1d019706d866 LLVM10 anatofuz parents: diff changeset	166 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	167 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	168
1d019706d866 LLVM10 anatofuz parents: diff changeset	169 ; FUNC-LABEL: {{^}}test_fmax_legacy_ogt_v3f32:
1d019706d866 LLVM10 anatofuz parents: diff changeset	170 ; SI-SAFE: v_max_legacy_f32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	171 ; SI-SAFE: v_max_legacy_f32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	172 ; SI-SAFE: v_max_legacy_f32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	173
1d019706d866 LLVM10 anatofuz parents: diff changeset	174 ; VI-SAFE: v_cmp_gt_f32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	175 ; VI-SAFE: v_cndmask_b32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	176 ; VI-SAFE: v_cmp_gt_f32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	177 ; VI-SAFE: v_cndmask_b32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	178 ; VI-SAFE: v_cmp_gt_f32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	179 ; VI-SAFE: v_cndmask_b32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	180 ; VI-SAFE-NOT: v_cmp
1d019706d866 LLVM10 anatofuz parents: diff changeset	181 ; VI-SAFE-NOT: v_cndmask
1d019706d866 LLVM10 anatofuz parents: diff changeset	182
1d019706d866 LLVM10 anatofuz parents: diff changeset	183 ; GCN-NONAN: v_max_f32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	184 ; GCN-NONAN: v_max_f32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	185 ; GCN-NONAN: v_max_f32_e32
1d019706d866 LLVM10 anatofuz parents: diff changeset	186
1d019706d866 LLVM10 anatofuz parents: diff changeset	187 ; GCN-NOT: v_max
1d019706d866 LLVM10 anatofuz parents: diff changeset	188 define amdgpu_kernel void @test_fmax_legacy_ogt_v3f32(<3 x float> addrspace(1)* %out, <3 x float> addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	189 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	190 %gep.0 = getelementptr <3 x float>, <3 x float> addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	191 %gep.1 = getelementptr <3 x float>, <3 x float> addrspace(1)* %gep.0, i32 1
1d019706d866 LLVM10 anatofuz parents: diff changeset	192
1d019706d866 LLVM10 anatofuz parents: diff changeset	193 %a = load <3 x float>, <3 x float> addrspace(1)* %gep.0
1d019706d866 LLVM10 anatofuz parents: diff changeset	194 %b = load <3 x float>, <3 x float> addrspace(1)* %gep.1
1d019706d866 LLVM10 anatofuz parents: diff changeset	195
1d019706d866 LLVM10 anatofuz parents: diff changeset	196 %cmp = fcmp ogt <3 x float> %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	197 %val = select <3 x i1> %cmp, <3 x float> %a, <3 x float> %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	198 store <3 x float> %val, <3 x float> addrspace(1)* %out
1d019706d866 LLVM10 anatofuz parents: diff changeset	199 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	200 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	201
1d019706d866 LLVM10 anatofuz parents: diff changeset	202 ; FUNC-LABEL: {{^}}test_fmax_legacy_ogt_f32_multi_use:
1d019706d866 LLVM10 anatofuz parents: diff changeset	203 ; GCN: {{buffer\|flat}}_load_dword [[A:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	204 ; GCN: {{buffer\|flat}}_load_dword [[B:v[0-9]+]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	205 ; GCN-NOT: v_max_
1d019706d866 LLVM10 anatofuz parents: diff changeset	206 ; GCN: v_cmp_gt_f32
1d019706d866 LLVM10 anatofuz parents: diff changeset	207 ; GCN-NEXT: v_cndmask_b32
1d019706d866 LLVM10 anatofuz parents: diff changeset	208 ; GCN-NOT: v_max_
1d019706d866 LLVM10 anatofuz parents: diff changeset	209
1d019706d866 LLVM10 anatofuz parents: diff changeset	210 ; EG: MAX
1d019706d866 LLVM10 anatofuz parents: diff changeset	211 define amdgpu_kernel void @test_fmax_legacy_ogt_f32_multi_use(float addrspace(1)* %out0, i1 addrspace(1)* %out1, float addrspace(1)* %in) #0 {
1d019706d866 LLVM10 anatofuz parents: diff changeset	212 %tid = call i32 @llvm.amdgcn.workitem.id.x() #1
1d019706d866 LLVM10 anatofuz parents: diff changeset	213 %gep.0 = getelementptr float, float addrspace(1)* %in, i32 %tid
1d019706d866 LLVM10 anatofuz parents: diff changeset	214 %gep.1 = getelementptr float, float addrspace(1)* %gep.0, i32 1
1d019706d866 LLVM10 anatofuz parents: diff changeset	215
1d019706d866 LLVM10 anatofuz parents: diff changeset	216 %a = load volatile float, float addrspace(1)* %gep.0, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	217 %b = load volatile float, float addrspace(1)* %gep.1, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	218
1d019706d866 LLVM10 anatofuz parents: diff changeset	219 %cmp = fcmp ogt float %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	220 %val = select i1 %cmp, float %a, float %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	221 store float %val, float addrspace(1)* %out0, align 4
1d019706d866 LLVM10 anatofuz parents: diff changeset	222 store i1 %cmp, i1addrspace(1)* %out1
1d019706d866 LLVM10 anatofuz parents: diff changeset	223 ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	224 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	225
1d019706d866 LLVM10 anatofuz parents: diff changeset	226 attributes #0 = { nounwind }
1d019706d866 LLVM10 anatofuz parents: diff changeset	227 attributes #1 = { nounwind readnone }

Mercurial > hg > CbC > CbC_llvm

annotate llvm/test/CodeGen/AMDGPU/fmax_legacy.ll @ 221:79ff65ed7e25