CbC/CbC_llvm: llvm/test/CodeGen/AMDGPU/add3.ll annotate

annotate llvm/test/CodeGen/AMDGPU/add3.ll @ 266:00f31e85ec16 default tip

Added tag current for changeset 31d058e83c98

author	Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date	Sat, 14 Oct 2023 10:13:55 +0900
parents	1f2b6ac9f198
children

rev	line source
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
1d019706d866 LLVM10 anatofuz parents: diff changeset	2 ; RUN: llc < %s -mtriple=amdgcn-amd-mesa3d -mcpu=fiji -verify-machineinstrs \| FileCheck -check-prefix=VI %s
1d019706d866 LLVM10 anatofuz parents: diff changeset	3 ; RUN: llc < %s -mtriple=amdgcn-amd-mesa3d -mcpu=gfx900 -verify-machineinstrs \| FileCheck -check-prefix=GFX9 %s
1d019706d866 LLVM10 anatofuz parents: diff changeset	4 ; RUN: llc < %s -mtriple=amdgcn-amd-mesa3d -mcpu=gfx1010 -verify-machineinstrs \| FileCheck -check-prefix=GFX10 %s
236 c4bab56944e8 LLVM 16 kono parents: 221 diff changeset	5 ; RUN: llc < %s -mtriple=amdgcn-amd-mesa3d -mcpu=gfx1100 -amdgpu-enable-delay-alu=0 -verify-machineinstrs \| FileCheck -check-prefix=GFX10 %s
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	6
1d019706d866 LLVM10 anatofuz parents: diff changeset	7 ; ===================================================================================
1d019706d866 LLVM10 anatofuz parents: diff changeset	8 ; V_ADD3_U32
1d019706d866 LLVM10 anatofuz parents: diff changeset	9 ; ===================================================================================
1d019706d866 LLVM10 anatofuz parents: diff changeset	10
1d019706d866 LLVM10 anatofuz parents: diff changeset	11 define amdgpu_ps float @add3(i32 %a, i32 %b, i32 %c) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	12 ; VI-LABEL: add3:
1d019706d866 LLVM10 anatofuz parents: diff changeset	13 ; VI: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	14 ; VI-NEXT: v_add_u32_e32 v0, vcc, v0, v1
1d019706d866 LLVM10 anatofuz parents: diff changeset	15 ; VI-NEXT: v_add_u32_e32 v0, vcc, v0, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	16 ; VI-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	17 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	18 ; GFX9-LABEL: add3:
1d019706d866 LLVM10 anatofuz parents: diff changeset	19 ; GFX9: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	20 ; GFX9-NEXT: v_add3_u32 v0, v0, v1, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	21 ; GFX9-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	22 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	23 ; GFX10-LABEL: add3:
1d019706d866 LLVM10 anatofuz parents: diff changeset	24 ; GFX10: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	25 ; GFX10-NEXT: v_add3_u32 v0, v0, v1, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	26 ; GFX10-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	27 %x = add i32 %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	28 %result = add i32 %x, %c
1d019706d866 LLVM10 anatofuz parents: diff changeset	29 %bc = bitcast i32 %result to float
1d019706d866 LLVM10 anatofuz parents: diff changeset	30 ret float %bc
1d019706d866 LLVM10 anatofuz parents: diff changeset	31 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	32
1d019706d866 LLVM10 anatofuz parents: diff changeset	33 ; V_MAD_U32_U24 is given higher priority.
1d019706d866 LLVM10 anatofuz parents: diff changeset	34 define amdgpu_ps float @mad_no_add3(i32 %a, i32 %b, i32 %c, i32 %d, i32 %e) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	35 ; VI-LABEL: mad_no_add3:
1d019706d866 LLVM10 anatofuz parents: diff changeset	36 ; VI: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	37 ; VI-NEXT: v_mad_u32_u24 v0, v0, v1, v4
1d019706d866 LLVM10 anatofuz parents: diff changeset	38 ; VI-NEXT: v_mad_u32_u24 v0, v2, v3, v0
1d019706d866 LLVM10 anatofuz parents: diff changeset	39 ; VI-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	40 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	41 ; GFX9-LABEL: mad_no_add3:
1d019706d866 LLVM10 anatofuz parents: diff changeset	42 ; GFX9: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	43 ; GFX9-NEXT: v_mad_u32_u24 v0, v0, v1, v4
1d019706d866 LLVM10 anatofuz parents: diff changeset	44 ; GFX9-NEXT: v_mad_u32_u24 v0, v2, v3, v0
1d019706d866 LLVM10 anatofuz parents: diff changeset	45 ; GFX9-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	46 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	47 ; GFX10-LABEL: mad_no_add3:
1d019706d866 LLVM10 anatofuz parents: diff changeset	48 ; GFX10: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	49 ; GFX10-NEXT: v_mad_u32_u24 v0, v0, v1, v4
1d019706d866 LLVM10 anatofuz parents: diff changeset	50 ; GFX10-NEXT: v_mad_u32_u24 v0, v2, v3, v0
1d019706d866 LLVM10 anatofuz parents: diff changeset	51 ; GFX10-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	52 %a0 = shl i32 %a, 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	53 %a1 = lshr i32 %a0, 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	54 %b0 = shl i32 %b, 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	55 %b1 = lshr i32 %b0, 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	56 %mul1 = mul i32 %a1, %b1
1d019706d866 LLVM10 anatofuz parents: diff changeset	57
1d019706d866 LLVM10 anatofuz parents: diff changeset	58 %c0 = shl i32 %c, 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	59 %c1 = lshr i32 %c0, 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	60 %d0 = shl i32 %d, 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	61 %d1 = lshr i32 %d0, 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	62 %mul2 = mul i32 %c1, %d1
1d019706d866 LLVM10 anatofuz parents: diff changeset	63
1d019706d866 LLVM10 anatofuz parents: diff changeset	64 %add0 = add i32 %e, %mul1
1d019706d866 LLVM10 anatofuz parents: diff changeset	65 %add1 = add i32 %mul2, %add0
1d019706d866 LLVM10 anatofuz parents: diff changeset	66
1d019706d866 LLVM10 anatofuz parents: diff changeset	67 %bc = bitcast i32 %add1 to float
1d019706d866 LLVM10 anatofuz parents: diff changeset	68 ret float %bc
1d019706d866 LLVM10 anatofuz parents: diff changeset	69 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	70
1d019706d866 LLVM10 anatofuz parents: diff changeset	71 ; ThreeOp instruction variant not used due to Constant Bus Limitations
1d019706d866 LLVM10 anatofuz parents: diff changeset	72 ; TODO: with reassociation it is possible to replace a v_add_u32_e32 with a s_add_i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	73 define amdgpu_ps float @add3_vgpr_b(i32 inreg %a, i32 %b, i32 inreg %c) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	74 ; VI-LABEL: add3_vgpr_b:
1d019706d866 LLVM10 anatofuz parents: diff changeset	75 ; VI: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	76 ; VI-NEXT: s_add_i32 s3, s3, s2
1d019706d866 LLVM10 anatofuz parents: diff changeset	77 ; VI-NEXT: v_add_u32_e32 v0, vcc, s3, v0
1d019706d866 LLVM10 anatofuz parents: diff changeset	78 ; VI-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	79 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	80 ; GFX9-LABEL: add3_vgpr_b:
1d019706d866 LLVM10 anatofuz parents: diff changeset	81 ; GFX9: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	82 ; GFX9-NEXT: s_add_i32 s3, s3, s2
1d019706d866 LLVM10 anatofuz parents: diff changeset	83 ; GFX9-NEXT: v_add_u32_e32 v0, s3, v0
1d019706d866 LLVM10 anatofuz parents: diff changeset	84 ; GFX9-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	85 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	86 ; GFX10-LABEL: add3_vgpr_b:
1d019706d866 LLVM10 anatofuz parents: diff changeset	87 ; GFX10: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	88 ; GFX10-NEXT: v_add3_u32 v0, s3, s2, v0
1d019706d866 LLVM10 anatofuz parents: diff changeset	89 ; GFX10-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	90 %x = add i32 %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	91 %result = add i32 %x, %c
1d019706d866 LLVM10 anatofuz parents: diff changeset	92 %bc = bitcast i32 %result to float
1d019706d866 LLVM10 anatofuz parents: diff changeset	93 ret float %bc
1d019706d866 LLVM10 anatofuz parents: diff changeset	94 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	95
1d019706d866 LLVM10 anatofuz parents: diff changeset	96 define amdgpu_ps float @add3_vgpr_all2(i32 %a, i32 %b, i32 %c) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	97 ; VI-LABEL: add3_vgpr_all2:
1d019706d866 LLVM10 anatofuz parents: diff changeset	98 ; VI: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	99 ; VI-NEXT: v_add_u32_e32 v1, vcc, v1, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	100 ; VI-NEXT: v_add_u32_e32 v0, vcc, v0, v1
1d019706d866 LLVM10 anatofuz parents: diff changeset	101 ; VI-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	102 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	103 ; GFX9-LABEL: add3_vgpr_all2:
1d019706d866 LLVM10 anatofuz parents: diff changeset	104 ; GFX9: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	105 ; GFX9-NEXT: v_add3_u32 v0, v1, v2, v0
1d019706d866 LLVM10 anatofuz parents: diff changeset	106 ; GFX9-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	107 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	108 ; GFX10-LABEL: add3_vgpr_all2:
1d019706d866 LLVM10 anatofuz parents: diff changeset	109 ; GFX10: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	110 ; GFX10-NEXT: v_add3_u32 v0, v1, v2, v0
1d019706d866 LLVM10 anatofuz parents: diff changeset	111 ; GFX10-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	112 %x = add i32 %b, %c
1d019706d866 LLVM10 anatofuz parents: diff changeset	113 %result = add i32 %a, %x
1d019706d866 LLVM10 anatofuz parents: diff changeset	114 %bc = bitcast i32 %result to float
1d019706d866 LLVM10 anatofuz parents: diff changeset	115 ret float %bc
1d019706d866 LLVM10 anatofuz parents: diff changeset	116 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	117
1d019706d866 LLVM10 anatofuz parents: diff changeset	118 define amdgpu_ps float @add3_vgpr_bc(i32 inreg %a, i32 %b, i32 %c) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	119 ; VI-LABEL: add3_vgpr_bc:
1d019706d866 LLVM10 anatofuz parents: diff changeset	120 ; VI: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	121 ; VI-NEXT: v_add_u32_e32 v0, vcc, s2, v0
1d019706d866 LLVM10 anatofuz parents: diff changeset	122 ; VI-NEXT: v_add_u32_e32 v0, vcc, v0, v1
1d019706d866 LLVM10 anatofuz parents: diff changeset	123 ; VI-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	124 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	125 ; GFX9-LABEL: add3_vgpr_bc:
1d019706d866 LLVM10 anatofuz parents: diff changeset	126 ; GFX9: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	127 ; GFX9-NEXT: v_add3_u32 v0, s2, v0, v1
1d019706d866 LLVM10 anatofuz parents: diff changeset	128 ; GFX9-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	129 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	130 ; GFX10-LABEL: add3_vgpr_bc:
1d019706d866 LLVM10 anatofuz parents: diff changeset	131 ; GFX10: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	132 ; GFX10-NEXT: v_add3_u32 v0, s2, v0, v1
1d019706d866 LLVM10 anatofuz parents: diff changeset	133 ; GFX10-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	134 %x = add i32 %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	135 %result = add i32 %x, %c
1d019706d866 LLVM10 anatofuz parents: diff changeset	136 %bc = bitcast i32 %result to float
1d019706d866 LLVM10 anatofuz parents: diff changeset	137 ret float %bc
1d019706d866 LLVM10 anatofuz parents: diff changeset	138 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	139
1d019706d866 LLVM10 anatofuz parents: diff changeset	140 define amdgpu_ps float @add3_vgpr_const(i32 %a, i32 %b) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	141 ; VI-LABEL: add3_vgpr_const:
1d019706d866 LLVM10 anatofuz parents: diff changeset	142 ; VI: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	143 ; VI-NEXT: v_add_u32_e32 v0, vcc, v0, v1
1d019706d866 LLVM10 anatofuz parents: diff changeset	144 ; VI-NEXT: v_add_u32_e32 v0, vcc, 16, v0
1d019706d866 LLVM10 anatofuz parents: diff changeset	145 ; VI-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	146 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	147 ; GFX9-LABEL: add3_vgpr_const:
1d019706d866 LLVM10 anatofuz parents: diff changeset	148 ; GFX9: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	149 ; GFX9-NEXT: v_add3_u32 v0, v0, v1, 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	150 ; GFX9-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	151 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	152 ; GFX10-LABEL: add3_vgpr_const:
1d019706d866 LLVM10 anatofuz parents: diff changeset	153 ; GFX10: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	154 ; GFX10-NEXT: v_add3_u32 v0, v0, v1, 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	155 ; GFX10-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	156 %x = add i32 %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	157 %result = add i32 %x, 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	158 %bc = bitcast i32 %result to float
1d019706d866 LLVM10 anatofuz parents: diff changeset	159 ret float %bc
1d019706d866 LLVM10 anatofuz parents: diff changeset	160 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	161
1d019706d866 LLVM10 anatofuz parents: diff changeset	162 define amdgpu_ps <2 x float> @add3_multiuse_outer(i32 %a, i32 %b, i32 %c, i32 %x) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	163 ; VI-LABEL: add3_multiuse_outer:
1d019706d866 LLVM10 anatofuz parents: diff changeset	164 ; VI: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	165 ; VI-NEXT: v_add_u32_e32 v0, vcc, v0, v1
1d019706d866 LLVM10 anatofuz parents: diff changeset	166 ; VI-NEXT: v_add_u32_e32 v0, vcc, v0, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	167 ; VI-NEXT: v_mul_lo_u32 v1, v0, v3
1d019706d866 LLVM10 anatofuz parents: diff changeset	168 ; VI-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	169 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	170 ; GFX9-LABEL: add3_multiuse_outer:
1d019706d866 LLVM10 anatofuz parents: diff changeset	171 ; GFX9: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	172 ; GFX9-NEXT: v_add3_u32 v0, v0, v1, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	173 ; GFX9-NEXT: v_mul_lo_u32 v1, v0, v3
1d019706d866 LLVM10 anatofuz parents: diff changeset	174 ; GFX9-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	175 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	176 ; GFX10-LABEL: add3_multiuse_outer:
1d019706d866 LLVM10 anatofuz parents: diff changeset	177 ; GFX10: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	178 ; GFX10-NEXT: v_add3_u32 v0, v0, v1, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	179 ; GFX10-NEXT: v_mul_lo_u32 v1, v0, v3
1d019706d866 LLVM10 anatofuz parents: diff changeset	180 ; GFX10-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	181 %inner = add i32 %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	182 %outer = add i32 %inner, %c
1d019706d866 LLVM10 anatofuz parents: diff changeset	183 %x1 = mul i32 %outer, %x
1d019706d866 LLVM10 anatofuz parents: diff changeset	184 %r1 = insertelement <2 x i32> undef, i32 %outer, i32 0
1d019706d866 LLVM10 anatofuz parents: diff changeset	185 %r0 = insertelement <2 x i32> %r1, i32 %x1, i32 1
1d019706d866 LLVM10 anatofuz parents: diff changeset	186 %bc = bitcast <2 x i32> %r0 to <2 x float>
1d019706d866 LLVM10 anatofuz parents: diff changeset	187 ret <2 x float> %bc
1d019706d866 LLVM10 anatofuz parents: diff changeset	188 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	189
1d019706d866 LLVM10 anatofuz parents: diff changeset	190 define amdgpu_ps <2 x float> @add3_multiuse_inner(i32 %a, i32 %b, i32 %c) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	191 ; VI-LABEL: add3_multiuse_inner:
1d019706d866 LLVM10 anatofuz parents: diff changeset	192 ; VI: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	193 ; VI-NEXT: v_add_u32_e32 v0, vcc, v0, v1
1d019706d866 LLVM10 anatofuz parents: diff changeset	194 ; VI-NEXT: v_add_u32_e32 v1, vcc, v0, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	195 ; VI-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	196 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	197 ; GFX9-LABEL: add3_multiuse_inner:
1d019706d866 LLVM10 anatofuz parents: diff changeset	198 ; GFX9: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	199 ; GFX9-NEXT: v_add_u32_e32 v0, v0, v1
1d019706d866 LLVM10 anatofuz parents: diff changeset	200 ; GFX9-NEXT: v_add_u32_e32 v1, v0, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	201 ; GFX9-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	202 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	203 ; GFX10-LABEL: add3_multiuse_inner:
1d019706d866 LLVM10 anatofuz parents: diff changeset	204 ; GFX10: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	205 ; GFX10-NEXT: v_add_nc_u32_e32 v0, v0, v1
1d019706d866 LLVM10 anatofuz parents: diff changeset	206 ; GFX10-NEXT: v_add_nc_u32_e32 v1, v0, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	207 ; GFX10-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	208 %inner = add i32 %a, %b
1d019706d866 LLVM10 anatofuz parents: diff changeset	209 %outer = add i32 %inner, %c
1d019706d866 LLVM10 anatofuz parents: diff changeset	210 %r1 = insertelement <2 x i32> undef, i32 %inner, i32 0
1d019706d866 LLVM10 anatofuz parents: diff changeset	211 %r0 = insertelement <2 x i32> %r1, i32 %outer, i32 1
1d019706d866 LLVM10 anatofuz parents: diff changeset	212 %bc = bitcast <2 x i32> %r0 to <2 x float>
1d019706d866 LLVM10 anatofuz parents: diff changeset	213 ret <2 x float> %bc
1d019706d866 LLVM10 anatofuz parents: diff changeset	214 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	215
1d019706d866 LLVM10 anatofuz parents: diff changeset	216 ; A case where uniform values end up in VGPRs -- we could use v_add3_u32 here,
1d019706d866 LLVM10 anatofuz parents: diff changeset	217 ; but we don't.
1d019706d866 LLVM10 anatofuz parents: diff changeset	218 define amdgpu_ps float @add3_uniform_vgpr(float inreg %a, float inreg %b, float inreg %c) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	219 ; VI-LABEL: add3_uniform_vgpr:
1d019706d866 LLVM10 anatofuz parents: diff changeset	220 ; VI: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	221 ; VI-NEXT: v_add_f32_e64 v0, s2, 1.0
1d019706d866 LLVM10 anatofuz parents: diff changeset	222 ; VI-NEXT: v_add_f32_e64 v1, s3, 2.0
236 c4bab56944e8 LLVM 16 kono parents: 221 diff changeset	223 ; VI-NEXT: v_mov_b32_e32 v2, 0x40400000
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	224 ; VI-NEXT: v_add_f32_e32 v2, s4, v2
252 1f2b6ac9f198 LLVM16-1 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 236 diff changeset	225 ; VI-NEXT: v_add_u32_e32 v0, vcc, v0, v1
236 c4bab56944e8 LLVM 16 kono parents: 221 diff changeset	226 ; VI-NEXT: v_add_u32_e32 v0, vcc, v0, v2
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	227 ; VI-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	228 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	229 ; GFX9-LABEL: add3_uniform_vgpr:
1d019706d866 LLVM10 anatofuz parents: diff changeset	230 ; GFX9: ; %bb.0:
1d019706d866 LLVM10 anatofuz parents: diff changeset	231 ; GFX9-NEXT: v_add_f32_e64 v0, s2, 1.0
1d019706d866 LLVM10 anatofuz parents: diff changeset	232 ; GFX9-NEXT: v_add_f32_e64 v1, s3, 2.0
236 c4bab56944e8 LLVM 16 kono parents: 221 diff changeset	233 ; GFX9-NEXT: v_mov_b32_e32 v2, 0x40400000
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	234 ; GFX9-NEXT: v_add_f32_e32 v2, s4, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	235 ; GFX9-NEXT: v_add_u32_e32 v0, v0, v1
1d019706d866 LLVM10 anatofuz parents: diff changeset	236 ; GFX9-NEXT: v_add_u32_e32 v0, v0, v2
1d019706d866 LLVM10 anatofuz parents: diff changeset	237 ; GFX9-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	238 ;
1d019706d866 LLVM10 anatofuz parents: diff changeset	239 ; GFX10-LABEL: add3_uniform_vgpr:
1d019706d866 LLVM10 anatofuz parents: diff changeset	240 ; GFX10: ; %bb.0:
173 0572611fdcc8 reorgnization done Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 150 diff changeset	241 ; GFX10-NEXT: v_add_f32_e64 v0, s2, 1.0
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	242 ; GFX10-NEXT: v_add_f32_e64 v1, s3, 2.0
173 0572611fdcc8 reorgnization done Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 150 diff changeset	243 ; GFX10-NEXT: v_add_f32_e64 v2, 0x40400000, s4
0572611fdcc8 reorgnization done Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 150 diff changeset	244 ; GFX10-NEXT: v_add_nc_u32_e32 v0, v0, v1
0572611fdcc8 reorgnization done Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 150 diff changeset	245 ; GFX10-NEXT: v_add_nc_u32_e32 v0, v0, v2
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	246 ; GFX10-NEXT: ; return to shader part epilog
1d019706d866 LLVM10 anatofuz parents: diff changeset	247 %a1 = fadd float %a, 1.0
1d019706d866 LLVM10 anatofuz parents: diff changeset	248 %b2 = fadd float %b, 2.0
1d019706d866 LLVM10 anatofuz parents: diff changeset	249 %c3 = fadd float %c, 3.0
1d019706d866 LLVM10 anatofuz parents: diff changeset	250 %bc.a = bitcast float %a1 to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	251 %bc.b = bitcast float %b2 to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	252 %bc.c = bitcast float %c3 to i32
1d019706d866 LLVM10 anatofuz parents: diff changeset	253 %x = add i32 %bc.a, %bc.b
1d019706d866 LLVM10 anatofuz parents: diff changeset	254 %result = add i32 %x, %bc.c
1d019706d866 LLVM10 anatofuz parents: diff changeset	255 %bc = bitcast i32 %result to float
1d019706d866 LLVM10 anatofuz parents: diff changeset	256 ret float %bc
1d019706d866 LLVM10 anatofuz parents: diff changeset	257 }

Mercurial > hg > CbC > CbC_llvm

annotate llvm/test/CodeGen/AMDGPU/add3.ll @ 266:00f31e85ec16 default tip