CbC/CbC_llvm: test/CodeGen/AMDGPU/rcp-pattern.ll annotate

annotate test/CodeGen/AMDGPU/rcp-pattern.ll @ 146:3fc4d5c3e21e

set tail call flag for code segment in CGCAll

author	Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date	Sun, 23 Dec 2018 19:23:36 +0900
parents	803732b1fca8
children

rev	line source
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	1 ; RUN: llc -march=amdgcn -verify-machineinstrs < %s \| FileCheck -check-prefix=GCN -check-prefix=FUNC %s
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	2 ; RUN: llc -march=amdgcn -mcpu=tonga -mattr=-flat-for-global -verify-machineinstrs < %s \| FileCheck -check-prefix=GCN -check-prefix=FUNC %s
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	3 ; RUN: llc -march=r600 -mcpu=cypress -verify-machineinstrs < %s \| FileCheck -check-prefix=EG -check-prefix=FUNC %s
100 7d135dc70f03 LLVM 3.9 Miyagi Mitsuki <e135756@ie.u-ryukyu.ac.jp> parents: diff changeset	4 ; RUN: llc -march=r600 -mcpu=cayman -verify-machineinstrs < %s \| FileCheck -check-prefix=EG -check-prefix=FUNC %s
7d135dc70f03 LLVM 3.9 Miyagi Mitsuki <e135756@ie.u-ryukyu.ac.jp> parents: diff changeset	5
7d135dc70f03 LLVM 3.9 Miyagi Mitsuki <e135756@ie.u-ryukyu.ac.jp> parents: diff changeset	6 ; FUNC-LABEL: {{^}}rcp_pat_f32:
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	7 ; GCN: s_load_dword [[SRC:s[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	8 ; GCN: v_rcp_f32_e32 [[RCP:v[0-9]+]], [[SRC]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	9 ; GCN: buffer_store_dword [[RCP]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	10
100 7d135dc70f03 LLVM 3.9 Miyagi Mitsuki <e135756@ie.u-ryukyu.ac.jp> parents: diff changeset	11 ; EG: RECIP_IEEE
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	12 define amdgpu_kernel void @rcp_pat_f32(float addrspace(1)* %out, float %src) #0 {
100 7d135dc70f03 LLVM 3.9 Miyagi Mitsuki <e135756@ie.u-ryukyu.ac.jp> parents: diff changeset	13 %rcp = fdiv float 1.0, %src
7d135dc70f03 LLVM 3.9 Miyagi Mitsuki <e135756@ie.u-ryukyu.ac.jp> parents: diff changeset	14 store float %rcp, float addrspace(1)* %out, align 4
7d135dc70f03 LLVM 3.9 Miyagi Mitsuki <e135756@ie.u-ryukyu.ac.jp> parents: diff changeset	15 ret void
7d135dc70f03 LLVM 3.9 Miyagi Mitsuki <e135756@ie.u-ryukyu.ac.jp> parents: diff changeset	16 }
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	17
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	18 ; FUNC-LABEL: {{^}}rcp_ulp25_pat_f32:
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	19 ; GCN: s_load_dword [[SRC:s[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	20 ; GCN: v_rcp_f32_e32 [[RCP:v[0-9]+]], [[SRC]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	21 ; GCN: buffer_store_dword [[RCP]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	22
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	23 ; EG: RECIP_IEEE
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	24 define amdgpu_kernel void @rcp_ulp25_pat_f32(float addrspace(1)* %out, float %src) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	25 %rcp = fdiv float 1.0, %src, !fpmath !0
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	26 store float %rcp, float addrspace(1)* %out, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	27 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	28 }
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	29
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	30 ; FUNC-LABEL: {{^}}rcp_fast_ulp25_pat_f32:
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	31 ; GCN: s_load_dword [[SRC:s[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	32 ; GCN: v_rcp_f32_e32 [[RCP:v[0-9]+]], [[SRC]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	33 ; GCN: buffer_store_dword [[RCP]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	34
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	35 ; EG: RECIP_IEEE
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	36 define amdgpu_kernel void @rcp_fast_ulp25_pat_f32(float addrspace(1)* %out, float %src) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	37 %rcp = fdiv fast float 1.0, %src, !fpmath !0
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	38 store float %rcp, float addrspace(1)* %out, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	39 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	40 }
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	41
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	42 ; FUNC-LABEL: {{^}}rcp_arcp_ulp25_pat_f32:
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	43 ; GCN: s_load_dword [[SRC:s[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	44 ; GCN: v_rcp_f32_e32 [[RCP:v[0-9]+]], [[SRC]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	45 ; GCN: buffer_store_dword [[RCP]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	46
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	47 ; EG: RECIP_IEEE
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	48 define amdgpu_kernel void @rcp_arcp_ulp25_pat_f32(float addrspace(1)* %out, float %src) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	49 %rcp = fdiv arcp float 1.0, %src, !fpmath !0
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	50 store float %rcp, float addrspace(1)* %out, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	51 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	52 }
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	53
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	54 ; FUNC-LABEL: {{^}}rcp_global_fast_ulp25_pat_f32:
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	55 ; GCN: s_load_dword [[SRC:s[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	56 ; GCN: v_rcp_f32_e32 [[RCP:v[0-9]+]], [[SRC]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	57 ; GCN: buffer_store_dword [[RCP]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	58
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	59 ; EG: RECIP_IEEE
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	60 define amdgpu_kernel void @rcp_global_fast_ulp25_pat_f32(float addrspace(1)* %out, float %src) #2 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	61 %rcp = fdiv float 1.0, %src, !fpmath !0
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	62 store float %rcp, float addrspace(1)* %out, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	63 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	64 }
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	65
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	66 ; FUNC-LABEL: {{^}}rcp_fabs_pat_f32:
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	67 ; GCN: s_load_dword [[SRC:s[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	68 ; GCN: v_rcp_f32_e64 [[RCP:v[0-9]+]], \|[[SRC]]\|
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	69 ; GCN: buffer_store_dword [[RCP]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	70
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	71 ; EG: RECIP_IEEE
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	72 define amdgpu_kernel void @rcp_fabs_pat_f32(float addrspace(1)* %out, float %src) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	73 %src.fabs = call float @llvm.fabs.f32(float %src)
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	74 %rcp = fdiv float 1.0, %src.fabs
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	75 store float %rcp, float addrspace(1)* %out, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	76 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	77 }
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	78
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	79 ; FUNC-LABEL: {{^}}neg_rcp_pat_f32:
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	80 ; GCN: s_load_dword [[SRC:s[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	81 ; GCN: v_rcp_f32_e64 [[RCP:v[0-9]+]], -[[SRC]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	82 ; GCN: buffer_store_dword [[RCP]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	83
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	84 ; EG: RECIP_IEEE
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	85 define amdgpu_kernel void @neg_rcp_pat_f32(float addrspace(1)* %out, float %src) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	86 %rcp = fdiv float -1.0, %src
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	87 store float %rcp, float addrspace(1)* %out, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	88 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	89 }
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	90
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	91 ; FUNC-LABEL: {{^}}rcp_fabs_fneg_pat_f32:
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	92 ; GCN: s_load_dword [[SRC:s[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	93 ; GCN: v_rcp_f32_e64 [[RCP:v[0-9]+]], -\|[[SRC]]\|
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	94 ; GCN: buffer_store_dword [[RCP]]
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	95 define amdgpu_kernel void @rcp_fabs_fneg_pat_f32(float addrspace(1)* %out, float %src) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	96 %src.fabs = call float @llvm.fabs.f32(float %src)
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	97 %src.fabs.fneg = fsub float -0.0, %src.fabs
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	98 %rcp = fdiv float 1.0, %src.fabs.fneg
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	99 store float %rcp, float addrspace(1)* %out, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	100 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	101 }
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	102
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	103 ; FUNC-LABEL: {{^}}rcp_fabs_fneg_pat_multi_use_f32:
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	104 ; GCN: s_load_dword [[SRC:s[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	105 ; GCN: v_rcp_f32_e64 [[RCP:v[0-9]+]], -\|[[SRC]]\|
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	106 ; GCN: v_mul_f32_e64 [[MUL:v[0-9]+]], [[SRC]], -\|[[SRC]]\|
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	107 ; GCN: buffer_store_dword [[RCP]]
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	108 ; GCN: buffer_store_dword [[MUL]]
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	109 define amdgpu_kernel void @rcp_fabs_fneg_pat_multi_use_f32(float addrspace(1)* %out, float %src) #0 {
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	110 %src.fabs = call float @llvm.fabs.f32(float %src)
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	111 %src.fabs.fneg = fsub float -0.0, %src.fabs
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	112 %rcp = fdiv float 1.0, %src.fabs.fneg
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	113 store volatile float %rcp, float addrspace(1)* %out, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	114
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	115 %other = fmul float %src, %src.fabs.fneg
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	116 store volatile float %other, float addrspace(1)* %out, align 4
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	117 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	118 }
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	119
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	120 ; FUNC-LABEL: {{^}}div_arcp_2_x_pat_f32:
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	121 ; GCN: v_mul_f32_e32 [[MUL:v[0-9]+]], 0.5, v{{[0-9]+}}
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	122 ; GCN: buffer_store_dword [[MUL]]
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	123 define amdgpu_kernel void @div_arcp_2_x_pat_f32(float addrspace(1)* %out) #0 {
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	124 %x = load float, float addrspace(1)* undef
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	125 %rcp = fdiv arcp float %x, 2.0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	126 store float %rcp, float addrspace(1)* %out, align 4
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	127 ret void
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	128 }
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	129
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	130 ; FUNC-LABEL: {{^}}div_arcp_k_x_pat_f32:
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	131 ; GCN: v_mul_f32_e32 [[MUL:v[0-9]+]], 0x3dcccccd, v{{[0-9]+}}
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	132 ; GCN: buffer_store_dword [[MUL]]
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	133 define amdgpu_kernel void @div_arcp_k_x_pat_f32(float addrspace(1)* %out) #0 {
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	134 %x = load float, float addrspace(1)* undef
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	135 %rcp = fdiv arcp float %x, 10.0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	136 store float %rcp, float addrspace(1)* %out, align 4
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	137 ret void
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	138 }
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	139
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	140 ; FUNC-LABEL: {{^}}div_arcp_neg_k_x_pat_f32:
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	141 ; GCN: v_mul_f32_e32 [[MUL:v[0-9]+]], 0xbdcccccd, v{{[0-9]+}}
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	142 ; GCN: buffer_store_dword [[MUL]]
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	143 define amdgpu_kernel void @div_arcp_neg_k_x_pat_f32(float addrspace(1)* %out) #0 {
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	144 %x = load float, float addrspace(1)* undef
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	145 %rcp = fdiv arcp float %x, -10.0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	146 store float %rcp, float addrspace(1)* %out, align 4
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	147 ret void
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	148 }
120 1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	149
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	150 declare float @llvm.fabs.f32(float) #1
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	151 declare float @llvm.sqrt.f32(float) #1
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	152
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	153 attributes #0 = { nounwind "unsafe-fp-math"="false" }
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	154 attributes #1 = { nounwind readnone }
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	155 attributes #2 = { nounwind "unsafe-fp-math"="true" }
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	156
1172e4bd9c6f update 4.0.0 mir3636 parents: 100 diff changeset	157 !0 = !{float 2.500000e+00}

Mercurial > hg > CbC > CbC_llvm

annotate test/CodeGen/AMDGPU/rcp-pattern.ll @ 146:3fc4d5c3e21e