Members/tobaru/cbc/CbC_llvm: test/CodeGen/AMDGPU/kcache-fold.ll annotate

annotate test/CodeGen/AMDGPU/kcache-fold.ll @ 128:c347d3398279 default tip

fix

author	mir3636
date	Wed, 06 Dec 2017 14:37:17 +0900
parents	803732b1fca8
children

rev	line source
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	1 ; RUN: llc -march=r600 -mcpu=redwood < %s \| FileCheck %s
95 afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	2
afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	3 ; CHECK: {{^}}main1:
afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	4 ; CHECK: MOV * T{{[0-9]+\.[XYZW], KC0}}
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	5 define amdgpu_kernel void @main1() #0 {
95 afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	6 main_body:
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	7 %tmp = load <4 x float>, <4 x float> addrspace(8)* null
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	8 %tmp7 = extractelement <4 x float> %tmp, i32 0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	9 %tmp8 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	10 %tmp9 = extractelement <4 x float> %tmp8, i32 0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	11 %tmp10 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	12 %tmp11 = extractelement <4 x float> %tmp10, i32 0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	13 %tmp12 = fcmp ogt float %tmp7, 0.000000e+00
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	14 %tmp13 = select i1 %tmp12, float %tmp9, float %tmp11
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	15 %tmp14 = load <4 x float>, <4 x float> addrspace(8)* null
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	16 %tmp15 = extractelement <4 x float> %tmp14, i32 1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	17 %tmp16 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	18 %tmp17 = extractelement <4 x float> %tmp16, i32 1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	19 %tmp18 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	20 %tmp19 = extractelement <4 x float> %tmp18, i32 1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	21 %tmp20 = fcmp ogt float %tmp15, 0.000000e+00
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	22 %tmp21 = select i1 %tmp20, float %tmp17, float %tmp19
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	23 %tmp22 = load <4 x float>, <4 x float> addrspace(8)* null
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	24 %tmp23 = extractelement <4 x float> %tmp22, i32 2
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	25 %tmp24 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	26 %tmp25 = extractelement <4 x float> %tmp24, i32 2
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	27 %tmp26 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	28 %tmp27 = extractelement <4 x float> %tmp26, i32 2
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	29 %tmp28 = fcmp ogt float %tmp23, 0.000000e+00
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	30 %tmp29 = select i1 %tmp28, float %tmp25, float %tmp27
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	31 %tmp30 = load <4 x float>, <4 x float> addrspace(8)* null
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	32 %tmp31 = extractelement <4 x float> %tmp30, i32 3
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	33 %tmp32 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	34 %tmp33 = extractelement <4 x float> %tmp32, i32 3
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	35 %tmp34 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	36 %tmp35 = extractelement <4 x float> %tmp34, i32 3
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	37 %tmp36 = fcmp ogt float %tmp31, 0.000000e+00
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	38 %tmp37 = select i1 %tmp36, float %tmp33, float %tmp35
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	39 %max.0.i = call float @llvm.maxnum.f32(float %tmp13, float 0.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	40 %clamp.i = call float @llvm.minnum.f32(float %max.0.i, float 1.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	41 %max.0.i5 = call float @llvm.maxnum.f32(float %tmp21, float 0.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	42 %clamp.i6 = call float @llvm.minnum.f32(float %max.0.i5, float 1.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	43 %max.0.i3 = call float @llvm.maxnum.f32(float %tmp29, float 0.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	44 %clamp.i4 = call float @llvm.minnum.f32(float %max.0.i3, float 1.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	45 %max.0.i1 = call float @llvm.maxnum.f32(float %tmp37, float 0.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	46 %clamp.i2 = call float @llvm.minnum.f32(float %max.0.i1, float 1.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	47 %tmp38 = insertelement <4 x float> undef, float %clamp.i, i32 0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	48 %tmp39 = insertelement <4 x float> %tmp38, float %clamp.i6, i32 1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	49 %tmp40 = insertelement <4 x float> %tmp39, float %clamp.i4, i32 2
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	50 %tmp41 = insertelement <4 x float> %tmp40, float %clamp.i2, i32 3
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	51 call void @llvm.r600.store.swizzle(<4 x float> %tmp41, i32 0, i32 0)
95 afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	52 ret void
afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	53 }
afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	54
afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	55 ; CHECK: {{^}}main2:
afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	56 ; CHECK-NOT: MOV
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	57 define amdgpu_kernel void @main2() #0 {
95 afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	58 main_body:
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	59 %tmp = load <4 x float>, <4 x float> addrspace(8)* null
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	60 %tmp7 = extractelement <4 x float> %tmp, i32 0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	61 %tmp8 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	62 %tmp9 = extractelement <4 x float> %tmp8, i32 0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	63 %tmp10 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	64 %tmp11 = extractelement <4 x float> %tmp10, i32 1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	65 %tmp12 = fcmp ogt float %tmp7, 0.000000e+00
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	66 %tmp13 = select i1 %tmp12, float %tmp9, float %tmp11
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	67 %tmp14 = load <4 x float>, <4 x float> addrspace(8)* null
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	68 %tmp15 = extractelement <4 x float> %tmp14, i32 1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	69 %tmp16 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	70 %tmp17 = extractelement <4 x float> %tmp16, i32 0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	71 %tmp18 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	72 %tmp19 = extractelement <4 x float> %tmp18, i32 1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	73 %tmp20 = fcmp ogt float %tmp15, 0.000000e+00
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	74 %tmp21 = select i1 %tmp20, float %tmp17, float %tmp19
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	75 %tmp22 = load <4 x float>, <4 x float> addrspace(8)* null
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	76 %tmp23 = extractelement <4 x float> %tmp22, i32 2
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	77 %tmp24 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	78 %tmp25 = extractelement <4 x float> %tmp24, i32 3
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	79 %tmp26 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	80 %tmp27 = extractelement <4 x float> %tmp26, i32 2
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	81 %tmp28 = fcmp ogt float %tmp23, 0.000000e+00
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	82 %tmp29 = select i1 %tmp28, float %tmp25, float %tmp27
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	83 %tmp30 = load <4 x float>, <4 x float> addrspace(8)* null
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	84 %tmp31 = extractelement <4 x float> %tmp30, i32 3
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	85 %tmp32 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	86 %tmp33 = extractelement <4 x float> %tmp32, i32 3
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	87 %tmp34 = load <4 x float>, <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>], [1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	88 %tmp35 = extractelement <4 x float> %tmp34, i32 2
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	89 %tmp36 = fcmp ogt float %tmp31, 0.000000e+00
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	90 %tmp37 = select i1 %tmp36, float %tmp33, float %tmp35
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	91 %max.0.i = call float @llvm.maxnum.f32(float %tmp13, float 0.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	92 %clamp.i = call float @llvm.minnum.f32(float %max.0.i, float 1.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	93 %max.0.i5 = call float @llvm.maxnum.f32(float %tmp21, float 0.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	94 %clamp.i6 = call float @llvm.minnum.f32(float %max.0.i5, float 1.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	95 %max.0.i3 = call float @llvm.maxnum.f32(float %tmp29, float 0.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	96 %clamp.i4 = call float @llvm.minnum.f32(float %max.0.i3, float 1.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	97 %max.0.i1 = call float @llvm.maxnum.f32(float %tmp37, float 0.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	98 %clamp.i2 = call float @llvm.minnum.f32(float %max.0.i1, float 1.000000e+00)
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	99 %tmp38 = insertelement <4 x float> undef, float %clamp.i, i32 0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	100 %tmp39 = insertelement <4 x float> %tmp38, float %clamp.i6, i32 1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	101 %tmp40 = insertelement <4 x float> %tmp39, float %clamp.i4, i32 2
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	102 %tmp41 = insertelement <4 x float> %tmp40, float %clamp.i2, i32 3
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	103 call void @llvm.r600.store.swizzle(<4 x float> %tmp41, i32 0, i32 0)
95 afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	104 ret void
afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	105 }
afa8332a0e37 LLVM 3.8 Kaito Tokumori <e105711@ie.u-ryukyu.ac.jp> parents: diff changeset	106
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	107 declare void @llvm.r600.store.swizzle(<4 x float>, i32, i32) #0
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	108 declare float @llvm.minnum.f32(float, float) #1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	109 declare float @llvm.maxnum.f32(float, float) #1
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	110
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	111 attributes #0 = { nounwind }
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	112 attributes #1 = { nounwind readnone }

Mercurial > hg > Members > tobaru > cbc > CbC_llvm

annotate test/CodeGen/AMDGPU/kcache-fold.ll @ 128:c347d3398279 default tip