CbC/CbC_llvm: test/CodeGen/AMDGPU/uitofp.f16.ll annotate

annotate test/CodeGen/AMDGPU/uitofp.f16.ll @ 146:3fc4d5c3e21e

set tail call flag for code segment in CGCAll

author	Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date	Sun, 23 Dec 2018 19:23:36 +0900
parents	803732b1fca8
children	c2174574ed3a

rev	line source
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	1 ; RUN: llc -amdgpu-scalarize-global-loads=false -march=amdgcn -mcpu=tahiti -verify-machineinstrs -enable-unsafe-fp-math < %s \| FileCheck -check-prefix=GCN -check-prefix=SI %s
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	2 ; RUN: llc -amdgpu-scalarize-global-loads=false -march=amdgcn -mcpu=fiji -mattr=-flat-for-global -verify-machineinstrs -enable-unsafe-fp-math < %s \| FileCheck -check-prefix=GCN -check-prefix=VI %s
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	3
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	4 ; GCN-LABEL: {{^}}uitofp_i16_to_f16
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	5 ; GCN: buffer_load_ushort v[[A_I16:[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	6 ; SI: v_cvt_f32_u32_e32 v[[A_F32:[0-9]+]], v[[A_I16]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	7 ; VI: v_cvt_f32_i32_e32 v[[A_F32:[0-9]+]], v[[A_I16]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	8 ; GCN: v_cvt_f16_f32_e32 v[[R_F16:[0-9]+]], v[[A_F32]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	9 ; GCN: buffer_store_short v[[R_F16]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	10 ; GCN: s_endpgm
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	11 define amdgpu_kernel void @uitofp_i16_to_f16(
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	12 half addrspace(1)* %r,
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	13 i16 addrspace(1)* %a) {
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	14 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	15 %a.val = load i16, i16 addrspace(1)* %a
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	16 %r.val = uitofp i16 %a.val to half
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	17 store half %r.val, half addrspace(1)* %r
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	18 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	19 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	20
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	21 ; GCN-LABEL: {{^}}uitofp_i32_to_f16
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	22 ; GCN: buffer_load_dword v[[A_I32:[0-9]+]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	23 ; GCN: v_cvt_f32_u32_e32 v[[A_I16:[0-9]+]], v[[A_I32]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	24 ; GCN: v_cvt_f16_f32_e32 v[[R_F16:[0-9]+]], v[[A_I16]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	25 ; GCN: buffer_store_short v[[R_F16]]
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	26 ; GCN: s_endpgm
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	27 define amdgpu_kernel void @uitofp_i32_to_f16(
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	28 half addrspace(1)* %r,
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	29 i32 addrspace(1)* %a) {
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	30 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	31 %a.val = load i32, i32 addrspace(1)* %a
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	32 %r.val = uitofp i32 %a.val to half
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	33 store half %r.val, half addrspace(1)* %r
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	34 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	35 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	36
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	37 ; f16 = uitofp i64 is in uint_to_fp.i64.ll
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	38
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	39 ; GCN-LABEL: {{^}}uitofp_v2i16_to_v2f16
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	40 ; GCN: buffer_load_dword
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	41
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	42 ; SI: v_cvt_f32_u32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	43 ; SI: v_cvt_f32_u32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	44 ; SI: v_cvt_f16_f32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	45 ; SI: v_cvt_f16_f32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	46 ; SI-DAG: v_lshlrev_b32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	47 ; SI: v_or_b32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	48
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	49 ; VI-DAG: v_cvt_f16_f32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	50 ; VI-DAG: v_cvt_f32_i32_sdwa
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	51 ; VI-DAG: v_cvt_f32_i32_sdwa
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	52 ; VI-DAG: v_cvt_f16_f32_sdwa
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	53 ; VI: v_or_b32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	54
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	55 ; GCN: buffer_store_dword
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	56 ; GCN: s_endpgm
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	57 define amdgpu_kernel void @uitofp_v2i16_to_v2f16(
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	58 <2 x half> addrspace(1)* %r,
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	59 <2 x i16> addrspace(1)* %a) {
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	60 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	61 %a.val = load <2 x i16>, <2 x i16> addrspace(1)* %a
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	62 %r.val = uitofp <2 x i16> %a.val to <2 x half>
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	63 store <2 x half> %r.val, <2 x half> addrspace(1)* %r
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	64 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	65 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	66
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	67 ; GCN-LABEL: {{^}}uitofp_v2i32_to_v2f16
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	68 ; GCN: buffer_load_dwordx2
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	69
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	70 ; SI: v_cvt_f32_u32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	71 ; SI: v_cvt_f32_u32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	72 ; SI: v_cvt_f16_f32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	73 ; SI: v_cvt_f16_f32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	74 ; SI-DAG: v_lshlrev_b32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	75 ; SI: v_or_b32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	76
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	77 ; VI-DAG: v_cvt_f32_u32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	78 ; VI-DAG: v_cvt_f32_u32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	79 ; VI-DAG: v_cvt_f16_f32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	80 ; VI-DAG: v_cvt_f16_f32_sdwa
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	81 ; VI: v_or_b32_e32
803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	82
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	83 ; GCN: buffer_store_dword
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	84 ; GCN: s_endpgm
121 803732b1fca8 LLVM 5.0 kono parents: 120 diff changeset	85 define amdgpu_kernel void @uitofp_v2i32_to_v2f16(
120 1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	86 <2 x half> addrspace(1)* %r,
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	87 <2 x i32> addrspace(1)* %a) {
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	88 entry:
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	89 %a.val = load <2 x i32>, <2 x i32> addrspace(1)* %a
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	90 %r.val = uitofp <2 x i32> %a.val to <2 x half>
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	91 store <2 x half> %r.val, <2 x half> addrspace(1)* %r
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	92 ret void
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	93 }
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	94
1172e4bd9c6f update 4.0.0 mir3636 parents: diff changeset	95 ; f16 = uitofp i64 is in uint_to_fp.i64.ll

Mercurial > hg > CbC > CbC_llvm

annotate test/CodeGen/AMDGPU/uitofp.f16.ll @ 146:3fc4d5c3e21e