CbC/CbC_llvm: clang/test/CodeGen/arm-neon-vld.c annotate

annotate clang/test/CodeGen/arm-neon-vld.c @ 207:2e18cbf3894f

LLVM12

author	Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date	Tue, 08 Jun 2021 06:07:14 +0900
parents	0572611fdcc8
children	c4bab56944e8

rev	line source
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1 // RUN: %clang_cc1 -triple arm64-none-linux-gnu -target-feature +neon \
1d019706d866 LLVM10 anatofuz parents: diff changeset	2 // RUN: -S -disable-O0-optnone -emit-llvm -o - %s \| opt -S -mem2reg \| \
1d019706d866 LLVM10 anatofuz parents: diff changeset	3 // RUN: FileCheck -check-prefixes=CHECK,CHECK-A64 %s
1d019706d866 LLVM10 anatofuz parents: diff changeset	4 // RUN: %clang_cc1 -triple armv8-none-linux-gnueabi -target-feature +neon \
1d019706d866 LLVM10 anatofuz parents: diff changeset	5 // RUN: -target-feature +fp16 -S -disable-O0-optnone -emit-llvm -o - %s \| \
1d019706d866 LLVM10 anatofuz parents: diff changeset	6 // RUN: opt -S -mem2reg \| FileCheck -check-prefixes=CHECK,CHECK-A32 %s
1d019706d866 LLVM10 anatofuz parents: diff changeset	7
1d019706d866 LLVM10 anatofuz parents: diff changeset	8 #include <arm_neon.h>
1d019706d866 LLVM10 anatofuz parents: diff changeset	9
1d019706d866 LLVM10 anatofuz parents: diff changeset	10 // CHECK-LABEL: @test_vld1_f16_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	11 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float16x4x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	12 // CHECK-A32: %struct.float16x4x2_t* noalias sret(%struct.float16x4x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	13 // CHECK: [[__RET:%.*]] = alloca %struct.float16x4x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	14 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	15 // CHECK: [[TMP1:%.]] = bitcast half %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	16 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [[HALF:(half\|i16)]]*
1d019706d866 LLVM10 anatofuz parents: diff changeset	17 // CHECK: [[VLD1XN:%.]] = call { <4 x [[HALF]]>, <4 x [[HALF]]> } @llvm.{{aarch64.neon.ld1x2.v4f16.p0f16\|arm.neon.vld1x2.v4i16.p0i16}}([[HALF]] [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	18 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x [[HALF]]>, <4 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	19 // CHECK: store { <4 x [[HALF]]>, <4 x [[HALF]]> } [[VLD1XN]], { <4 x [[HALF]]>, <4 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	20 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x4x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	21 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	22 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	23 // CHECK-A64: [[TMP6:%.]] = load %struct.float16x4x2_t, %struct.float16x4x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	24 // CHECK-A64: ret %struct.float16x4x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	25 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	26 float16x4x2_t test_vld1_f16_x2(float16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	27 return vld1_f16_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	28 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	29
1d019706d866 LLVM10 anatofuz parents: diff changeset	30 // CHECK-LABEL: @test_vld1_f16_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	31 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float16x4x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	32 // CHECK-A32: %struct.float16x4x3_t* noalias sret(%struct.float16x4x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	33 // CHECK: [[__RET:%.*]] = alloca %struct.float16x4x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	34 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	35 // CHECK: [[TMP1:%.]] = bitcast half %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	36 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [[HALF]]*
1d019706d866 LLVM10 anatofuz parents: diff changeset	37 // CHECK: [[VLD1XN:%.]] = call { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> } @llvm.{{aarch64.neon.ld1x3.v4f16.p0f16\|arm.neon.vld1x3.v4i16.p0i16}}([[HALF]] [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	38 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	39 // CHECK: store { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> } [[VLD1XN]], { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	40 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x4x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	41 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	42 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	43 // CHECK-A64: [[TMP6:%.]] = load %struct.float16x4x3_t, %struct.float16x4x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	44 // CHECK-A64: ret %struct.float16x4x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	45 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	46 float16x4x3_t test_vld1_f16_x3(float16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	47 return vld1_f16_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	48 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	49
1d019706d866 LLVM10 anatofuz parents: diff changeset	50 // CHECK-LABEL: @test_vld1_f16_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	51 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float16x4x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	52 // CHECK-A32: %struct.float16x4x4_t* noalias sret(%struct.float16x4x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	53 // CHECK: [[__RET:%.*]] = alloca %struct.float16x4x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	54 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	55 // CHECK: [[TMP1:%.]] = bitcast half %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	56 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [[HALF]]*
1d019706d866 LLVM10 anatofuz parents: diff changeset	57 // CHECK: [[VLD1XN:%.]] = call { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> } @llvm.{{aarch64.neon.ld1x4.v4f16.p0f16\|arm.neon.vld1x4.v4i16.p0i16}}([[HALF]] [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	58 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	59 // CHECK: store { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> } [[VLD1XN]], { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	60 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x4x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	61 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	62 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	63 // CHECK-A64: [[TMP6:%.]] = load %struct.float16x4x4_t, %struct.float16x4x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	64 // CHECK-A64: ret %struct.float16x4x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	65 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	66 float16x4x4_t test_vld1_f16_x4(float16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	67 return vld1_f16_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	68 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	69
1d019706d866 LLVM10 anatofuz parents: diff changeset	70 // CHECK-LABEL: @test_vld1_f32_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	71 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float32x2x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	72 // CHECK-A32: %struct.float32x2x2_t* noalias sret(%struct.float32x2x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	73 // CHECK: [[__RET:%.*]] = alloca %struct.float32x2x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	74 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	75 // CHECK: [[TMP1:%.]] = bitcast float %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	76 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	77 // CHECK: [[VLD1XN:%.]] = call { <2 x float>, <2 x float> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v2f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	78 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x float>, <2 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	79 // CHECK: store { <2 x float>, <2 x float> } [[VLD1XN]], { <2 x float>, <2 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	80 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x2x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	81 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	82 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	83 // CHECK-A64: [[TMP6:%.]] = load %struct.float32x2x2_t, %struct.float32x2x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	84 // CHECK-A64: ret %struct.float32x2x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	85 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	86 float32x2x2_t test_vld1_f32_x2(float32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	87 return vld1_f32_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	88 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	89
1d019706d866 LLVM10 anatofuz parents: diff changeset	90 // CHECK-LABEL: @test_vld1_f32_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	91 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float32x2x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	92 // CHECK-A32: %struct.float32x2x3_t* noalias sret(%struct.float32x2x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	93 // CHECK: [[__RET:%.*]] = alloca %struct.float32x2x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	94 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	95 // CHECK: [[TMP1:%.]] = bitcast float %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	96 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	97 // CHECK: [[VLD1XN:%.]] = call { <2 x float>, <2 x float>, <2 x float> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v2f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	98 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x float>, <2 x float>, <2 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	99 // CHECK: store { <2 x float>, <2 x float>, <2 x float> } [[VLD1XN]], { <2 x float>, <2 x float>, <2 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	100 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x2x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	101 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	102 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	103 // CHECK-A64: [[TMP6:%.]] = load %struct.float32x2x3_t, %struct.float32x2x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	104 // CHECK-A64: ret %struct.float32x2x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	105 float32x2x3_t test_vld1_f32_x3(float32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	106 return vld1_f32_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	107 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	108
1d019706d866 LLVM10 anatofuz parents: diff changeset	109 // CHECK-LABEL: @test_vld1_f32_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	110 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float32x2x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	111 // CHECK-A32: %struct.float32x2x4_t* noalias sret(%struct.float32x2x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	112 // CHECK: [[__RET:%.*]] = alloca %struct.float32x2x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	113 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	114 // CHECK: [[TMP1:%.]] = bitcast float %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	115 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	116 // CHECK: [[VLD1XN:%.]] = call { <2 x float>, <2 x float>, <2 x float>, <2 x float> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v2f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	117 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x float>, <2 x float>, <2 x float>, <2 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	118 // CHECK: store { <2 x float>, <2 x float>, <2 x float>, <2 x float> } [[VLD1XN]], { <2 x float>, <2 x float>, <2 x float>, <2 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	119 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x2x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	120 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	121 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	122 // CHECK-A64: [[TMP6:%.]] = load %struct.float32x2x4_t, %struct.float32x2x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	123 // CHECK-A64: ret %struct.float32x2x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	124 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	125 float32x2x4_t test_vld1_f32_x4(float32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	126 return vld1_f32_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	127 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	128
1d019706d866 LLVM10 anatofuz parents: diff changeset	129 // CHECK-LABEL: @test_vld1_p16_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	130 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly16x4x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	131 // CHECK-A32: %struct.poly16x4x2_t* noalias sret(%struct.poly16x4x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	132 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x4x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	133 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	134 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	135 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	136 // CHECK: [[VLD1XN:%.]] = call { <4 x i16>, <4 x i16> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	137 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	138 // CHECK: store { <4 x i16>, <4 x i16> } [[VLD1XN]], { <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	139 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x4x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	140 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	141 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	142 // CHECK-A64: [[TMP6:%.]] = load %struct.poly16x4x2_t, %struct.poly16x4x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	143 // CHECK-A64: ret %struct.poly16x4x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	144 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	145 poly16x4x2_t test_vld1_p16_x2(poly16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	146 return vld1_p16_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	147 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	148
1d019706d866 LLVM10 anatofuz parents: diff changeset	149 // CHECK-LABEL: @test_vld1_p16_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	150 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly16x4x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	151 // CHECK-A32: %struct.poly16x4x3_t* noalias sret(%struct.poly16x4x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	152 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x4x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	153 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	154 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	155 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	156 // CHECK: [[VLD1XN:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	157 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	158 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16> } [[VLD1XN]], { <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	159 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x4x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	160 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	161 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	162 // CHECK-A64: [[TMP6:%.]] = load %struct.poly16x4x3_t, %struct.poly16x4x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	163 // CHECK-A64: ret %struct.poly16x4x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	164 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	165 poly16x4x3_t test_vld1_p16_x3(poly16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	166 return vld1_p16_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	167 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	168
1d019706d866 LLVM10 anatofuz parents: diff changeset	169 // CHECK-LABEL: @test_vld1_p16_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	170 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly16x4x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	171 // CHECK-A32: %struct.poly16x4x4_t* noalias sret(%struct.poly16x4x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	172 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x4x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	173 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	174 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	175 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	176 // CHECK: [[VLD1XN:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	177 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	178 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } [[VLD1XN]], { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	179 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x4x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	180 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	181 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	182 // CHECK-A64: [[TMP6:%.]] = load %struct.poly16x4x4_t, %struct.poly16x4x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	183 // CHECK-A64: ret %struct.poly16x4x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	184 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	185 poly16x4x4_t test_vld1_p16_x4(poly16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	186 return vld1_p16_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	187 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	188
1d019706d866 LLVM10 anatofuz parents: diff changeset	189 // CHECK-LABEL: @test_vld1_p8_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	190 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly8x8x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	191 // CHECK-A32: %struct.poly8x8x2_t* noalias sret(%struct.poly8x8x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	192 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x8x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	193 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	194 // CHECK: [[VLD1XN:%.]] = call { <8 x i8>, <8 x i8> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v8i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	195 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	196 // CHECK: store { <8 x i8>, <8 x i8> } [[VLD1XN]], { <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	197 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x8x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	198 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	199 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	200 // CHECK-A64: [[TMP4:%.]] = load %struct.poly8x8x2_t, %struct.poly8x8x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	201 // CHECK-A64: ret %struct.poly8x8x2_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	202 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	203 poly8x8x2_t test_vld1_p8_x2(poly8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	204 return vld1_p8_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	205 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	206
1d019706d866 LLVM10 anatofuz parents: diff changeset	207 // CHECK-LABEL: @test_vld1_p8_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	208 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly8x8x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	209 // CHECK-A32: %struct.poly8x8x3_t* noalias sret(%struct.poly8x8x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	210 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x8x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	211 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	212 // CHECK: [[VLD1XN:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v8i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	213 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	214 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8> } [[VLD1XN]], { <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	215 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x8x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	216 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	217 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	218 // CHECK-A64: [[TMP4:%.]] = load %struct.poly8x8x3_t, %struct.poly8x8x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	219 // CHECK-A64: ret %struct.poly8x8x3_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	220 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	221 poly8x8x3_t test_vld1_p8_x3(poly8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	222 return vld1_p8_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	223 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	224
1d019706d866 LLVM10 anatofuz parents: diff changeset	225 // CHECK-LABEL: @test_vld1_p8_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	226 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly8x8x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	227 // CHECK-A32: %struct.poly8x8x4_t* noalias sret(%struct.poly8x8x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	228 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x8x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	229 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	230 // CHECK: [[VLD1XN:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v8i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	231 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	232 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } [[VLD1XN]], { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	233 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x8x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	234 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	235 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	236 // CHECK-A64: [[TMP4:%.]] = load %struct.poly8x8x4_t, %struct.poly8x8x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	237 // CHECK-A64: ret %struct.poly8x8x4_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	238 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	239 poly8x8x4_t test_vld1_p8_x4(poly8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	240 return vld1_p8_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	241 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	242
1d019706d866 LLVM10 anatofuz parents: diff changeset	243 // CHECK-LABEL: @test_vld1_s16_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	244 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int16x4x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	245 // CHECK-A32: %struct.int16x4x2_t* noalias sret(%struct.int16x4x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	246 // CHECK: [[__RET:%.*]] = alloca %struct.int16x4x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	247 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	248 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	249 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	250 // CHECK: [[VLD1XN:%.]] = call { <4 x i16>, <4 x i16> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	251 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	252 // CHECK: store { <4 x i16>, <4 x i16> } [[VLD1XN]], { <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	253 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x4x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	254 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	255 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	256 // CHECK-A64: [[TMP6:%.]] = load %struct.int16x4x2_t, %struct.int16x4x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	257 // CHECK-A64: ret %struct.int16x4x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	258 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	259 int16x4x2_t test_vld1_s16_x2(int16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	260 return vld1_s16_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	261 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	262
1d019706d866 LLVM10 anatofuz parents: diff changeset	263 // CHECK-LABEL: @test_vld1_s16_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	264 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int16x4x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	265 // CHECK-A32: %struct.int16x4x3_t* noalias sret(%struct.int16x4x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	266 // CHECK: [[__RET:%.*]] = alloca %struct.int16x4x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	267 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	268 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	269 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	270 // CHECK: [[VLD1XN:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	271 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	272 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16> } [[VLD1XN]], { <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	273 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x4x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	274 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	275 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	276 // CHECK-A64: [[TMP6:%.]] = load %struct.int16x4x3_t, %struct.int16x4x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	277 // CHECK-A64: ret %struct.int16x4x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	278 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	279 int16x4x3_t test_vld1_s16_x3(int16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	280 return vld1_s16_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	281 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	282
1d019706d866 LLVM10 anatofuz parents: diff changeset	283 // CHECK-LABEL: @test_vld1_s16_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	284 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int16x4x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	285 // CHECK-A32: %struct.int16x4x4_t* noalias sret(%struct.int16x4x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	286 // CHECK: [[__RET:%.*]] = alloca %struct.int16x4x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	287 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	288 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	289 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	290 // CHECK: [[VLD1XN:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	291 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	292 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } [[VLD1XN]], { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	293 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x4x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	294 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	295 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	296 // CHECK-A64: [[TMP6:%.]] = load %struct.int16x4x4_t, %struct.int16x4x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	297 // CHECK-A64: ret %struct.int16x4x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	298 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	299 int16x4x4_t test_vld1_s16_x4(int16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	300 return vld1_s16_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	301 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	302
1d019706d866 LLVM10 anatofuz parents: diff changeset	303 // CHECK-LABEL: @test_vld1_s32_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	304 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int32x2x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	305 // CHECK-A32: %struct.int32x2x2_t* noalias sret(%struct.int32x2x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	306 // CHECK: [[__RET:%.*]] = alloca %struct.int32x2x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	307 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	308 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	309 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	310 // CHECK: [[VLD1XN:%.]] = call { <2 x i32>, <2 x i32> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	311 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	312 // CHECK: store { <2 x i32>, <2 x i32> } [[VLD1XN]], { <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	313 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x2x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	314 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	315 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	316 // CHECK-A64: [[TMP6:%.]] = load %struct.int32x2x2_t, %struct.int32x2x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	317 // CHECK-A64: ret %struct.int32x2x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	318 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	319 int32x2x2_t test_vld1_s32_x2(int32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	320 return vld1_s32_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	321 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	322
1d019706d866 LLVM10 anatofuz parents: diff changeset	323 // CHECK-LABEL: @test_vld1_s32_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	324 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int32x2x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	325 // CHECK-A32: %struct.int32x2x3_t* noalias sret(%struct.int32x2x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	326 // CHECK: [[__RET:%.*]] = alloca %struct.int32x2x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	327 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	328 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	329 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	330 // CHECK: [[VLD1XN:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	331 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	332 // CHECK: store { <2 x i32>, <2 x i32>, <2 x i32> } [[VLD1XN]], { <2 x i32>, <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	333 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x2x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	334 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	335 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	336 // CHECK-A64: [[TMP6:%.]] = load %struct.int32x2x3_t, %struct.int32x2x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	337 // CHECK-A64: ret %struct.int32x2x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	338 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	339 int32x2x3_t test_vld1_s32_x3(int32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	340 return vld1_s32_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	341 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	342
1d019706d866 LLVM10 anatofuz parents: diff changeset	343 // CHECK-LABEL: @test_vld1_s32_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	344 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int32x2x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	345 // CHECK-A32: %struct.int32x2x4_t* noalias sret(%struct.int32x2x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	346 // CHECK: [[__RET:%.*]] = alloca %struct.int32x2x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	347 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	348 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	349 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	350 // CHECK: [[VLD1XN:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	351 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	352 // CHECK: store { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> } [[VLD1XN]], { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	353 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x2x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	354 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	355 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	356 // CHECK-A64: [[TMP6:%.]] = load %struct.int32x2x4_t, %struct.int32x2x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	357 // CHECK-A64: ret %struct.int32x2x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	358 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	359 int32x2x4_t test_vld1_s32_x4(int32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	360 return vld1_s32_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	361 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	362
1d019706d866 LLVM10 anatofuz parents: diff changeset	363 // CHECK-LABEL: @test_vld1_s64_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	364 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int64x1x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	365 // CHECK-A32: %struct.int64x1x2_t* noalias sret(%struct.int64x1x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	366 // CHECK: [[__RET:%.*]] = alloca %struct.int64x1x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	367 // CHECK: [[TMP0:%.]] = bitcast %struct.int64x1x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	368 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	369 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	370 // CHECK: [[VLD1XN:%.]] = call { <1 x i64>, <1 x i64> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	371 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	372 // CHECK: store { <1 x i64>, <1 x i64> } [[VLD1XN]], { <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	373 // CHECK: [[TMP4:%.]] = bitcast %struct.int64x1x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	374 // CHECK: [[TMP5:%.]] = bitcast %struct.int64x1x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	375 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	376 // CHECK-A64: [[TMP6:%.]] = load %struct.int64x1x2_t, %struct.int64x1x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	377 // CHECK-A64: ret %struct.int64x1x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	378 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	379 int64x1x2_t test_vld1_s64_x2(int64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	380 return vld1_s64_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	381 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	382
1d019706d866 LLVM10 anatofuz parents: diff changeset	383 // CHECK-LABEL: @test_vld1_s64_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	384 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int64x1x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	385 // CHECK-A32: %struct.int64x1x3_t* noalias sret(%struct.int64x1x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	386 // CHECK: [[__RET:%.*]] = alloca %struct.int64x1x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	387 // CHECK: [[TMP0:%.]] = bitcast %struct.int64x1x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	388 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	389 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	390 // CHECK: [[VLD1XN:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	391 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	392 // CHECK: store { <1 x i64>, <1 x i64>, <1 x i64> } [[VLD1XN]], { <1 x i64>, <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	393 // CHECK: [[TMP4:%.]] = bitcast %struct.int64x1x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	394 // CHECK: [[TMP5:%.]] = bitcast %struct.int64x1x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	395 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	396 // CHECK-A64: [[TMP6:%.]] = load %struct.int64x1x3_t, %struct.int64x1x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	397 // CHECK-A64: ret %struct.int64x1x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	398 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	399 int64x1x3_t test_vld1_s64_x3(int64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	400 return vld1_s64_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	401 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	402
1d019706d866 LLVM10 anatofuz parents: diff changeset	403 // CHECK-LABEL: @test_vld1_s64_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	404 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int64x1x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	405 // CHECK-A32: %struct.int64x1x4_t* noalias sret(%struct.int64x1x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	406 // CHECK: [[__RET:%.*]] = alloca %struct.int64x1x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	407 // CHECK: [[TMP0:%.]] = bitcast %struct.int64x1x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	408 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	409 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	410 // CHECK: [[VLD1XN:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	411 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	412 // CHECK: store { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> } [[VLD1XN]], { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	413 // CHECK: [[TMP4:%.]] = bitcast %struct.int64x1x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	414 // CHECK: [[TMP5:%.]] = bitcast %struct.int64x1x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	415 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	416 // CHECK-A64: [[TMP6:%.]] = load %struct.int64x1x4_t, %struct.int64x1x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	417 // CHECK-A64: ret %struct.int64x1x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	418 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	419 int64x1x4_t test_vld1_s64_x4(int64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	420 return vld1_s64_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	421 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	422
1d019706d866 LLVM10 anatofuz parents: diff changeset	423 // CHECK-LABEL: @test_vld1_s8_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	424 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int8x8x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	425 // CHECK-A32: %struct.int8x8x2_t* noalias sret(%struct.int8x8x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	426 // CHECK: [[__RET:%.*]] = alloca %struct.int8x8x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	427 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	428 // CHECK: [[VLD1XN:%.]] = call { <8 x i8>, <8 x i8> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v8i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	429 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	430 // CHECK: store { <8 x i8>, <8 x i8> } [[VLD1XN]], { <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	431 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x8x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	432 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	433 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	434 // CHECK-A64: [[TMP4:%.]] = load %struct.int8x8x2_t, %struct.int8x8x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	435 // CHECK-A64: ret %struct.int8x8x2_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	436 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	437 int8x8x2_t test_vld1_s8_x2(int8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	438 return vld1_s8_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	439 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	440
1d019706d866 LLVM10 anatofuz parents: diff changeset	441 // CHECK-LABEL: @test_vld1_s8_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	442 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int8x8x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	443 // CHECK-A32: %struct.int8x8x3_t* noalias sret(%struct.int8x8x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	444 // CHECK: [[__RET:%.*]] = alloca %struct.int8x8x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	445 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	446 // CHECK: [[VLD1XN:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v8i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	447 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	448 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8> } [[VLD1XN]], { <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	449 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x8x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	450 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	451 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	452 // CHECK-A64: [[TMP4:%.]] = load %struct.int8x8x3_t, %struct.int8x8x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	453 // CHECK-A64: ret %struct.int8x8x3_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	454 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	455 int8x8x3_t test_vld1_s8_x3(int8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	456 return vld1_s8_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	457 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	458
1d019706d866 LLVM10 anatofuz parents: diff changeset	459 // CHECK-LABEL: @test_vld1_s8_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	460 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int8x8x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	461 // CHECK-A32: %struct.int8x8x4_t* noalias sret(%struct.int8x8x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	462 // CHECK: [[__RET:%.*]] = alloca %struct.int8x8x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	463 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	464 // CHECK: [[VLD1XN:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v8i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	465 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	466 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } [[VLD1XN]], { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	467 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x8x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	468 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	469 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	470 // CHECK-A64: [[TMP4:%.]] = load %struct.int8x8x4_t, %struct.int8x8x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	471 // CHECK-A64: ret %struct.int8x8x4_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	472 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	473 int8x8x4_t test_vld1_s8_x4(int8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	474 return vld1_s8_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	475 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	476
1d019706d866 LLVM10 anatofuz parents: diff changeset	477 // CHECK-LABEL: @test_vld1_u16_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	478 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint16x4x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	479 // CHECK-A32: %struct.uint16x4x2_t* noalias sret(%struct.uint16x4x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	480 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x4x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	481 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	482 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	483 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	484 // CHECK: [[VLD1XN:%.]] = call { <4 x i16>, <4 x i16> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	485 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	486 // CHECK: store { <4 x i16>, <4 x i16> } [[VLD1XN]], { <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	487 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x4x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	488 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	489 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	490 // CHECK-A64: [[TMP6:%.]] = load %struct.uint16x4x2_t, %struct.uint16x4x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	491 // CHECK-A64: ret %struct.uint16x4x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	492 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	493 uint16x4x2_t test_vld1_u16_x2(uint16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	494 return vld1_u16_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	495 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	496
1d019706d866 LLVM10 anatofuz parents: diff changeset	497 // CHECK-LABEL: @test_vld1_u16_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	498 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint16x4x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	499 // CHECK-A32: %struct.uint16x4x3_t* noalias sret(%struct.uint16x4x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	500 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x4x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	501 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	502 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	503 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	504 // CHECK: [[VLD1XN:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	505 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	506 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16> } [[VLD1XN]], { <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	507 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x4x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	508 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	509 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	510 // CHECK-A64: [[TMP6:%.]] = load %struct.uint16x4x3_t, %struct.uint16x4x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	511 // CHECK-A64: ret %struct.uint16x4x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	512 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	513 uint16x4x3_t test_vld1_u16_x3(uint16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	514 return vld1_u16_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	515 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	516
1d019706d866 LLVM10 anatofuz parents: diff changeset	517 // CHECK-LABEL: @test_vld1_u16_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	518 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint16x4x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	519 // CHECK-A32: %struct.uint16x4x4_t* noalias sret(%struct.uint16x4x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	520 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x4x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	521 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	522 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	523 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	524 // CHECK: [[VLD1XN:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	525 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	526 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } [[VLD1XN]], { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	527 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x4x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	528 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	529 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	530 // CHECK-A64: [[TMP6:%.]] = load %struct.uint16x4x4_t, %struct.uint16x4x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	531 // CHECK-A64: ret %struct.uint16x4x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	532 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	533 uint16x4x4_t test_vld1_u16_x4(uint16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	534 return vld1_u16_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	535 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	536
1d019706d866 LLVM10 anatofuz parents: diff changeset	537 // CHECK-LABEL: @test_vld1_u32_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	538 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint32x2x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	539 // CHECK-A32: %struct.uint32x2x2_t* noalias sret(%struct.uint32x2x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	540 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x2x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	541 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	542 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	543 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	544 // CHECK: [[VLD1XN:%.]] = call { <2 x i32>, <2 x i32> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	545 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	546 // CHECK: store { <2 x i32>, <2 x i32> } [[VLD1XN]], { <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	547 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x2x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	548 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	549 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	550 // CHECK-A64: [[TMP6:%.]] = load %struct.uint32x2x2_t, %struct.uint32x2x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	551 // CHECK-A64: ret %struct.uint32x2x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	552 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	553 uint32x2x2_t test_vld1_u32_x2(uint32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	554 return vld1_u32_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	555 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	556
1d019706d866 LLVM10 anatofuz parents: diff changeset	557 // CHECK-LABEL: @test_vld1_u32_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	558 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint32x2x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	559 // CHECK-A32: %struct.uint32x2x3_t* noalias sret(%struct.uint32x2x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	560 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x2x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	561 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	562 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	563 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	564 // CHECK: [[VLD1XN:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	565 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	566 // CHECK: store { <2 x i32>, <2 x i32>, <2 x i32> } [[VLD1XN]], { <2 x i32>, <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	567 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x2x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	568 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	569 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	570 // CHECK-A64: [[TMP6:%.]] = load %struct.uint32x2x3_t, %struct.uint32x2x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	571 // CHECK-A64: ret %struct.uint32x2x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	572 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	573 uint32x2x3_t test_vld1_u32_x3(uint32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	574 return vld1_u32_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	575 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	576
1d019706d866 LLVM10 anatofuz parents: diff changeset	577 // CHECK-LABEL: @test_vld1_u32_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	578 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint32x2x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	579 // CHECK-A32: %struct.uint32x2x4_t* noalias sret(%struct.uint32x2x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	580 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x2x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	581 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	582 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	583 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	584 // CHECK: [[VLD1XN:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	585 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	586 // CHECK: store { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> } [[VLD1XN]], { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	587 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x2x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	588 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	589 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	590 // CHECK-A64: [[TMP6:%.]] = load %struct.uint32x2x4_t, %struct.uint32x2x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	591 // CHECK-A64: ret %struct.uint32x2x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	592 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	593 uint32x2x4_t test_vld1_u32_x4(uint32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	594 return vld1_u32_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	595 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	596
1d019706d866 LLVM10 anatofuz parents: diff changeset	597 // CHECK-LABEL: @test_vld1_u64_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	598 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint64x1x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	599 // CHECK-A32: %struct.uint64x1x2_t* noalias sret(%struct.uint64x1x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	600 // CHECK: [[__RET:%.*]] = alloca %struct.uint64x1x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	601 // CHECK: [[TMP0:%.]] = bitcast %struct.uint64x1x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	602 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	603 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	604 // CHECK: [[VLD1XN:%.]] = call { <1 x i64>, <1 x i64> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	605 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	606 // CHECK: store { <1 x i64>, <1 x i64> } [[VLD1XN]], { <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	607 // CHECK: [[TMP4:%.]] = bitcast %struct.uint64x1x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	608 // CHECK: [[TMP5:%.]] = bitcast %struct.uint64x1x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	609 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	610 // CHECK-A64: [[TMP6:%.]] = load %struct.uint64x1x2_t, %struct.uint64x1x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	611 // CHECK-A64: ret %struct.uint64x1x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	612 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	613 uint64x1x2_t test_vld1_u64_x2(uint64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	614 return vld1_u64_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	615 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	616
1d019706d866 LLVM10 anatofuz parents: diff changeset	617 // CHECK-LABEL: @test_vld1_u64_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	618 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint64x1x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	619 // CHECK-A32: %struct.uint64x1x3_t* noalias sret(%struct.uint64x1x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	620 // CHECK: [[__RET:%.*]] = alloca %struct.uint64x1x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	621 // CHECK: [[TMP0:%.]] = bitcast %struct.uint64x1x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	622 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	623 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	624 // CHECK: [[VLD1XN:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	625 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	626 // CHECK: store { <1 x i64>, <1 x i64>, <1 x i64> } [[VLD1XN]], { <1 x i64>, <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	627 // CHECK: [[TMP4:%.]] = bitcast %struct.uint64x1x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	628 // CHECK: [[TMP5:%.]] = bitcast %struct.uint64x1x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	629 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	630 // CHECK-A64: [[TMP6:%.]] = load %struct.uint64x1x3_t, %struct.uint64x1x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	631 // CHECK-A64: ret %struct.uint64x1x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	632 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	633 uint64x1x3_t test_vld1_u64_x3(uint64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	634 return vld1_u64_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	635 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	636
1d019706d866 LLVM10 anatofuz parents: diff changeset	637 // CHECK-LABEL: @test_vld1_u64_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	638 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint64x1x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	639 // CHECK-A32: %struct.uint64x1x4_t* noalias sret(%struct.uint64x1x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	640 // CHECK: [[__RET:%.*]] = alloca %struct.uint64x1x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	641 // CHECK: [[TMP0:%.]] = bitcast %struct.uint64x1x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	642 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	643 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	644 // CHECK: [[VLD1XN:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	645 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	646 // CHECK: store { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> } [[VLD1XN]], { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	647 // CHECK: [[TMP4:%.]] = bitcast %struct.uint64x1x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	648 // CHECK: [[TMP5:%.]] = bitcast %struct.uint64x1x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	649 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	650 // CHECK-A64: [[TMP6:%.]] = load %struct.uint64x1x4_t, %struct.uint64x1x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	651 // CHECK-A64: ret %struct.uint64x1x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	652 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	653 uint64x1x4_t test_vld1_u64_x4(uint64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	654 return vld1_u64_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	655 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	656
1d019706d866 LLVM10 anatofuz parents: diff changeset	657 // CHECK-LABEL: @test_vld1_u8_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	658 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint8x8x2_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	659 // CHECK-A32: %struct.uint8x8x2_t* noalias sret(%struct.uint8x8x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	660 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x8x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	661 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	662 // CHECK: [[VLD1XN:%.]] = call { <8 x i8>, <8 x i8> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v8i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	663 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	664 // CHECK: store { <8 x i8>, <8 x i8> } [[VLD1XN]], { <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	665 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x8x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	666 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	667 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	668 // CHECK-A64: [[TMP4:%.]] = load %struct.uint8x8x2_t, %struct.uint8x8x2_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	669 // CHECK-A64: ret %struct.uint8x8x2_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	670 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	671 uint8x8x2_t test_vld1_u8_x2(uint8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	672 return vld1_u8_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	673 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	674
1d019706d866 LLVM10 anatofuz parents: diff changeset	675 // CHECK-LABEL: @test_vld1_u8_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	676 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint8x8x3_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	677 // CHECK-A32: %struct.uint8x8x3_t* noalias sret(%struct.uint8x8x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	678 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x8x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	679 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	680 // CHECK: [[VLD1XN:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v8i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	681 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	682 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8> } [[VLD1XN]], { <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	683 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x8x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	684 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	685 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	686 // CHECK-A64: [[TMP4:%.]] = load %struct.uint8x8x3_t, %struct.uint8x8x3_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	687 // CHECK-A64: ret %struct.uint8x8x3_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	688 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	689 uint8x8x3_t test_vld1_u8_x3(uint8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	690 return vld1_u8_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	691 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	692
1d019706d866 LLVM10 anatofuz parents: diff changeset	693 // CHECK-LABEL: @test_vld1_u8_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	694 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint8x8x4_t, align 8
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	695 // CHECK-A32: %struct.uint8x8x4_t* noalias sret(%struct.uint8x8x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	696 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x8x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	697 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	698 // CHECK: [[VLD1XN:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v8i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	699 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	700 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } [[VLD1XN]], { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	701 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x8x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	702 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	703 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	704 // CHECK-A64: [[TMP4:%.]] = load %struct.uint8x8x4_t, %struct.uint8x8x4_t [[RETVAL]], align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	705 // CHECK-A64: ret %struct.uint8x8x4_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	706 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	707 uint8x8x4_t test_vld1_u8_x4(uint8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	708 return vld1_u8_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	709 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	710
1d019706d866 LLVM10 anatofuz parents: diff changeset	711 // CHECK-LABEL: @test_vld1q_f16_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	712 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float16x8x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	713 // CHECK-A32: %struct.float16x8x2_t* noalias sret(%struct.float16x8x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	714 // CHECK: [[__RET:%.*]] = alloca %struct.float16x8x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	715 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	716 // CHECK: [[TMP1:%.]] = bitcast half %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	717 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [[HALF]]*
1d019706d866 LLVM10 anatofuz parents: diff changeset	718 // CHECK: [[VLD1XN:%.]] = call { <8 x [[HALF]]>, <8 x [[HALF]]> } @llvm.{{aarch64.neon.ld1x2.v8f16.p0f16\|arm.neon.vld1x2.v8i16.p0i16}}([[HALF]] [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	719 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x [[HALF]]>, <8 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	720 // CHECK: store { <8 x [[HALF]]>, <8 x [[HALF]]> } [[VLD1XN]], { <8 x [[HALF]]>, <8 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	721 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x8x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	722 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	723 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	724 // CHECK-A64: [[TMP6:%.]] = load %struct.float16x8x2_t, %struct.float16x8x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	725 // CHECK-A64: ret %struct.float16x8x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	726 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	727 float16x8x2_t test_vld1q_f16_x2(float16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	728 return vld1q_f16_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	729 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	730
1d019706d866 LLVM10 anatofuz parents: diff changeset	731 // CHECK-LABEL: @test_vld1q_f16_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	732 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float16x8x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	733 // CHECK-A32: %struct.float16x8x3_t* noalias sret(%struct.float16x8x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	734 // CHECK: [[__RET:%.*]] = alloca %struct.float16x8x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	735 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	736 // CHECK: [[TMP1:%.]] = bitcast half %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	737 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [[HALF]]*
1d019706d866 LLVM10 anatofuz parents: diff changeset	738 // CHECK: [[VLD1XN:%.]] = call { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> } @llvm.{{aarch64.neon.ld1x3.v8f16.p0f16\|arm.neon.vld1x3.v8i16.p0i16}}([[HALF]] [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	739 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	740 // CHECK: store { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> } [[VLD1XN]], { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	741 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x8x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	742 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	743 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	744 // CHECK-A64: [[TMP6:%.]] = load %struct.float16x8x3_t, %struct.float16x8x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	745 // CHECK-A64: ret %struct.float16x8x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	746 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	747 float16x8x3_t test_vld1q_f16_x3(float16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	748 return vld1q_f16_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	749 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	750
1d019706d866 LLVM10 anatofuz parents: diff changeset	751 // CHECK-LABEL: @test_vld1q_f16_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	752 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float16x8x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	753 // CHECK-A32: %struct.float16x8x4_t* noalias sret(%struct.float16x8x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	754 // CHECK: [[__RET:%.*]] = alloca %struct.float16x8x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	755 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	756 // CHECK: [[TMP1:%.]] = bitcast half %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	757 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to [[HALF]]*
1d019706d866 LLVM10 anatofuz parents: diff changeset	758 // CHECK: [[VLD1XN:%.]] = call { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> } @llvm.{{aarch64.neon.ld1x4.v8f16.p0f16\|arm.neon.vld1x4.v8i16.p0i16}}([[HALF]] [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	759 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	760 // CHECK: store { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> } [[VLD1XN]], { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	761 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x8x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	762 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	763 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	764 // CHECK-A64: [[TMP6:%.]] = load %struct.float16x8x4_t, %struct.float16x8x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	765 // CHECK-A64: ret %struct.float16x8x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	766 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	767 float16x8x4_t test_vld1q_f16_x4(float16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	768 return vld1q_f16_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	769 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	770
1d019706d866 LLVM10 anatofuz parents: diff changeset	771 // CHECK-LABEL: @test_vld1q_f32_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	772 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float32x4x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	773 // CHECK-A32: %struct.float32x4x2_t* noalias sret(%struct.float32x4x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	774 // CHECK: [[__RET:%.*]] = alloca %struct.float32x4x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	775 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	776 // CHECK: [[TMP1:%.]] = bitcast float %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	777 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	778 // CHECK: [[VLD1XN:%.]] = call { <4 x float>, <4 x float> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v4f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	779 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x float>, <4 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	780 // CHECK: store { <4 x float>, <4 x float> } [[VLD1XN]], { <4 x float>, <4 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	781 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x4x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	782 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	783 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	784 // CHECK-A64: [[TMP6:%.]] = load %struct.float32x4x2_t, %struct.float32x4x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	785 // CHECK-A64: ret %struct.float32x4x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	786 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	787 float32x4x2_t test_vld1q_f32_x2(float32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	788 return vld1q_f32_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	789 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	790
1d019706d866 LLVM10 anatofuz parents: diff changeset	791 // CHECK-LABEL: @test_vld1q_f32_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	792 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float32x4x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	793 // CHECK-A32: %struct.float32x4x3_t* noalias sret(%struct.float32x4x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	794 // CHECK: [[__RET:%.*]] = alloca %struct.float32x4x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	795 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	796 // CHECK: [[TMP1:%.]] = bitcast float %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	797 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	798 // CHECK: [[VLD1XN:%.]] = call { <4 x float>, <4 x float>, <4 x float> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v4f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	799 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x float>, <4 x float>, <4 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	800 // CHECK: store { <4 x float>, <4 x float>, <4 x float> } [[VLD1XN]], { <4 x float>, <4 x float>, <4 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	801 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x4x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	802 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	803 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	804 // CHECK-A64: [[TMP6:%.]] = load %struct.float32x4x3_t, %struct.float32x4x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	805 // CHECK-A64: ret %struct.float32x4x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	806 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	807 float32x4x3_t test_vld1q_f32_x3(float32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	808 return vld1q_f32_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	809 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	810
1d019706d866 LLVM10 anatofuz parents: diff changeset	811 // CHECK-LABEL: @test_vld1q_f32_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	812 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.float32x4x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	813 // CHECK-A32: %struct.float32x4x4_t* noalias sret(%struct.float32x4x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	814 // CHECK: [[__RET:%.*]] = alloca %struct.float32x4x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	815 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	816 // CHECK: [[TMP1:%.]] = bitcast float %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	817 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	818 // CHECK: [[VLD1XN:%.]] = call { <4 x float>, <4 x float>, <4 x float>, <4 x float> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v4f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	819 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x float>, <4 x float>, <4 x float>, <4 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	820 // CHECK: store { <4 x float>, <4 x float>, <4 x float>, <4 x float> } [[VLD1XN]], { <4 x float>, <4 x float>, <4 x float>, <4 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	821 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x4x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	822 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	823 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	824 // CHECK-A64: [[TMP6:%.]] = load %struct.float32x4x4_t, %struct.float32x4x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	825 // CHECK-A64: ret %struct.float32x4x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	826 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	827 float32x4x4_t test_vld1q_f32_x4(float32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	828 return vld1q_f32_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	829 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	830
1d019706d866 LLVM10 anatofuz parents: diff changeset	831 // CHECK-LABEL: @test_vld1q_p16_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	832 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly16x8x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	833 // CHECK-A32: %struct.poly16x8x2_t* noalias sret(%struct.poly16x8x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	834 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x8x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	835 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	836 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	837 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	838 // CHECK: [[VLD1XN:%.]] = call { <8 x i16>, <8 x i16> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	839 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	840 // CHECK: store { <8 x i16>, <8 x i16> } [[VLD1XN]], { <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	841 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x8x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	842 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	843 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	844 // CHECK-A64: [[TMP6:%.]] = load %struct.poly16x8x2_t, %struct.poly16x8x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	845 // CHECK-A64: ret %struct.poly16x8x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	846 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	847 poly16x8x2_t test_vld1q_p16_x2(poly16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	848 return vld1q_p16_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	849 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	850
1d019706d866 LLVM10 anatofuz parents: diff changeset	851 // CHECK-LABEL: @test_vld1q_p16_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	852 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly16x8x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	853 // CHECK-A32: %struct.poly16x8x3_t* noalias sret(%struct.poly16x8x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	854 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x8x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	855 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	856 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	857 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	858 // CHECK: [[VLD1XN:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	859 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	860 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16> } [[VLD1XN]], { <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	861 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x8x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	862 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	863 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	864 // CHECK-A64: [[TMP6:%.]] = load %struct.poly16x8x3_t, %struct.poly16x8x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	865 // CHECK-A64: ret %struct.poly16x8x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	866 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	867 poly16x8x3_t test_vld1q_p16_x3(poly16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	868 return vld1q_p16_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	869 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	870
1d019706d866 LLVM10 anatofuz parents: diff changeset	871 // CHECK-LABEL: @test_vld1q_p16_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	872 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly16x8x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	873 // CHECK-A32: %struct.poly16x8x4_t* noalias sret(%struct.poly16x8x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	874 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x8x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	875 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	876 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	877 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	878 // CHECK: [[VLD1XN:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	879 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	880 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } [[VLD1XN]], { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	881 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x8x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	882 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	883 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	884 // CHECK-A64: [[TMP6:%.]] = load %struct.poly16x8x4_t, %struct.poly16x8x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	885 // CHECK-A64: ret %struct.poly16x8x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	886 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	887 poly16x8x4_t test_vld1q_p16_x4(poly16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	888 return vld1q_p16_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	889 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	890
1d019706d866 LLVM10 anatofuz parents: diff changeset	891 // CHECK-LABEL: @test_vld1q_p8_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	892 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly8x16x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	893 // CHECK-A32: %struct.poly8x16x2_t* noalias sret(%struct.poly8x16x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	894 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x16x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	895 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	896 // CHECK: [[VLD1XN:%.]] = call { <16 x i8>, <16 x i8> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v16i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	897 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	898 // CHECK: store { <16 x i8>, <16 x i8> } [[VLD1XN]], { <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	899 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x16x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	900 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	901 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	902 // CHECK-A64: [[TMP4:%.]] = load %struct.poly8x16x2_t, %struct.poly8x16x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	903 // CHECK-A64: ret %struct.poly8x16x2_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	904 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	905 poly8x16x2_t test_vld1q_p8_x2(poly8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	906 return vld1q_p8_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	907 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	908
1d019706d866 LLVM10 anatofuz parents: diff changeset	909 // CHECK-LABEL: @test_vld1q_p8_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	910 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly8x16x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	911 // CHECK-A32: %struct.poly8x16x3_t* noalias sret(%struct.poly8x16x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	912 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x16x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	913 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	914 // CHECK: [[VLD1XN:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v16i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	915 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	916 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8> } [[VLD1XN]], { <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	917 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x16x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	918 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	919 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	920 // CHECK-A64: [[TMP4:%.]] = load %struct.poly8x16x3_t, %struct.poly8x16x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	921 // CHECK-A64: ret %struct.poly8x16x3_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	922 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	923 poly8x16x3_t test_vld1q_p8_x3(poly8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	924 return vld1q_p8_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	925 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	926
1d019706d866 LLVM10 anatofuz parents: diff changeset	927 // CHECK-LABEL: @test_vld1q_p8_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	928 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.poly8x16x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	929 // CHECK-A32: %struct.poly8x16x4_t* noalias sret(%struct.poly8x16x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	930 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x16x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	931 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	932 // CHECK: [[VLD1XN:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v16i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	933 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	934 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } [[VLD1XN]], { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	935 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x16x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	936 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	937 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	938 // CHECK-A64: [[TMP4:%.]] = load %struct.poly8x16x4_t, %struct.poly8x16x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	939 // CHECK-A64: ret %struct.poly8x16x4_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	940 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	941 poly8x16x4_t test_vld1q_p8_x4(poly8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	942 return vld1q_p8_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	943 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	944
1d019706d866 LLVM10 anatofuz parents: diff changeset	945 // CHECK-LABEL: @test_vld1q_s16_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	946 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int16x8x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	947 // CHECK-A32: %struct.int16x8x2_t* noalias sret(%struct.int16x8x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	948 // CHECK: [[__RET:%.*]] = alloca %struct.int16x8x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	949 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	950 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	951 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	952 // CHECK: [[VLD1XN:%.]] = call { <8 x i16>, <8 x i16> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	953 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	954 // CHECK: store { <8 x i16>, <8 x i16> } [[VLD1XN]], { <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	955 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x8x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	956 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	957 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	958 // CHECK-A64: [[TMP6:%.]] = load %struct.int16x8x2_t, %struct.int16x8x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	959 // CHECK-A64: ret %struct.int16x8x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	960 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	961 int16x8x2_t test_vld1q_s16_x2(int16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	962 return vld1q_s16_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	963 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	964
1d019706d866 LLVM10 anatofuz parents: diff changeset	965 // CHECK-LABEL: @test_vld1q_s16_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	966 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int16x8x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	967 // CHECK-A32: %struct.int16x8x3_t* noalias sret(%struct.int16x8x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	968 // CHECK: [[__RET:%.*]] = alloca %struct.int16x8x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	969 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	970 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	971 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	972 // CHECK: [[VLD1XN:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	973 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	974 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16> } [[VLD1XN]], { <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	975 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x8x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	976 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	977 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	978 // CHECK-A64: [[TMP6:%.]] = load %struct.int16x8x3_t, %struct.int16x8x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	979 // CHECK-A64: ret %struct.int16x8x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	980 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	981 int16x8x3_t test_vld1q_s16_x3(int16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	982 return vld1q_s16_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	983 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	984
1d019706d866 LLVM10 anatofuz parents: diff changeset	985 // CHECK-LABEL: @test_vld1q_s16_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	986 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int16x8x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	987 // CHECK-A32: %struct.int16x8x4_t* noalias sret(%struct.int16x8x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	988 // CHECK: [[__RET:%.*]] = alloca %struct.int16x8x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	989 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	990 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	991 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	992 // CHECK: [[VLD1XN:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	993 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	994 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } [[VLD1XN]], { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	995 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x8x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	996 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	997 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	998 // CHECK-A64: [[TMP6:%.]] = load %struct.int16x8x4_t, %struct.int16x8x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	999 // CHECK-A64: ret %struct.int16x8x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1000 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1001 int16x8x4_t test_vld1q_s16_x4(int16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1002 return vld1q_s16_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1003 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1004
1d019706d866 LLVM10 anatofuz parents: diff changeset	1005 // CHECK-LABEL: @test_vld1q_s32_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1006 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int32x4x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1007 // CHECK-A32: %struct.int32x4x2_t* noalias sret(%struct.int32x4x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1008 // CHECK: [[__RET:%.*]] = alloca %struct.int32x4x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1009 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1010 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1011 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1012 // CHECK: [[VLD1XN:%.]] = call { <4 x i32>, <4 x i32> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1013 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1014 // CHECK: store { <4 x i32>, <4 x i32> } [[VLD1XN]], { <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1015 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x4x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1016 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1017 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1018 // CHECK-A64: [[TMP6:%.]] = load %struct.int32x4x2_t, %struct.int32x4x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1019 // CHECK-A64: ret %struct.int32x4x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1020 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1021 int32x4x2_t test_vld1q_s32_x2(int32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1022 return vld1q_s32_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1023 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1024
1d019706d866 LLVM10 anatofuz parents: diff changeset	1025 // CHECK-LABEL: @test_vld1q_s32_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1026 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int32x4x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1027 // CHECK-A32: %struct.int32x4x3_t* noalias sret(%struct.int32x4x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1028 // CHECK: [[__RET:%.*]] = alloca %struct.int32x4x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1029 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1030 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1031 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1032 // CHECK: [[VLD1XN:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1033 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1034 // CHECK: store { <4 x i32>, <4 x i32>, <4 x i32> } [[VLD1XN]], { <4 x i32>, <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1035 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x4x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1036 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1037 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1038 // CHECK-A64: [[TMP6:%.]] = load %struct.int32x4x3_t, %struct.int32x4x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1039 // CHECK-A64: ret %struct.int32x4x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1040 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1041 int32x4x3_t test_vld1q_s32_x3(int32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1042 return vld1q_s32_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1043 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1044
1d019706d866 LLVM10 anatofuz parents: diff changeset	1045 // CHECK-LABEL: @test_vld1q_s32_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1046 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int32x4x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1047 // CHECK-A32: %struct.int32x4x4_t* noalias sret(%struct.int32x4x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1048 // CHECK: [[__RET:%.*]] = alloca %struct.int32x4x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1049 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1050 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1051 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1052 // CHECK: [[VLD1XN:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1053 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1054 // CHECK: store { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> } [[VLD1XN]], { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1055 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x4x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1056 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1057 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1058 // CHECK-A64: [[TMP6:%.]] = load %struct.int32x4x4_t, %struct.int32x4x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1059 // CHECK-A64: ret %struct.int32x4x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1060 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1061 int32x4x4_t test_vld1q_s32_x4(int32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1062 return vld1q_s32_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1063 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1064
1d019706d866 LLVM10 anatofuz parents: diff changeset	1065 // CHECK-LABEL: @test_vld1q_s64_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1066 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int64x2x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1067 // CHECK-A32: %struct.int64x2x2_t* noalias sret(%struct.int64x2x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1068 // CHECK: [[__RET:%.*]] = alloca %struct.int64x2x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1069 // CHECK: [[TMP0:%.]] = bitcast %struct.int64x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1070 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1071 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1072 // CHECK: [[VLD1XN:%.]] = call { <2 x i64>, <2 x i64> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v2i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1073 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i64>, <2 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1074 // CHECK: store { <2 x i64>, <2 x i64> } [[VLD1XN]], { <2 x i64>, <2 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1075 // CHECK: [[TMP4:%.]] = bitcast %struct.int64x2x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1076 // CHECK: [[TMP5:%.]] = bitcast %struct.int64x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1077 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1078 // CHECK-A64: [[TMP6:%.]] = load %struct.int64x2x2_t, %struct.int64x2x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1079 // CHECK-A64: ret %struct.int64x2x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1080 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1081 int64x2x2_t test_vld1q_s64_x2(int64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1082 return vld1q_s64_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1083 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1084
1d019706d866 LLVM10 anatofuz parents: diff changeset	1085 // CHECK-LABEL: @test_vld1q_s64_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1086 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int64x2x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1087 // CHECK-A32: %struct.int64x2x3_t* noalias sret(%struct.int64x2x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1088 // CHECK: [[__RET:%.*]] = alloca %struct.int64x2x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1089 // CHECK: [[TMP0:%.]] = bitcast %struct.int64x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1090 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1091 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1092 // CHECK: [[VLD1XN:%.]] = call { <2 x i64>, <2 x i64>, <2 x i64> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v2i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1093 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i64>, <2 x i64>, <2 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1094 // CHECK: store { <2 x i64>, <2 x i64>, <2 x i64> } [[VLD1XN]], { <2 x i64>, <2 x i64>, <2 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1095 // CHECK: [[TMP4:%.]] = bitcast %struct.int64x2x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1096 // CHECK: [[TMP5:%.]] = bitcast %struct.int64x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1097 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1098 // CHECK-A64: [[TMP6:%.]] = load %struct.int64x2x3_t, %struct.int64x2x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1099 // CHECK-A64: ret %struct.int64x2x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1100 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1101 int64x2x3_t test_vld1q_s64_x3(int64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1102 return vld1q_s64_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1103 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1104
1d019706d866 LLVM10 anatofuz parents: diff changeset	1105 // CHECK-LABEL: @test_vld1q_s64_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1106 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int64x2x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1107 // CHECK-A32: %struct.int64x2x4_t* noalias sret(%struct.int64x2x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1108 // CHECK: [[__RET:%.*]] = alloca %struct.int64x2x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1109 // CHECK: [[TMP0:%.]] = bitcast %struct.int64x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1110 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1111 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1112 // CHECK: [[VLD1XN:%.]] = call { <2 x i64>, <2 x i64>, <2 x i64>, <2 x i64> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v2i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1113 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i64>, <2 x i64>, <2 x i64>, <2 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1114 // CHECK: store { <2 x i64>, <2 x i64>, <2 x i64>, <2 x i64> } [[VLD1XN]], { <2 x i64>, <2 x i64>, <2 x i64>, <2 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1115 // CHECK: [[TMP4:%.]] = bitcast %struct.int64x2x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1116 // CHECK: [[TMP5:%.]] = bitcast %struct.int64x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1117 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1118 // CHECK-A64: [[TMP6:%.]] = load %struct.int64x2x4_t, %struct.int64x2x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1119 // CHECK-A64: ret %struct.int64x2x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1120 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1121 int64x2x4_t test_vld1q_s64_x4(int64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1122 return vld1q_s64_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1123 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1124
1d019706d866 LLVM10 anatofuz parents: diff changeset	1125 // CHECK-LABEL: @test_vld1q_s8_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1126 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int8x16x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1127 // CHECK-A32: %struct.int8x16x2_t* noalias sret(%struct.int8x16x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1128 // CHECK: [[__RET:%.*]] = alloca %struct.int8x16x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1129 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1130 // CHECK: [[VLD1XN:%.]] = call { <16 x i8>, <16 x i8> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v16i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1131 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1132 // CHECK: store { <16 x i8>, <16 x i8> } [[VLD1XN]], { <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1133 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x16x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1134 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1135 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1136 // CHECK-A64: [[TMP4:%.]] = load %struct.int8x16x2_t, %struct.int8x16x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1137 // CHECK-A64: ret %struct.int8x16x2_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1138 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1139 int8x16x2_t test_vld1q_s8_x2(int8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1140 return vld1q_s8_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1141 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1142
1d019706d866 LLVM10 anatofuz parents: diff changeset	1143 // CHECK-LABEL: @test_vld1q_s8_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1144 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int8x16x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1145 // CHECK-A32: %struct.int8x16x3_t* noalias sret(%struct.int8x16x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1146 // CHECK: [[__RET:%.*]] = alloca %struct.int8x16x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1147 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1148 // CHECK: [[VLD1XN:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v16i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1149 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1150 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8> } [[VLD1XN]], { <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1151 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x16x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1152 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1153 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1154 // CHECK-A64: [[TMP4:%.]] = load %struct.int8x16x3_t, %struct.int8x16x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1155 // CHECK-A64: ret %struct.int8x16x3_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1156 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1157 int8x16x3_t test_vld1q_s8_x3(int8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1158 return vld1q_s8_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1159 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1160
1d019706d866 LLVM10 anatofuz parents: diff changeset	1161 // CHECK-LABEL: @test_vld1q_s8_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1162 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.int8x16x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1163 // CHECK-A32: %struct.int8x16x4_t* noalias sret(%struct.int8x16x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1164 // CHECK: [[__RET:%.*]] = alloca %struct.int8x16x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1165 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1166 // CHECK: [[VLD1XN:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v16i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1167 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1168 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } [[VLD1XN]], { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1169 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x16x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1170 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1171 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1172 // CHECK-A64: [[TMP4:%.]] = load %struct.int8x16x4_t, %struct.int8x16x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1173 // CHECK-A64: ret %struct.int8x16x4_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1174 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1175 int8x16x4_t test_vld1q_s8_x4(int8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1176 return vld1q_s8_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1177 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1178
1d019706d866 LLVM10 anatofuz parents: diff changeset	1179 // CHECK-LABEL: @test_vld1q_u16_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1180 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint16x8x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1181 // CHECK-A32: %struct.uint16x8x2_t* noalias sret(%struct.uint16x8x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1182 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x8x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1183 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1184 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1185 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1186 // CHECK: [[VLD1XN:%.]] = call { <8 x i16>, <8 x i16> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1187 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1188 // CHECK: store { <8 x i16>, <8 x i16> } [[VLD1XN]], { <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1189 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x8x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1190 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1191 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1192 // CHECK-A64: [[TMP6:%.]] = load %struct.uint16x8x2_t, %struct.uint16x8x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1193 // CHECK-A64: ret %struct.uint16x8x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1194 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1195 uint16x8x2_t test_vld1q_u16_x2(uint16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1196 return vld1q_u16_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1197 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1198
1d019706d866 LLVM10 anatofuz parents: diff changeset	1199 // CHECK-LABEL: @test_vld1q_u16_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1200 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint16x8x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1201 // CHECK-A32: %struct.uint16x8x3_t* noalias sret(%struct.uint16x8x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1202 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x8x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1203 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1204 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1205 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1206 // CHECK: [[VLD1XN:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1207 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1208 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16> } [[VLD1XN]], { <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1209 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x8x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1210 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1211 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1212 // CHECK-A64: [[TMP6:%.]] = load %struct.uint16x8x3_t, %struct.uint16x8x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1213 // CHECK-A64: ret %struct.uint16x8x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1214 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1215 uint16x8x3_t test_vld1q_u16_x3(uint16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1216 return vld1q_u16_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1217 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1218
1d019706d866 LLVM10 anatofuz parents: diff changeset	1219 // CHECK-LABEL: @test_vld1q_u16_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1220 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint16x8x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1221 // CHECK-A32: %struct.uint16x8x4_t* noalias sret(%struct.uint16x8x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1222 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x8x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1223 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1224 // CHECK: [[TMP1:%.]] = bitcast i16 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1225 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1226 // CHECK: [[VLD1XN:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1227 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1228 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } [[VLD1XN]], { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1229 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x8x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1230 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1231 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1232 // CHECK-A64: [[TMP6:%.]] = load %struct.uint16x8x4_t, %struct.uint16x8x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1233 // CHECK-A64: ret %struct.uint16x8x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1234 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1235 uint16x8x4_t test_vld1q_u16_x4(uint16_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1236 return vld1q_u16_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1237 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1238
1d019706d866 LLVM10 anatofuz parents: diff changeset	1239 // CHECK-LABEL: @test_vld1q_u32_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1240 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint32x4x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1241 // CHECK-A32: %struct.uint32x4x2_t* noalias sret(%struct.uint32x4x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1242 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x4x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1243 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1244 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1245 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1246 // CHECK: [[VLD1XN:%.]] = call { <4 x i32>, <4 x i32> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1247 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1248 // CHECK: store { <4 x i32>, <4 x i32> } [[VLD1XN]], { <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1249 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x4x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1250 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1251 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1252 // CHECK-A64: [[TMP6:%.]] = load %struct.uint32x4x2_t, %struct.uint32x4x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1253 // CHECK-A64: ret %struct.uint32x4x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1254 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1255 uint32x4x2_t test_vld1q_u32_x2(uint32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1256 return vld1q_u32_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1257 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1258
1d019706d866 LLVM10 anatofuz parents: diff changeset	1259 // CHECK-LABEL: @test_vld1q_u32_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1260 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint32x4x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1261 // CHECK-A32: %struct.uint32x4x3_t* noalias sret(%struct.uint32x4x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1262 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x4x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1263 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1264 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1265 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1266 // CHECK: [[VLD1XN:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1267 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1268 // CHECK: store { <4 x i32>, <4 x i32>, <4 x i32> } [[VLD1XN]], { <4 x i32>, <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1269 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x4x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1270 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1271 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1272 // CHECK-A64: [[TMP6:%.]] = load %struct.uint32x4x3_t, %struct.uint32x4x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1273 // CHECK-A64: ret %struct.uint32x4x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1274 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1275 uint32x4x3_t test_vld1q_u32_x3(uint32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1276 return vld1q_u32_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1277 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1278
1d019706d866 LLVM10 anatofuz parents: diff changeset	1279 // CHECK-LABEL: @test_vld1q_u32_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1280 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint32x4x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1281 // CHECK-A32: %struct.uint32x4x4_t* noalias sret(%struct.uint32x4x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1282 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x4x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1283 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1284 // CHECK: [[TMP1:%.]] = bitcast i32 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1285 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1286 // CHECK: [[VLD1XN:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1287 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1288 // CHECK: store { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> } [[VLD1XN]], { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1289 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x4x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1290 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1291 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1292 // CHECK-A64: [[TMP6:%.]] = load %struct.uint32x4x4_t, %struct.uint32x4x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1293 // CHECK-A64: ret %struct.uint32x4x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1294 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1295 uint32x4x4_t test_vld1q_u32_x4(uint32_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1296 return vld1q_u32_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1297 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1298
1d019706d866 LLVM10 anatofuz parents: diff changeset	1299 // CHECK-LABEL: @test_vld1q_u64_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1300 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint64x2x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1301 // CHECK-A32: %struct.uint64x2x2_t* noalias sret(%struct.uint64x2x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1302 // CHECK: [[__RET:%.*]] = alloca %struct.uint64x2x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1303 // CHECK: [[TMP0:%.]] = bitcast %struct.uint64x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1304 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1305 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1306 // CHECK: [[VLD1XN:%.]] = call { <2 x i64>, <2 x i64> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v2i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1307 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i64>, <2 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1308 // CHECK: store { <2 x i64>, <2 x i64> } [[VLD1XN]], { <2 x i64>, <2 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1309 // CHECK: [[TMP4:%.]] = bitcast %struct.uint64x2x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1310 // CHECK: [[TMP5:%.]] = bitcast %struct.uint64x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1311 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1312 // CHECK-A64: [[TMP6:%.]] = load %struct.uint64x2x2_t, %struct.uint64x2x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1313 // CHECK-A64: ret %struct.uint64x2x2_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1314 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1315 uint64x2x2_t test_vld1q_u64_x2(uint64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1316 return vld1q_u64_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1317 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1318
1d019706d866 LLVM10 anatofuz parents: diff changeset	1319 // CHECK-LABEL: @test_vld1q_u64_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1320 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint64x2x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1321 // CHECK-A32: %struct.uint64x2x3_t* noalias sret(%struct.uint64x2x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1322 // CHECK: [[__RET:%.*]] = alloca %struct.uint64x2x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1323 // CHECK: [[TMP0:%.]] = bitcast %struct.uint64x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1324 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1325 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1326 // CHECK: [[VLD1XN:%.]] = call { <2 x i64>, <2 x i64>, <2 x i64> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v2i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1327 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i64>, <2 x i64>, <2 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1328 // CHECK: store { <2 x i64>, <2 x i64>, <2 x i64> } [[VLD1XN]], { <2 x i64>, <2 x i64>, <2 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1329 // CHECK: [[TMP4:%.]] = bitcast %struct.uint64x2x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1330 // CHECK: [[TMP5:%.]] = bitcast %struct.uint64x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1331 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1332 // CHECK-A64: [[TMP6:%.]] = load %struct.uint64x2x3_t, %struct.uint64x2x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1333 // CHECK-A64: ret %struct.uint64x2x3_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1334 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1335 uint64x2x3_t test_vld1q_u64_x3(uint64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1336 return vld1q_u64_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1337 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1338
1d019706d866 LLVM10 anatofuz parents: diff changeset	1339 // CHECK-LABEL: @test_vld1q_u64_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1340 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint64x2x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1341 // CHECK-A32: %struct.uint64x2x4_t* noalias sret(%struct.uint64x2x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1342 // CHECK: [[__RET:%.*]] = alloca %struct.uint64x2x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1343 // CHECK: [[TMP0:%.]] = bitcast %struct.uint64x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1344 // CHECK: [[TMP1:%.]] = bitcast i64 %a to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1345 // CHECK: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1346 // CHECK: [[VLD1XN:%.]] = call { <2 x i64>, <2 x i64>, <2 x i64>, <2 x i64> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v2i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1347 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i64>, <2 x i64>, <2 x i64>, <2 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1348 // CHECK: store { <2 x i64>, <2 x i64>, <2 x i64>, <2 x i64> } [[VLD1XN]], { <2 x i64>, <2 x i64>, <2 x i64>, <2 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1349 // CHECK: [[TMP4:%.]] = bitcast %struct.uint64x2x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1350 // CHECK: [[TMP5:%.]] = bitcast %struct.uint64x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1351 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1352 // CHECK-A64: [[TMP6:%.]] = load %struct.uint64x2x4_t, %struct.uint64x2x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1353 // CHECK-A64: ret %struct.uint64x2x4_t [[TMP6]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1354 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1355 uint64x2x4_t test_vld1q_u64_x4(uint64_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1356 return vld1q_u64_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1357 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1358
1d019706d866 LLVM10 anatofuz parents: diff changeset	1359 // CHECK-LABEL: @test_vld1q_u8_x2(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1360 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint8x16x2_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1361 // CHECK-A32: %struct.uint8x16x2_t* noalias sret(%struct.uint8x16x2_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1362 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x16x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1363 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1364 // CHECK: [[VLD1XN:%.]] = call { <16 x i8>, <16 x i8> } @llvm.{{aarch64.neon.ld1x2\|arm.neon.vld1x2}}.v16i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1365 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1366 // CHECK: store { <16 x i8>, <16 x i8> } [[VLD1XN]], { <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1367 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x16x2_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1368 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1369 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1370 // CHECK-A64: [[TMP4:%.]] = load %struct.uint8x16x2_t, %struct.uint8x16x2_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1371 // CHECK-A64: ret %struct.uint8x16x2_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1372 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1373 uint8x16x2_t test_vld1q_u8_x2(uint8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1374 return vld1q_u8_x2(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1375 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1376
1d019706d866 LLVM10 anatofuz parents: diff changeset	1377 // CHECK-LABEL: @test_vld1q_u8_x3(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1378 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint8x16x3_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1379 // CHECK-A32: %struct.uint8x16x3_t* noalias sret(%struct.uint8x16x3_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1380 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x16x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1381 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1382 // CHECK: [[VLD1XN:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8> } @llvm.{{aarch64.neon.ld1x3\|arm.neon.vld1x3}}.v16i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1383 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1384 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8> } [[VLD1XN]], { <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1385 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x16x3_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1386 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1387 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1388 // CHECK-A64: [[TMP4:%.]] = load %struct.uint8x16x3_t, %struct.uint8x16x3_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1389 // CHECK-A64: ret %struct.uint8x16x3_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1390 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1391 uint8x16x3_t test_vld1q_u8_x3(uint8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1392 return vld1q_u8_x3(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1393 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1394
1d019706d866 LLVM10 anatofuz parents: diff changeset	1395 // CHECK-LABEL: @test_vld1q_u8_x4(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1396 // CHECK-A64: [[RETVAL:%.*]] = alloca %struct.uint8x16x4_t, align 16
207 2e18cbf3894f LLVM12 Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 173 diff changeset	1397 // CHECK-A32: %struct.uint8x16x4_t* noalias sret(%struct.uint8x16x4_t) align 8 [[RETVAL:%.*]],
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1398 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x16x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	1399 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1400 // CHECK: [[VLD1XN:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } @llvm.{{aarch64.neon.ld1x4\|arm.neon.vld1x4}}.v16i8.p0i8(i8 %a)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1401 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1402 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } [[VLD1XN]], { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1403 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x16x4_t [[RETVAL]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1404 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1405 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1406 // CHECK-A64: [[TMP4:%.]] = load %struct.uint8x16x4_t, %struct.uint8x16x4_t [[RETVAL]], align 16
1d019706d866 LLVM10 anatofuz parents: diff changeset	1407 // CHECK-A64: ret %struct.uint8x16x4_t [[TMP4]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1408 // CHECK-A32: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1409 uint8x16x4_t test_vld1q_u8_x4(uint8_t const *a) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1410 return vld1q_u8_x4(a);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1411 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1412
1d019706d866 LLVM10 anatofuz parents: diff changeset	1413 // CHECK-LABEL: @test_vld2_dup_f16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1414 // CHECK: [[__RET:%.*]] = alloca %struct.float16x4x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1415 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1416 // CHECK: [[TMP1:%.]] = bitcast half %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1417 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to half*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1418 // CHECK-A64: [[VLD2:%.]] = call { <4 x half>, <4 x half> } @llvm.aarch64.neon.ld2r.v4f16.p0f16(half [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1419 // CHECK-A32: [[VLD2:%.]] = call { <4 x i16>, <4 x i16> } @llvm.arm.neon.vld2dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1420 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x [[HALF]]>, <4 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1421 // CHECK: store { <4 x [[HALF]]>, <4 x [[HALF]]> } [[VLD2]], { <4 x [[HALF]]>, <4 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1422 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x4x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1423 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1424 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1425 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1426 void test_vld2_dup_f16(float16x4x2_t dest, const float16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1427 *dest = vld2_dup_f16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1428 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1429
1d019706d866 LLVM10 anatofuz parents: diff changeset	1430 // CHECK-LABEL: @test_vld2_dup_f32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1431 // CHECK: [[__RET:%.*]] = alloca %struct.float32x2x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1432 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1433 // CHECK: [[TMP1:%.]] = bitcast float %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1434 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1435 // CHECK-A64: [[VLD2:%.]] = call { <2 x float>, <2 x float> } @llvm.aarch64.neon.ld2r.v2f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1436 // CHECK-A32: [[VLD2:%.]] = call { <2 x float>, <2 x float> } @llvm.arm.neon.vld2dup.v2f32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1437 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x float>, <2 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1438 // CHECK: store { <2 x float>, <2 x float> } [[VLD2]], { <2 x float>, <2 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1439 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x2x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1440 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1441 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1442 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1443 void test_vld2_dup_f32(float32x2x2_t dest, const float32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1444 *dest = vld2_dup_f32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1445 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1446
1d019706d866 LLVM10 anatofuz parents: diff changeset	1447 // CHECK-LABEL: @test_vld2_dup_p16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1448 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x4x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1449 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1450 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1451 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1452 // CHECK-A64: [[VLD2:%.]] = call { <4 x i16>, <4 x i16> } @llvm.aarch64.neon.ld2r.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1453 // CHECK-A32: [[VLD2:%.]] = call { <4 x i16>, <4 x i16> } @llvm.arm.neon.vld2dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1454 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1455 // CHECK: store { <4 x i16>, <4 x i16> } [[VLD2]], { <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1456 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x4x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1457 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1458 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1459 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1460 void test_vld2_dup_p16(poly16x4x2_t dest, const poly16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1461 *dest = vld2_dup_p16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1462 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1463
1d019706d866 LLVM10 anatofuz parents: diff changeset	1464 // CHECK-LABEL: @test_vld2_dup_p8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1465 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x8x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1466 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1467 // CHECK-A64: [[VLD2:%.]] = call { <8 x i8>, <8 x i8> } @llvm.aarch64.neon.ld2r.v8i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1468 // CHECK-A32: [[VLD2:%.]] = call { <8 x i8>, <8 x i8> } @llvm.arm.neon.vld2dup.v8i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1469 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1470 // CHECK: store { <8 x i8>, <8 x i8> } [[VLD2]], { <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1471 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x8x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1472 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1473 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1474 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1475 void test_vld2_dup_p8(poly8x8x2_t dest, poly8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1476 *dest = vld2_dup_p8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1477 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1478
1d019706d866 LLVM10 anatofuz parents: diff changeset	1479 // CHECK-LABEL: @test_vld2_dup_s16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1480 // CHECK: [[__RET:%.*]] = alloca %struct.int16x4x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1481 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1482 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1483 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1484 // CHECK-A64: [[VLD2:%.]] = call { <4 x i16>, <4 x i16> } @llvm.aarch64.neon.ld2r.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1485 // CHECK-A32: [[VLD2:%.]] = call { <4 x i16>, <4 x i16> } @llvm.arm.neon.vld2dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1486 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1487 // CHECK: store { <4 x i16>, <4 x i16> } [[VLD2]], { <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1488 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x4x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1489 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1490 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1491 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1492 void test_vld2_dup_s16(int16x4x2_t dest, const int16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1493 *dest = vld2_dup_s16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1494 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1495
1d019706d866 LLVM10 anatofuz parents: diff changeset	1496 // CHECK-LABEL: @test_vld2_dup_s32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1497 // CHECK: [[__RET:%.*]] = alloca %struct.int32x2x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1498 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1499 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1500 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1501 // CHECK-A64: [[VLD2:%.]] = call { <2 x i32>, <2 x i32> } @llvm.aarch64.neon.ld2r.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1502 // CHECK-A32: [[VLD2:%.]] = call { <2 x i32>, <2 x i32> } @llvm.arm.neon.vld2dup.v2i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1503 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1504 // CHECK: store { <2 x i32>, <2 x i32> } [[VLD2]], { <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1505 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x2x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1506 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1507 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1508 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1509 void test_vld2_dup_s32(int32x2x2_t dest, const int32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1510 *dest = vld2_dup_s32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1511 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1512
1d019706d866 LLVM10 anatofuz parents: diff changeset	1513 // CHECK-LABEL: @test_vld2_dup_s8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1514 // CHECK: [[__RET:%.*]] = alloca %struct.int8x8x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1515 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1516 // CHECK-A64: [[VLD2:%.]] = call { <8 x i8>, <8 x i8> } @llvm.aarch64.neon.ld2r.v8i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1517 // CHECK-A32: [[VLD2:%.]] = call { <8 x i8>, <8 x i8> } @llvm.arm.neon.vld2dup.v8i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1518 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1519 // CHECK: store { <8 x i8>, <8 x i8> } [[VLD2]], { <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1520 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x8x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1521 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1522 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1523 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1524 void test_vld2_dup_s8(int8x8x2_t dest, int8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1525 *dest = vld2_dup_s8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1526 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1527
1d019706d866 LLVM10 anatofuz parents: diff changeset	1528 // CHECK-LABEL: @test_vld2_dup_u16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1529 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x4x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1530 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1531 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1532 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1533 // CHECK-A64: [[VLD2:%.]] = call { <4 x i16>, <4 x i16> } @llvm.aarch64.neon.ld2r.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1534 // CHECK-A32: [[VLD2:%.]] = call { <4 x i16>, <4 x i16> } @llvm.arm.neon.vld2dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1535 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1536 // CHECK: store { <4 x i16>, <4 x i16> } [[VLD2]], { <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1537 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x4x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1538 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1539 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1540 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1541 void test_vld2_dup_u16(uint16x4x2_t dest, const uint16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1542 *dest = vld2_dup_u16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1543 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1544
1d019706d866 LLVM10 anatofuz parents: diff changeset	1545 // CHECK-LABEL: @test_vld2_dup_u32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1546 // CHECK: entry:
1d019706d866 LLVM10 anatofuz parents: diff changeset	1547 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x2x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1548 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1549 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1550 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1551 // CHECK-A64: [[VLD2:%.]] = call { <2 x i32>, <2 x i32> } @llvm.aarch64.neon.ld2r.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1552 // CHECK-A32: [[VLD2:%.]] = call { <2 x i32>, <2 x i32> } @llvm.arm.neon.vld2dup.v2i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1553 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1554 // CHECK: store { <2 x i32>, <2 x i32> } [[VLD2]], { <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1555 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x2x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1556 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x2x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1557 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1558 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1559 void test_vld2_dup_u32(uint32x2x2_t dest, const uint32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1560 *dest = vld2_dup_u32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1561 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1562
1d019706d866 LLVM10 anatofuz parents: diff changeset	1563 // CHECK-LABEL: @test_vld2_dup_s64(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1564 // CHECK: [[__RET:%.*]] = alloca %struct.int64x1x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1565 // CHECK: [[TMP0:%.]] = bitcast %struct.int64x1x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1566 // CHECK: [[TMP1:%.]] = bitcast i64 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1567 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1568 // CHECK-A64: [[VLD2:%.]] = call { <1 x i64>, <1 x i64> } @llvm.aarch64.neon.ld2r.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1569 // CHECK-A32: [[VLD2:%.]] = call { <1 x i64>, <1 x i64> } @llvm.arm.neon.vld2dup.v1i64.p0i8(i8 [[TMP1]], i32 8)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1570 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1571 // CHECK: store { <1 x i64>, <1 x i64> } [[VLD2]], { <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1572 // CHECK: [[TMP4:%.]] = bitcast %struct.int64x1x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1573 // CHECK: [[TMP5:%.]] = bitcast %struct.int64x1x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1574 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1575 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1576 void test_vld2_dup_s64(int64x1x2_t dest, const int64_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1577 *dest = vld2_dup_s64(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1578 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1579
1d019706d866 LLVM10 anatofuz parents: diff changeset	1580 // CHECK-LABEL: @test_vld2_dup_u64(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1581 // CHECK: [[__RET:%.*]] = alloca %struct.uint64x1x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1582 // CHECK: [[TMP0:%.]] = bitcast %struct.uint64x1x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1583 // CHECK: [[TMP1:%.]] = bitcast i64 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1584 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1585 // CHECK-A64: [[VLD2:%.]] = call { <1 x i64>, <1 x i64> } @llvm.aarch64.neon.ld2r.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1586 // CHECK-A32: [[VLD2:%.]] = call { <1 x i64>, <1 x i64> } @llvm.arm.neon.vld2dup.v1i64.p0i8(i8 [[TMP1]], i32 8)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1587 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1588 // CHECK: store { <1 x i64>, <1 x i64> } [[VLD2]], { <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1589 // CHECK: [[TMP4:%.]] = bitcast %struct.uint64x1x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1590 // CHECK: [[TMP5:%.]] = bitcast %struct.uint64x1x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1591 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1592 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1593 void test_vld2_dup_u64(uint64x1x2_t dest, const uint64_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1594 *dest = vld2_dup_u64(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1595 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1596
1d019706d866 LLVM10 anatofuz parents: diff changeset	1597 // CHECK-LABEL: @test_vld2_dup_u8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1598 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x8x2_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1599 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1600 // CHECK-A64: [[VLD2:%.]] = call { <8 x i8>, <8 x i8> } @llvm.aarch64.neon.ld2r.v8i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1601 // CHECK-A32: [[VLD2:%.]] = call { <8 x i8>, <8 x i8> } @llvm.arm.neon.vld2dup.v8i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1602 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1603 // CHECK: store { <8 x i8>, <8 x i8> } [[VLD2]], { <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1604 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x8x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1605 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1606 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 16, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1607 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1608 void test_vld2_dup_u8(uint8x8x2_t dest, const uint8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1609 *dest = vld2_dup_u8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1610 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1611
1d019706d866 LLVM10 anatofuz parents: diff changeset	1612 // CHECK-LABEL: @test_vld3_dup_f16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1613 // CHECK: [[__RET:%.*]] = alloca %struct.float16x4x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1614 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1615 // CHECK: [[TMP1:%.]] = bitcast half %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1616 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to half*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1617 // CHECK-A64: [[VLD3:%.]] = call { <4 x half>, <4 x half>, <4 x half> } @llvm.aarch64.neon.ld3r.v4f16.p0f16(half [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1618 // CHECK-A32: [[VLD3:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16> } @llvm.arm.neon.vld3dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1619 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1620 // CHECK: store { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> } [[VLD3]], { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1621 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x4x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1622 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1623 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1624 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1625 void test_vld3_dup_f16(float16x4x3_t dest, float16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1626 *dest = vld3_dup_f16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1627 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1628
1d019706d866 LLVM10 anatofuz parents: diff changeset	1629 // CHECK-LABEL: @test_vld3_dup_f32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1630 // CHECK: [[__RET:%.*]] = alloca %struct.float32x2x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1631 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1632 // CHECK: [[TMP1:%.]] = bitcast float %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1633 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1634 // CHECK-A64: [[VLD3:%.]] = call { <2 x float>, <2 x float>, <2 x float> } @llvm.aarch64.neon.ld3r.v2f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1635 // CHECK-A32: [[VLD3:%.]] = call { <2 x float>, <2 x float>, <2 x float> } @llvm.arm.neon.vld3dup.v2f32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1636 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x float>, <2 x float>, <2 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1637 // CHECK: store { <2 x float>, <2 x float>, <2 x float> } [[VLD3]], { <2 x float>, <2 x float>, <2 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1638 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x2x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1639 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1640 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1641 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1642 void test_vld3_dup_f32(float32x2x3_t dest, const float32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1643 *dest = vld3_dup_f32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1644 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1645
1d019706d866 LLVM10 anatofuz parents: diff changeset	1646 // CHECK-LABEL: @test_vld3_dup_p16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1647 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x4x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1648 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1649 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1650 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1651 // CHECK-A64: [[VLD3:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16> } @llvm.aarch64.neon.ld3r.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1652 // CHECK-A32: [[VLD3:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16> } @llvm.arm.neon.vld3dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1653 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1654 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16> } [[VLD3]], { <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1655 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x4x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1656 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1657 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1658 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1659 void test_vld3_dup_p16(poly16x4x3_t dest, const poly16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1660 *dest = vld3_dup_p16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1661 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1662
1d019706d866 LLVM10 anatofuz parents: diff changeset	1663 // CHECK-LABEL: @test_vld3_dup_p8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1664 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x8x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1665 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1666 // CHECK-A64: [[VLD3:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8> } @llvm.aarch64.neon.ld3r.v8i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1667 // CHECK-A32: [[VLD3:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8> } @llvm.arm.neon.vld3dup.v8i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1668 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1669 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8> } [[VLD3]], { <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1670 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x8x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1671 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1672 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1673 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1674 void test_vld3_dup_p8(poly8x8x3_t dest, const poly8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1675 *dest = vld3_dup_p8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1676 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1677
1d019706d866 LLVM10 anatofuz parents: diff changeset	1678 // CHECK-LABEL: @test_vld3_dup_s16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1679 // CHECK: [[__RET:%.*]] = alloca %struct.int16x4x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1680 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1681 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1682 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1683 // CHECK-A64: [[VLD3:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16> } @llvm.aarch64.neon.ld3r.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1684 // CHECK-A32: [[VLD3:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16> } @llvm.arm.neon.vld3dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1685 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1686 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16> } [[VLD3]], { <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1687 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x4x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1688 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1689 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1690 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1691 void test_vld3_dup_s16(int16x4x3_t dest, const int16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1692 *dest = vld3_dup_s16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1693 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1694
1d019706d866 LLVM10 anatofuz parents: diff changeset	1695 // CHECK-LABEL: @test_vld3_dup_s32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1696 // CHECK: [[__RET:%.*]] = alloca %struct.int32x2x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1697 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1698 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1699 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1700 // CHECK-A64: [[VLD3:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32> } @llvm.aarch64.neon.ld3r.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1701 // CHECK-A32: [[VLD3:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32> } @llvm.arm.neon.vld3dup.v2i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1702 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1703 // CHECK: store { <2 x i32>, <2 x i32>, <2 x i32> } [[VLD3]], { <2 x i32>, <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1704 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x2x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1705 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1706 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1707 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1708 void test_vld3_dup_s32(int32x2x3_t dest, const int32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1709 *dest = vld3_dup_s32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1710 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1711
1d019706d866 LLVM10 anatofuz parents: diff changeset	1712 // CHECK-LABEL: @test_vld3_dup_s8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1713 // CHECK: [[__RET:%.*]] = alloca %struct.int8x8x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1714 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1715 // CHECK-A64: [[VLD3:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8> } @llvm.aarch64.neon.ld3r.v8i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1716 // CHECK-A32: [[VLD3:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8> } @llvm.arm.neon.vld3dup.v8i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1717 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1718 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8> } [[VLD3]], { <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1719 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x8x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1720 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1721 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1722 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1723 void test_vld3_dup_s8(int8x8x3_t dest, const int8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1724 *dest = vld3_dup_s8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1725 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1726
1d019706d866 LLVM10 anatofuz parents: diff changeset	1727 // CHECK-LABEL: @test_vld3_dup_u16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1728 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x4x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1729 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1730 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1731 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1732 // CHECK-A64: [[VLD3:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16> } @llvm.aarch64.neon.ld3r.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1733 // CHECK-A32: [[VLD3:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16> } @llvm.arm.neon.vld3dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1734 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1735 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16> } [[VLD3]], { <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1736 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x4x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1737 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1738 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1739 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1740 void test_vld3_dup_u16(uint16x4x3_t dest, const uint16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1741 *dest = vld3_dup_u16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1742 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1743
1d019706d866 LLVM10 anatofuz parents: diff changeset	1744 // CHECK-LABEL: @test_vld3_dup_u32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1745 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x2x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1746 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1747 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1748 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1749 // CHECK-A64: [[VLD3:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32> } @llvm.aarch64.neon.ld3r.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1750 // CHECK-A32: [[VLD3:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32> } @llvm.arm.neon.vld3dup.v2i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1751 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1752 // CHECK: store { <2 x i32>, <2 x i32>, <2 x i32> } [[VLD3]], { <2 x i32>, <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1753 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x2x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1754 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x2x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1755 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1756 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1757 void test_vld3_dup_u32(uint32x2x3_t dest, const uint32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1758 *dest = vld3_dup_u32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1759 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1760
1d019706d866 LLVM10 anatofuz parents: diff changeset	1761 // CHECK-LABEL: @test_vld3_dup_u8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1762 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x8x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1763 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1764 // CHECK-A64: [[VLD3:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8> } @llvm.aarch64.neon.ld3r.v8i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1765 // CHECK-A32: [[VLD3:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8> } @llvm.arm.neon.vld3dup.v8i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1766 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1767 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8> } [[VLD3]], { <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1768 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x8x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1769 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1770 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1771 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1772 void test_vld3_dup_u8(uint8x8x3_t dest, const uint8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1773 *dest = vld3_dup_u8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1774 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1775
1d019706d866 LLVM10 anatofuz parents: diff changeset	1776 // CHECK-LABEL: @test_vld3_dup_s64(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1777 // CHECK: [[__RET:%.*]] = alloca %struct.int64x1x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1778 // CHECK: [[TMP0:%.]] = bitcast %struct.int64x1x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1779 // CHECK: [[TMP1:%.]] = bitcast i64 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1780 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1781 // CHECK-A64: [[VLD3:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64> } @llvm.aarch64.neon.ld3r.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1782 // CHECK-A32: [[VLD3:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64> } @llvm.arm.neon.vld3dup.v1i64.p0i8(i8 [[TMP1]], i32 8)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1783 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1784 // CHECK: store { <1 x i64>, <1 x i64>, <1 x i64> } [[VLD3]], { <1 x i64>, <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1785 // CHECK: [[TMP4:%.]] = bitcast %struct.int64x1x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1786 // CHECK: [[TMP5:%.]] = bitcast %struct.int64x1x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1787 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1788 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1789 void test_vld3_dup_s64(int64x1x3_t dest, const int64_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1790 *dest = vld3_dup_s64(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1791 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1792
1d019706d866 LLVM10 anatofuz parents: diff changeset	1793 // CHECK-LABEL: @test_vld3_dup_u64(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1794 // CHECK: [[__RET:%.*]] = alloca %struct.uint64x1x3_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1795 // CHECK: [[TMP0:%.]] = bitcast %struct.uint64x1x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1796 // CHECK: [[TMP1:%.]] = bitcast i64 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1797 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1798 // CHECK-A64: [[VLD3:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64> } @llvm.aarch64.neon.ld3r.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1799 // CHECK-A32: [[VLD3:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64> } @llvm.arm.neon.vld3dup.v1i64.p0i8(i8 [[TMP1]], i32 8)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1800 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1801 // CHECK: store { <1 x i64>, <1 x i64>, <1 x i64> } [[VLD3]], { <1 x i64>, <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1802 // CHECK: [[TMP4:%.]] = bitcast %struct.uint64x1x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1803 // CHECK: [[TMP5:%.]] = bitcast %struct.uint64x1x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1804 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 24, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1805 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1806 void test_vld3_dup_u64(uint64x1x3_t dest, const uint64_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1807 *dest = vld3_dup_u64(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1808 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1809
1d019706d866 LLVM10 anatofuz parents: diff changeset	1810 // CHECK-LABEL: @test_vld4_dup_f16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1811 // CHECK: [[__RET:%.*]] = alloca %struct.float16x4x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1812 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1813 // CHECK: [[TMP1:%.]] = bitcast half %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1814 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to half*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1815 // CHECK-A64: [[VLD4:%.]] = call { <4 x half>, <4 x half>, <4 x half>, <4 x half> } @llvm.aarch64.neon.ld4r.v4f16.p0f16(half [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1816 // CHECK-A32: [[VLD4:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } @llvm.arm.neon.vld4dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1817 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1818 // CHECK: store { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> } [[VLD4]], { <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]>, <4 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1819 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x4x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1820 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1821 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1822 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1823 void test_vld4_dup_f16(float16x4x4_t dest, const float16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1824 *dest = vld4_dup_f16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1825 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1826
1d019706d866 LLVM10 anatofuz parents: diff changeset	1827 // CHECK-LABEL: @test_vld4_dup_f32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1828 // CHECK: [[__RET:%.*]] = alloca %struct.float32x2x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1829 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1830 // CHECK: [[TMP1:%.]] = bitcast float %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1831 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1832 // CHECK-A64: [[VLD4:%.]] = call { <2 x float>, <2 x float>, <2 x float>, <2 x float> } @llvm.aarch64.neon.ld4r.v2f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1833 // CHECK-A32: [[VLD4:%.]] = call { <2 x float>, <2 x float>, <2 x float>, <2 x float> } @llvm.arm.neon.vld4dup.v2f32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1834 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x float>, <2 x float>, <2 x float>, <2 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1835 // CHECK: store { <2 x float>, <2 x float>, <2 x float>, <2 x float> } [[VLD4]], { <2 x float>, <2 x float>, <2 x float>, <2 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1836 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x2x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1837 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1838 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1839 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1840 void test_vld4_dup_f32(float32x2x4_t dest, const float32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1841 *dest = vld4_dup_f32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1842 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1843
1d019706d866 LLVM10 anatofuz parents: diff changeset	1844 // CHECK-LABEL: @test_vld4_dup_p16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1845 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x4x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1846 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1847 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1848 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1849 // CHECK-A64: [[VLD4:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } @llvm.aarch64.neon.ld4r.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1850 // CHECK-A32: [[VLD4:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } @llvm.arm.neon.vld4dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1851 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1852 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } [[VLD4]], { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1853 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x4x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1854 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1855 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1856 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1857 void test_vld4_dup_p16(poly16x4x4_t dest, const poly16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1858 *dest = vld4_dup_p16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1859 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1860
1d019706d866 LLVM10 anatofuz parents: diff changeset	1861 // CHECK-LABEL: @test_vld4_dup_p8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1862 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x8x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1863 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1864 // CHECK-A64: [[VLD4:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } @llvm.aarch64.neon.ld4r.v8i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1865 // CHECK-A32: [[VLD4:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } @llvm.arm.neon.vld4dup.v8i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1866 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1867 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } [[VLD4]], { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1868 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x8x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1869 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1870 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1871 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1872 void test_vld4_dup_p8(poly8x8x4_t dest, const poly8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1873 *dest = vld4_dup_p8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1874 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1875
1d019706d866 LLVM10 anatofuz parents: diff changeset	1876 // CHECK-LABEL: @test_vld4_dup_s16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1877 // CHECK: [[__RET:%.*]] = alloca %struct.int16x4x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1878 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1879 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1880 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1881 // CHECK-A64: [[VLD4:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } @llvm.aarch64.neon.ld4r.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1882 // CHECK-A32: [[VLD4:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } @llvm.arm.neon.vld4dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1883 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1884 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } [[VLD4]], { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1885 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x4x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1886 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1887 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1888 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1889 void test_vld4_dup_s16(int16x4x4_t dest, const int16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1890 *dest = vld4_dup_s16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1891 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1892
1d019706d866 LLVM10 anatofuz parents: diff changeset	1893 // CHECK-LABEL: @test_vld4_dup_s32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1894 // CHECK: [[__RET:%.*]] = alloca %struct.int32x2x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1895 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1896 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1897 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1898 // CHECK-A64: [[VLD4:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> } @llvm.aarch64.neon.ld4r.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1899 // CHECK-A32: [[VLD4:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> } @llvm.arm.neon.vld4dup.v2i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1900 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1901 // CHECK: store { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> } [[VLD4]], { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1902 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x2x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1903 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1904 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1905 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1906 void test_vld4_dup_s32(int32x2x4_t dest, const int32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1907 *dest = vld4_dup_s32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1908 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1909
1d019706d866 LLVM10 anatofuz parents: diff changeset	1910 // CHECK-LABEL: @test_vld4_dup_s8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1911 // CHECK: [[__RET:%.*]] = alloca %struct.int8x8x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1912 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1913 // CHECK-A64: [[VLD4:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } @llvm.aarch64.neon.ld4r.v8i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1914 // CHECK-A32: [[VLD4:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } @llvm.arm.neon.vld4dup.v8i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1915 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1916 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } [[VLD4]], { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1917 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x8x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1918 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1919 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1920 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1921 void test_vld4_dup_s8(int8x8x4_t dest, const int8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1922 *dest = vld4_dup_s8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1923 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1924
1d019706d866 LLVM10 anatofuz parents: diff changeset	1925 // CHECK-LABEL: @test_vld4_dup_u16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1926 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x4x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1927 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1928 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1929 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1930 // CHECK-A64: [[VLD4:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } @llvm.aarch64.neon.ld4r.v4i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1931 // CHECK-A32: [[VLD4:%.]] = call { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } @llvm.arm.neon.vld4dup.v4i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1932 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1933 // CHECK: store { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> } [[VLD4]], { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1934 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x4x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1935 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1936 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1937 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1938 void test_vld4_dup_u16(uint16x4x4_t dest, const uint16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1939 *dest = vld4_dup_u16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1940 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1941
1d019706d866 LLVM10 anatofuz parents: diff changeset	1942 // CHECK-LABEL: @test_vld4_dup_u32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1943 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x2x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1944 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1945 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1946 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1947 // CHECK-A64: [[VLD4:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> } @llvm.aarch64.neon.ld4r.v2i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1948 // CHECK-A32: [[VLD4:%.]] = call { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> } @llvm.arm.neon.vld4dup.v2i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1949 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1950 // CHECK: store { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> } [[VLD4]], { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1951 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x2x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1952 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x2x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1953 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1954 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1955 void test_vld4_dup_u32(uint32x2x4_t dest, const uint32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1956 *dest = vld4_dup_u32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1957 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1958
1d019706d866 LLVM10 anatofuz parents: diff changeset	1959 // CHECK-LABEL: @test_vld4_dup_u8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1960 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x8x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1961 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1962 // CHECK-A64: [[VLD4:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } @llvm.aarch64.neon.ld4r.v8i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1963 // CHECK-A32: [[VLD4:%.]] = call { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } @llvm.arm.neon.vld4dup.v8i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1964 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1965 // CHECK: store { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> } [[VLD4]], { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1966 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x8x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1967 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1968 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP2]], i8* align 8 [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1969 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1970 void test_vld4_dup_u8(uint8x8x4_t dest, const uint8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1971 *dest = vld4_dup_u8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1972 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1973
1d019706d866 LLVM10 anatofuz parents: diff changeset	1974 // CHECK-LABEL: @test_vld4_dup_s64(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1975 // CHECK: [[__RET:%.*]] = alloca %struct.int64x1x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1976 // CHECK: [[TMP0:%.]] = bitcast %struct.int64x1x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1977 // CHECK: [[TMP1:%.]] = bitcast i64 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1978 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1979 // CHECK-A64: [[VLD4:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> } @llvm.aarch64.neon.ld4r.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1980 // CHECK-A32: [[VLD4:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> } @llvm.arm.neon.vld4dup.v1i64.p0i8(i8 [[TMP1]], i32 8)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1981 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1982 // CHECK: store { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> } [[VLD4]], { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	1983 // CHECK: [[TMP4:%.]] = bitcast %struct.int64x1x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1984 // CHECK: [[TMP5:%.]] = bitcast %struct.int64x1x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1985 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1986 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	1987 void test_vld4_dup_s64(int64x1x4_t dest, const int64_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	1988 *dest = vld4_dup_s64(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	1989 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	1990
1d019706d866 LLVM10 anatofuz parents: diff changeset	1991 // CHECK-LABEL: @test_vld4_dup_u64(
1d019706d866 LLVM10 anatofuz parents: diff changeset	1992 // CHECK: [[__RET:%.*]] = alloca %struct.uint64x1x4_t, align 8
1d019706d866 LLVM10 anatofuz parents: diff changeset	1993 // CHECK: [[TMP0:%.]] = bitcast %struct.uint64x1x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1994 // CHECK: [[TMP1:%.]] = bitcast i64 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1995 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i64*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1996 // CHECK-A64: [[VLD4:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> } @llvm.aarch64.neon.ld4r.v1i64.p0i64(i64 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	1997 // CHECK-A32: [[VLD4:%.]] = call { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> } @llvm.arm.neon.vld4dup.v1i64.p0i8(i8 [[TMP1]], i32 8)
1d019706d866 LLVM10 anatofuz parents: diff changeset	1998 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	1999 // CHECK: store { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> } [[VLD4]], { <1 x i64>, <1 x i64>, <1 x i64>, <1 x i64> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2000 // CHECK: [[TMP4:%.]] = bitcast %struct.uint64x1x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2001 // CHECK: [[TMP5:%.]] = bitcast %struct.uint64x1x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2002 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align 8 [[TMP4]], i8* align 8 [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2003 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2004 void test_vld4_dup_u64(uint64x1x4_t dest, const uint64_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2005 *dest = vld4_dup_u64(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2006 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2007
1d019706d866 LLVM10 anatofuz parents: diff changeset	2008 // CHECK-LABEL: @test_vld2q_dup_f16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2009 // CHECK: [[__RET:%.*]] = alloca %struct.float16x8x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2010 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2011 // CHECK: [[TMP1:%.]] = bitcast half %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2012 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to half*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2013 // CHECK-A64: [[VLD2:%.]] = call { <8 x half>, <8 x half> } @llvm.aarch64.neon.ld2r.v8f16.p0f16(half [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2014 // CHECK-A32: [[VLD2:%.]] = call { <8 x i16>, <8 x i16> } @llvm.arm.neon.vld2dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2015 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x [[HALF]]>, <8 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2016 // CHECK: store { <8 x [[HALF]]>, <8 x [[HALF]]> } [[VLD2]], { <8 x [[HALF]]>, <8 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2017 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x8x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2018 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2019 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2020 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2021 void test_vld2q_dup_f16(float16x8x2_t dest, const float16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2022 *dest = vld2q_dup_f16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2023 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2024
1d019706d866 LLVM10 anatofuz parents: diff changeset	2025 // CHECK-LABEL: @test_vld2q_dup_f32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2026 // CHECK: [[__RET:%.*]] = alloca %struct.float32x4x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2027 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2028 // CHECK: [[TMP1:%.]] = bitcast float %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2029 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2030 // CHECK-A64: [[VLD2:%.]] = call { <4 x float>, <4 x float> } @llvm.aarch64.neon.ld2r.v4f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2031 // CHECK-A32: [[VLD2:%.]] = call { <4 x float>, <4 x float> } @llvm.arm.neon.vld2dup.v4f32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2032 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x float>, <4 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2033 // CHECK: store { <4 x float>, <4 x float> } [[VLD2]], { <4 x float>, <4 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2034 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x4x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2035 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2036 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2037 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2038 void test_vld2q_dup_f32(float32x4x2_t dest, const float32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2039 *dest = vld2q_dup_f32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2040 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2041
1d019706d866 LLVM10 anatofuz parents: diff changeset	2042 // CHECK-LABEL: @test_vld2q_dup_p16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2043 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x8x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2044 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2045 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2046 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2047 // CHECK-A64: [[VLD2:%.]] = call { <8 x i16>, <8 x i16> } @llvm.aarch64.neon.ld2r.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2048 // CHECK-A32: [[VLD2:%.]] = call { <8 x i16>, <8 x i16> } @llvm.arm.neon.vld2dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2049 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2050 // CHECK: store { <8 x i16>, <8 x i16> } [[VLD2]], { <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2051 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x8x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2052 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2053 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2054 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2055 void test_vld2q_dup_p16(poly16x8x2_t dest, const poly16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2056 *dest = vld2q_dup_p16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2057 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2058
1d019706d866 LLVM10 anatofuz parents: diff changeset	2059 // CHECK-LABEL: @test_vld2q_dup_p8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2060 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x16x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2061 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2062 // CHECK-A64: [[VLD2:%.]] = call { <16 x i8>, <16 x i8> } @llvm.aarch64.neon.ld2r.v16i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2063 // CHECK-A32: [[VLD2:%.]] = call { <16 x i8>, <16 x i8> } @llvm.arm.neon.vld2dup.v16i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2064 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2065 // CHECK: store { <16 x i8>, <16 x i8> } [[VLD2]], { <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2066 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x16x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2067 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2068 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2069 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2070 void test_vld2q_dup_p8(poly8x16x2_t dest, const poly8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2071 *dest = vld2q_dup_p8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2072 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2073
1d019706d866 LLVM10 anatofuz parents: diff changeset	2074 // CHECK-LABEL: @test_vld2q_dup_s16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2075 // CHECK: [[__RET:%.*]] = alloca %struct.int16x8x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2076 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2077 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2078 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2079 // CHECK-A64: [[VLD2:%.]] = call { <8 x i16>, <8 x i16> } @llvm.aarch64.neon.ld2r.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2080 // CHECK-A32: [[VLD2:%.]] = call { <8 x i16>, <8 x i16> } @llvm.arm.neon.vld2dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2081 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2082 // CHECK: store { <8 x i16>, <8 x i16> } [[VLD2]], { <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2083 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x8x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2084 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2085 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2086 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2087 void test_vld2q_dup_s16(int16x8x2_t dest, const int16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2088 *dest = vld2q_dup_s16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2089 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2090
1d019706d866 LLVM10 anatofuz parents: diff changeset	2091 // CHECK-LABEL: @test_vld2q_dup_s32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2092 // CHECK: [[__RET:%.*]] = alloca %struct.int32x4x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2093 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2094 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2095 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2096 // CHECK-A64: [[VLD2:%.]] = call { <4 x i32>, <4 x i32> } @llvm.aarch64.neon.ld2r.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2097 // CHECK-A32: [[VLD2:%.]] = call { <4 x i32>, <4 x i32> } @llvm.arm.neon.vld2dup.v4i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2098 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2099 // CHECK: store { <4 x i32>, <4 x i32> } [[VLD2]], { <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2100 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x4x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2101 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2102 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2103 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2104 void test_vld2q_dup_s32(int32x4x2_t dest, const int32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2105 *dest = vld2q_dup_s32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2106 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2107
1d019706d866 LLVM10 anatofuz parents: diff changeset	2108 // CHECK-LABEL: @test_vld2q_dup_s8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2109 // CHECK: [[__RET:%.*]] = alloca %struct.int8x16x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2110 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2111 // CHECK-A64: [[VLD2:%.]] = call { <16 x i8>, <16 x i8> } @llvm.aarch64.neon.ld2r.v16i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2112 // CHECK-A32: [[VLD2:%.]] = call { <16 x i8>, <16 x i8> } @llvm.arm.neon.vld2dup.v16i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2113 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2114 // CHECK: store { <16 x i8>, <16 x i8> } [[VLD2]], { <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2115 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x16x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2116 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2117 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2118 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2119 void test_vld2q_dup_s8(int8x16x2_t dest, const int8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2120 *dest = vld2q_dup_s8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2121 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2122
1d019706d866 LLVM10 anatofuz parents: diff changeset	2123 // CHECK-LABEL: @test_vld2q_dup_u16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2124 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x8x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2125 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2126 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2127 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2128 // CHECK-A64: [[VLD2:%.]] = call { <8 x i16>, <8 x i16> } @llvm.aarch64.neon.ld2r.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2129 // CHECK-A32: [[VLD2:%.]] = call { <8 x i16>, <8 x i16> } @llvm.arm.neon.vld2dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2130 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2131 // CHECK: store { <8 x i16>, <8 x i16> } [[VLD2]], { <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2132 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x8x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2133 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x8x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2134 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2135 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2136 void test_vld2q_dup_u16(uint16x8x2_t dest, const uint16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2137 *dest = vld2q_dup_u16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2138 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2139
1d019706d866 LLVM10 anatofuz parents: diff changeset	2140 // CHECK-LABEL: @test_vld2q_dup_u32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2141 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x4x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2142 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2143 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2144 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2145 // CHECK-A64: [[VLD2:%.]] = call { <4 x i32>, <4 x i32> } @llvm.aarch64.neon.ld2r.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2146 // CHECK-A32: [[VLD2:%.]] = call { <4 x i32>, <4 x i32> } @llvm.arm.neon.vld2dup.v4i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2147 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2148 // CHECK: store { <4 x i32>, <4 x i32> } [[VLD2]], { <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2149 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x4x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2150 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x4x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2151 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2152 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2153 void test_vld2q_dup_u32(uint32x4x2_t dest, const uint32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2154 *dest = vld2q_dup_u32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2155 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2156
1d019706d866 LLVM10 anatofuz parents: diff changeset	2157 // CHECK-LABEL: @test_vld2q_dup_u8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2158 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x16x2_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2159 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2160 // CHECK-A64: [[VLD2:%.]] = call { <16 x i8>, <16 x i8> } @llvm.aarch64.neon.ld2r.v16i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2161 // CHECK-A32: [[VLD2:%.]] = call { <16 x i8>, <16 x i8> } @llvm.arm.neon.vld2dup.v16i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2162 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2163 // CHECK: store { <16 x i8>, <16 x i8> } [[VLD2]], { <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2164 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x16x2_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2165 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x16x2_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2166 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 32, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2167 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2168 void test_vld2q_dup_u8(uint8x16x2_t dest, const uint8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2169 *dest = vld2q_dup_u8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2170 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2171
1d019706d866 LLVM10 anatofuz parents: diff changeset	2172 // CHECK-LABEL: @test_vld3q_dup_f16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2173 // CHECK: [[__RET:%.*]] = alloca %struct.float16x8x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2174 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2175 // CHECK: [[TMP1:%.]] = bitcast half %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2176 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to half*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2177 // CHECK-A64: [[VLD3:%.]] = call { <8 x half>, <8 x half>, <8 x half> } @llvm.aarch64.neon.ld3r.v8f16.p0f16(half [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2178 // CHECK-A32: [[VLD3:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16> } @llvm.arm.neon.vld3dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2179 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2180 // CHECK: store { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> } [[VLD3]], { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2181 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x8x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2182 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2183 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2184 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2185 void test_vld3q_dup_f16(float16x8x3_t dest, const float16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2186 *dest = vld3q_dup_f16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2187 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2188
1d019706d866 LLVM10 anatofuz parents: diff changeset	2189 // CHECK-LABEL: @test_vld3q_dup_f32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2190 // CHECK: [[__RET:%.*]] = alloca %struct.float32x4x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2191 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2192 // CHECK: [[TMP1:%.]] = bitcast float %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2193 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2194 // CHECK-A64: [[VLD3:%.]] = call { <4 x float>, <4 x float>, <4 x float> } @llvm.aarch64.neon.ld3r.v4f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2195 // CHECK-A32: [[VLD3:%.]] = call { <4 x float>, <4 x float>, <4 x float> } @llvm.arm.neon.vld3dup.v4f32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2196 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x float>, <4 x float>, <4 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2197 // CHECK: store { <4 x float>, <4 x float>, <4 x float> } [[VLD3]], { <4 x float>, <4 x float>, <4 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2198 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x4x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2199 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2200 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2201 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2202 void test_vld3q_dup_f32(float32x4x3_t dest, const float32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2203 *dest = vld3q_dup_f32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2204 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2205
1d019706d866 LLVM10 anatofuz parents: diff changeset	2206 // CHECK-LABEL: @test_vld3q_dup_p16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2207 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x8x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2208 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2209 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2210 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2211 // CHECK-A64: [[VLD3:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16> } @llvm.aarch64.neon.ld3r.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2212 // CHECK-A32: [[VLD3:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16> } @llvm.arm.neon.vld3dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2213 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2214 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16> } [[VLD3]], { <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2215 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x8x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2216 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2217 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2218 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2219 void test_vld3q_dup_p16(poly16x8x3_t dest, const poly16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2220 *dest = vld3q_dup_p16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2221 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2222
1d019706d866 LLVM10 anatofuz parents: diff changeset	2223 // CHECK-LABEL: @test_vld3q_dup_p8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2224 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x16x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2225 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2226 // CHECK-A64: [[VLD3:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8> } @llvm.aarch64.neon.ld3r.v16i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2227 // CHECK-A32: [[VLD3:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8> } @llvm.arm.neon.vld3dup.v16i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2228 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2229 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8> } [[VLD3]], { <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2230 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x16x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2231 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2232 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2233 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2234 void test_vld3q_dup_p8(poly8x16x3_t dest, const poly8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2235 *dest = vld3q_dup_p8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2236 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2237
1d019706d866 LLVM10 anatofuz parents: diff changeset	2238 // CHECK-LABEL: @test_vld3q_dup_s16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2239 // CHECK: [[__RET:%.*]] = alloca %struct.int16x8x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2240 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2241 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2242 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2243 // CHECK-A64: [[VLD3:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16> } @llvm.aarch64.neon.ld3r.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2244 // CHECK-A32: [[VLD3:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16> } @llvm.arm.neon.vld3dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2245 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2246 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16> } [[VLD3]], { <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2247 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x8x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2248 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2249 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2250 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2251 void test_vld3q_dup_s16(int16x8x3_t dest, const int16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2252 *dest = vld3q_dup_s16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2253 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2254
1d019706d866 LLVM10 anatofuz parents: diff changeset	2255 // CHECK-LABEL: @test_vld3q_dup_s32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2256 // CHECK: [[__RET:%.*]] = alloca %struct.int32x4x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2257 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2258 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2259 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2260 // CHECK-A64: [[VLD3:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32> } @llvm.aarch64.neon.ld3r.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2261 // CHECK-A32: [[VLD3:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32> } @llvm.arm.neon.vld3dup.v4i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2262 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2263 // CHECK: store { <4 x i32>, <4 x i32>, <4 x i32> } [[VLD3]], { <4 x i32>, <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2264 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x4x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2265 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2266 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2267 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2268 void test_vld3q_dup_s32(int32x4x3_t dest, const int32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2269 *dest = vld3q_dup_s32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2270 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2271
1d019706d866 LLVM10 anatofuz parents: diff changeset	2272 // CHECK-LABEL: @test_vld3q_dup_s8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2273 // CHECK: [[__RET:%.*]] = alloca %struct.int8x16x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2274 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2275 // CHECK-A64: [[VLD3:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8> } @llvm.aarch64.neon.ld3r.v16i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2276 // CHECK-A32: [[VLD3:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8> } @llvm.arm.neon.vld3dup.v16i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2277 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2278 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8> } [[VLD3]], { <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2279 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x16x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2280 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2281 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2282 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2283 void test_vld3q_dup_s8(int8x16x3_t dest, const int8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2284 *dest = vld3q_dup_s8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2285 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2286
1d019706d866 LLVM10 anatofuz parents: diff changeset	2287 // CHECK-LABEL: @test_vld3q_dup_u16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2288 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x8x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2289 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2290 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2291 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2292 // CHECK-A64: [[VLD3:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16> } @llvm.aarch64.neon.ld3r.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2293 // CHECK-A32: [[VLD3:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16> } @llvm.arm.neon.vld3dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2294 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2295 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16> } [[VLD3]], { <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2296 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x8x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2297 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x8x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2298 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2299 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2300 void test_vld3q_dup_u16(uint16x8x3_t dest, const uint16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2301 *dest = vld3q_dup_u16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2302 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2303
1d019706d866 LLVM10 anatofuz parents: diff changeset	2304 // CHECK-LABEL: @test_vld3q_dup_u32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2305 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x4x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2306 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2307 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2308 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2309 // CHECK-A64: [[VLD3:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32> } @llvm.aarch64.neon.ld3r.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2310 // CHECK-A32: [[VLD3:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32> } @llvm.arm.neon.vld3dup.v4i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2311 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2312 // CHECK: store { <4 x i32>, <4 x i32>, <4 x i32> } [[VLD3]], { <4 x i32>, <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2313 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x4x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2314 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x4x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2315 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2316 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2317 void test_vld3q_dup_u32(uint32x4x3_t dest, const uint32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2318 *dest = vld3q_dup_u32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2319 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2320
1d019706d866 LLVM10 anatofuz parents: diff changeset	2321 // CHECK-LABEL: @test_vld3q_dup_u8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2322 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x16x3_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2323 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2324 // CHECK-A64: [[VLD3:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8> } @llvm.aarch64.neon.ld3r.v16i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2325 // CHECK-A32: [[VLD3:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8> } @llvm.arm.neon.vld3dup.v16i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2326 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2327 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8> } [[VLD3]], { <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2328 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x16x3_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2329 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x16x3_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2330 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 48, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2331 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2332 void test_vld3q_dup_u8(uint8x16x3_t dest, const uint8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2333 *dest = vld3q_dup_u8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2334 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2335
1d019706d866 LLVM10 anatofuz parents: diff changeset	2336 // CHECK-LABEL: @test_vld4q_dup_f16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2337 // CHECK: [[__RET:%.*]] = alloca %struct.float16x8x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2338 // CHECK: [[TMP0:%.]] = bitcast %struct.float16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2339 // CHECK: [[TMP1:%.]] = bitcast half %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2340 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to half*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2341 // CHECK-A64: [[VLD4:%.]] = call { <8 x half>, <8 x half>, <8 x half>, <8 x half> } @llvm.aarch64.neon.ld4r.v8f16.p0f16(half [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2342 // CHECK-A32: [[VLD4:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } @llvm.arm.neon.vld4dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2343 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2344 // CHECK: store { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> } [[VLD4]], { <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]>, <8 x [[HALF]]> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2345 // CHECK: [[TMP4:%.]] = bitcast %struct.float16x8x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2346 // CHECK: [[TMP5:%.]] = bitcast %struct.float16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2347 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2348 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2349 void test_vld4q_dup_f16(float16x8x4_t dest, const float16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2350 *dest = vld4q_dup_f16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2351 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2352
1d019706d866 LLVM10 anatofuz parents: diff changeset	2353 // CHECK-LABEL: @test_vld4q_dup_f32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2354 // CHECK: [[__RET:%.*]] = alloca %struct.float32x4x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2355 // CHECK: [[TMP0:%.]] = bitcast %struct.float32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2356 // CHECK: [[TMP1:%.]] = bitcast float %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2357 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to float*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2358 // CHECK-A64: [[VLD4:%.]] = call { <4 x float>, <4 x float>, <4 x float>, <4 x float> } @llvm.aarch64.neon.ld4r.v4f32.p0f32(float [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2359 // CHECK-A32: [[VLD4:%.]] = call { <4 x float>, <4 x float>, <4 x float>, <4 x float> } @llvm.arm.neon.vld4dup.v4f32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2360 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x float>, <4 x float>, <4 x float>, <4 x float> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2361 // CHECK: store { <4 x float>, <4 x float>, <4 x float>, <4 x float> } [[VLD4]], { <4 x float>, <4 x float>, <4 x float>, <4 x float> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2362 // CHECK: [[TMP4:%.]] = bitcast %struct.float32x4x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2363 // CHECK: [[TMP5:%.]] = bitcast %struct.float32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2364 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2365 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2366 void test_vld4q_dup_f32(float32x4x4_t dest, const float32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2367 *dest = vld4q_dup_f32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2368 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2369
1d019706d866 LLVM10 anatofuz parents: diff changeset	2370 // CHECK-LABEL: @test_vld4q_dup_p16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2371 // CHECK: [[__RET:%.*]] = alloca %struct.poly16x8x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2372 // CHECK: [[TMP0:%.]] = bitcast %struct.poly16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2373 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2374 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2375 // CHECK-A64: [[VLD4:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } @llvm.aarch64.neon.ld4r.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2376 // CHECK-A32: [[VLD4:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } @llvm.arm.neon.vld4dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2377 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2378 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } [[VLD4]], { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2379 // CHECK: [[TMP4:%.]] = bitcast %struct.poly16x8x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2380 // CHECK: [[TMP5:%.]] = bitcast %struct.poly16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2381 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2382 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2383 void test_vld4q_dup_p16(poly16x8x4_t dest, const poly16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2384 *dest = vld4q_dup_p16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2385 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2386
1d019706d866 LLVM10 anatofuz parents: diff changeset	2387 // CHECK-LABEL: @test_vld4q_dup_p8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2388 // CHECK: [[__RET:%.*]] = alloca %struct.poly8x16x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2389 // CHECK: [[TMP0:%.]] = bitcast %struct.poly8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2390 // CHECK-A64: [[VLD4:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } @llvm.aarch64.neon.ld4r.v16i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2391 // CHECK-A32: [[VLD4:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } @llvm.arm.neon.vld4dup.v16i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2392 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2393 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } [[VLD4]], { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2394 // CHECK: [[TMP2:%.]] = bitcast %struct.poly8x16x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2395 // CHECK: [[TMP3:%.]] = bitcast %struct.poly8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2396 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2397 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2398 void test_vld4q_dup_p8(poly8x16x4_t dest, const poly8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2399 *dest = vld4q_dup_p8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2400 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2401
1d019706d866 LLVM10 anatofuz parents: diff changeset	2402 // CHECK-LABEL: @test_vld4q_dup_s16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2403 // CHECK: [[__RET:%.*]] = alloca %struct.int16x8x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2404 // CHECK: [[TMP0:%.]] = bitcast %struct.int16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2405 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2406 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2407 // CHECK-A64: [[VLD4:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } @llvm.aarch64.neon.ld4r.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2408 // CHECK-A32: [[VLD4:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } @llvm.arm.neon.vld4dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2409 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2410 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } [[VLD4]], { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2411 // CHECK: [[TMP4:%.]] = bitcast %struct.int16x8x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2412 // CHECK: [[TMP5:%.]] = bitcast %struct.int16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2413 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2414 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2415 void test_vld4q_dup_s16(int16x8x4_t dest, const int16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2416 *dest = vld4q_dup_s16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2417 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2418
1d019706d866 LLVM10 anatofuz parents: diff changeset	2419 // CHECK-LABEL: @test_vld4q_dup_s32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2420 // CHECK: [[__RET:%.*]] = alloca %struct.int32x4x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2421 // CHECK: [[TMP0:%.]] = bitcast %struct.int32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2422 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2423 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2424 // CHECK-A64: [[VLD4:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> } @llvm.aarch64.neon.ld4r.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2425 // CHECK-A32: [[VLD4:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> } @llvm.arm.neon.vld4dup.v4i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2426 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2427 // CHECK: store { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> } [[VLD4]], { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2428 // CHECK: [[TMP4:%.]] = bitcast %struct.int32x4x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2429 // CHECK: [[TMP5:%.]] = bitcast %struct.int32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2430 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2431 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2432 void test_vld4q_dup_s32(int32x4x4_t dest, const int32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2433 *dest = vld4q_dup_s32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2434 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2435
1d019706d866 LLVM10 anatofuz parents: diff changeset	2436 // CHECK-LABEL: @test_vld4q_dup_s8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2437 // CHECK: [[__RET:%.*]] = alloca %struct.int8x16x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2438 // CHECK: [[TMP0:%.]] = bitcast %struct.int8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2439 // CHECK-A64: [[VLD4:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } @llvm.aarch64.neon.ld4r.v16i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2440 // CHECK-A32: [[VLD4:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } @llvm.arm.neon.vld4dup.v16i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2441 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2442 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } [[VLD4]], { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2443 // CHECK: [[TMP2:%.]] = bitcast %struct.int8x16x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2444 // CHECK: [[TMP3:%.]] = bitcast %struct.int8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2445 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2446 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2447 void test_vld4q_dup_s8(int8x16x4_t dest, const int8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2448 *dest = vld4q_dup_s8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2449 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2450
1d019706d866 LLVM10 anatofuz parents: diff changeset	2451 // CHECK-LABEL: @test_vld4q_dup_u16(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2452 // CHECK: [[__RET:%.*]] = alloca %struct.uint16x8x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2453 // CHECK: [[TMP0:%.]] = bitcast %struct.uint16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2454 // CHECK: [[TMP1:%.]] = bitcast i16 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2455 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i16*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2456 // CHECK-A64: [[VLD4:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } @llvm.aarch64.neon.ld4r.v8i16.p0i16(i16 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2457 // CHECK-A32: [[VLD4:%.]] = call { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } @llvm.arm.neon.vld4dup.v8i16.p0i8(i8 [[TMP1]], i32 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2458 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2459 // CHECK: store { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> } [[VLD4]], { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2460 // CHECK: [[TMP4:%.]] = bitcast %struct.uint16x8x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2461 // CHECK: [[TMP5:%.]] = bitcast %struct.uint16x8x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2462 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2463 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2464 void test_vld4q_dup_u16(uint16x8x4_t dest, const uint16_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2465 *dest = vld4q_dup_u16(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2466 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2467
1d019706d866 LLVM10 anatofuz parents: diff changeset	2468 // CHECK-LABEL: @test_vld4q_dup_u32(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2469 // CHECK: [[__RET:%.*]] = alloca %struct.uint32x4x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2470 // CHECK: [[TMP0:%.]] = bitcast %struct.uint32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2471 // CHECK: [[TMP1:%.]] = bitcast i32 %src to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2472 // CHECK-A64: [[TMP2:%.]] = bitcast i8 [[TMP1]] to i32*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2473 // CHECK-A64: [[VLD4:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> } @llvm.aarch64.neon.ld4r.v4i32.p0i32(i32 [[TMP2]])
1d019706d866 LLVM10 anatofuz parents: diff changeset	2474 // CHECK-A32: [[VLD4:%.]] = call { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> } @llvm.arm.neon.vld4dup.v4i32.p0i8(i8 [[TMP1]], i32 4)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2475 // CHECK: [[TMP3:%.]] = bitcast i8 [[TMP0]] to { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2476 // CHECK: store { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> } [[VLD4]], { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> }* [[TMP3]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2477 // CHECK: [[TMP4:%.]] = bitcast %struct.uint32x4x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2478 // CHECK: [[TMP5:%.]] = bitcast %struct.uint32x4x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2479 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP4]], i8* align {{16\|8}} [[TMP5]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2480 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2481 void test_vld4q_dup_u32(uint32x4x4_t dest, const uint32_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2482 *dest = vld4q_dup_u32(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2483 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	2484
1d019706d866 LLVM10 anatofuz parents: diff changeset	2485 // CHECK-LABEL: @test_vld4q_dup_u8(
1d019706d866 LLVM10 anatofuz parents: diff changeset	2486 // CHECK: [[__RET:%.*]] = alloca %struct.uint8x16x4_t, align {{16\|8}}
1d019706d866 LLVM10 anatofuz parents: diff changeset	2487 // CHECK: [[TMP0:%.]] = bitcast %struct.uint8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2488 // CHECK-A64: [[VLD4:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } @llvm.aarch64.neon.ld4r.v16i8.p0i8(i8 %src)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2489 // CHECK-A32: [[VLD4:%.]] = call { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } @llvm.arm.neon.vld4dup.v16i8.p0i8(i8 %src, i32 1)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2490 // CHECK: [[TMP1:%.]] = bitcast i8 [[TMP0]] to { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2491 // CHECK: store { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> } [[VLD4]], { <16 x i8>, <16 x i8>, <16 x i8>, <16 x i8> }* [[TMP1]]
1d019706d866 LLVM10 anatofuz parents: diff changeset	2492 // CHECK: [[TMP2:%.]] = bitcast %struct.uint8x16x4_t %dest to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2493 // CHECK: [[TMP3:%.]] = bitcast %struct.uint8x16x4_t [[__RET]] to i8*
1d019706d866 LLVM10 anatofuz parents: diff changeset	2494 // CHECK: call void @llvm.memcpy.p0i8.p0i8.{{i64\|i32}}(i8* align {{16\|8}} [[TMP2]], i8* align {{16\|8}} [[TMP3]], {{i64\|i32}} 64, i1 false)
1d019706d866 LLVM10 anatofuz parents: diff changeset	2495 // CHECK: ret void
1d019706d866 LLVM10 anatofuz parents: diff changeset	2496 void test_vld4q_dup_u8(uint8x16x4_t dest, const uint8_t src) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	2497 *dest = vld4q_dup_u8(src);
1d019706d866 LLVM10 anatofuz parents: diff changeset	2498 }

Mercurial > hg > CbC > CbC_llvm

annotate clang/test/CodeGen/arm-neon-vld.c @ 207:2e18cbf3894f