CbC/CbC_gcc: gcc/config/arm/arm

annotate gcc/config/arm/arm_fp16.h @ 111:04ced10e8804

gcc 7

author	kono
date	Fri, 27 Oct 2017 22:46:09 +0900
parents
children	84e7813d76e9

rev	line source
111 04ced10e8804 gcc 7 kono parents: diff changeset	1 /* ARM FP16 intrinsics include file.
04ced10e8804 gcc 7 kono parents: diff changeset	2
04ced10e8804 gcc 7 kono parents: diff changeset	3 Copyright (C) 2016-2017 Free Software Foundation, Inc.
04ced10e8804 gcc 7 kono parents: diff changeset	4 Contributed by ARM Ltd.
04ced10e8804 gcc 7 kono parents: diff changeset	5
04ced10e8804 gcc 7 kono parents: diff changeset	6 This file is part of GCC.
04ced10e8804 gcc 7 kono parents: diff changeset	7
04ced10e8804 gcc 7 kono parents: diff changeset	8 GCC is free software; you can redistribute it and/or modify it
04ced10e8804 gcc 7 kono parents: diff changeset	9 under the terms of the GNU General Public License as published
04ced10e8804 gcc 7 kono parents: diff changeset	10 by the Free Software Foundation; either version 3, or (at your
04ced10e8804 gcc 7 kono parents: diff changeset	11 option) any later version.
04ced10e8804 gcc 7 kono parents: diff changeset	12
04ced10e8804 gcc 7 kono parents: diff changeset	13 GCC is distributed in the hope that it will be useful, but WITHOUT
04ced10e8804 gcc 7 kono parents: diff changeset	14 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
04ced10e8804 gcc 7 kono parents: diff changeset	15 or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public
04ced10e8804 gcc 7 kono parents: diff changeset	16 License for more details.
04ced10e8804 gcc 7 kono parents: diff changeset	17
04ced10e8804 gcc 7 kono parents: diff changeset	18 Under Section 7 of GPL version 3, you are granted additional
04ced10e8804 gcc 7 kono parents: diff changeset	19 permissions described in the GCC Runtime Library Exception, version
04ced10e8804 gcc 7 kono parents: diff changeset	20 3.1, as published by the Free Software Foundation.
04ced10e8804 gcc 7 kono parents: diff changeset	21
04ced10e8804 gcc 7 kono parents: diff changeset	22 You should have received a copy of the GNU General Public License and
04ced10e8804 gcc 7 kono parents: diff changeset	23 a copy of the GCC Runtime Library Exception along with this program;
04ced10e8804 gcc 7 kono parents: diff changeset	24 see the files COPYING3 and COPYING.RUNTIME respectively. If not, see
04ced10e8804 gcc 7 kono parents: diff changeset	25 <http://www.gnu.org/licenses/>. */
04ced10e8804 gcc 7 kono parents: diff changeset	26
04ced10e8804 gcc 7 kono parents: diff changeset	27 #ifndef _GCC_ARM_FP16_H
04ced10e8804 gcc 7 kono parents: diff changeset	28 #define _GCC_ARM_FP16_H 1
04ced10e8804 gcc 7 kono parents: diff changeset	29
04ced10e8804 gcc 7 kono parents: diff changeset	30 #ifdef __cplusplus
04ced10e8804 gcc 7 kono parents: diff changeset	31 extern "C" {
04ced10e8804 gcc 7 kono parents: diff changeset	32 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	33
04ced10e8804 gcc 7 kono parents: diff changeset	34 #include <stdint.h>
04ced10e8804 gcc 7 kono parents: diff changeset	35
04ced10e8804 gcc 7 kono parents: diff changeset	36 /* Intrinsics for FP16 instructions. */
04ced10e8804 gcc 7 kono parents: diff changeset	37 #pragma GCC push_options
04ced10e8804 gcc 7 kono parents: diff changeset	38 #pragma GCC target ("fpu=fp-armv8")
04ced10e8804 gcc 7 kono parents: diff changeset	39
04ced10e8804 gcc 7 kono parents: diff changeset	40 #if defined (__ARM_FEATURE_FP16_SCALAR_ARITHMETIC)
04ced10e8804 gcc 7 kono parents: diff changeset	41
04ced10e8804 gcc 7 kono parents: diff changeset	42 typedef __fp16 float16_t;
04ced10e8804 gcc 7 kono parents: diff changeset	43
04ced10e8804 gcc 7 kono parents: diff changeset	44 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	45 vabsh_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	46 {
04ced10e8804 gcc 7 kono parents: diff changeset	47 return __builtin_neon_vabshf (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	48 }
04ced10e8804 gcc 7 kono parents: diff changeset	49
04ced10e8804 gcc 7 kono parents: diff changeset	50 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	51 vaddh_f16 (float16_t __a, float16_t __b)
04ced10e8804 gcc 7 kono parents: diff changeset	52 {
04ced10e8804 gcc 7 kono parents: diff changeset	53 return __a + __b;
04ced10e8804 gcc 7 kono parents: diff changeset	54 }
04ced10e8804 gcc 7 kono parents: diff changeset	55
04ced10e8804 gcc 7 kono parents: diff changeset	56 __extension__ static __inline int32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	57 vcvtah_s32_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	58 {
04ced10e8804 gcc 7 kono parents: diff changeset	59 return __builtin_neon_vcvtahssi (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	60 }
04ced10e8804 gcc 7 kono parents: diff changeset	61
04ced10e8804 gcc 7 kono parents: diff changeset	62 __extension__ static __inline uint32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	63 vcvtah_u32_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	64 {
04ced10e8804 gcc 7 kono parents: diff changeset	65 return __builtin_neon_vcvtahusi (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	66 }
04ced10e8804 gcc 7 kono parents: diff changeset	67
04ced10e8804 gcc 7 kono parents: diff changeset	68 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	69 vcvth_f16_s32 (int32_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	70 {
04ced10e8804 gcc 7 kono parents: diff changeset	71 return __builtin_neon_vcvthshf (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	72 }
04ced10e8804 gcc 7 kono parents: diff changeset	73
04ced10e8804 gcc 7 kono parents: diff changeset	74 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	75 vcvth_f16_u32 (uint32_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	76 {
04ced10e8804 gcc 7 kono parents: diff changeset	77 return __builtin_neon_vcvthuhf (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	78 }
04ced10e8804 gcc 7 kono parents: diff changeset	79
04ced10e8804 gcc 7 kono parents: diff changeset	80 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	81 vcvth_n_f16_s32 (int32_t __a, const int __b)
04ced10e8804 gcc 7 kono parents: diff changeset	82 {
04ced10e8804 gcc 7 kono parents: diff changeset	83 return __builtin_neon_vcvths_nhf (__a, __b);
04ced10e8804 gcc 7 kono parents: diff changeset	84 }
04ced10e8804 gcc 7 kono parents: diff changeset	85
04ced10e8804 gcc 7 kono parents: diff changeset	86 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	87 vcvth_n_f16_u32 (uint32_t __a, const int __b)
04ced10e8804 gcc 7 kono parents: diff changeset	88 {
04ced10e8804 gcc 7 kono parents: diff changeset	89 return __builtin_neon_vcvthu_nhf ((int32_t)__a, __b);
04ced10e8804 gcc 7 kono parents: diff changeset	90 }
04ced10e8804 gcc 7 kono parents: diff changeset	91
04ced10e8804 gcc 7 kono parents: diff changeset	92 __extension__ static __inline int32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	93 vcvth_n_s32_f16 (float16_t __a, const int __b)
04ced10e8804 gcc 7 kono parents: diff changeset	94 {
04ced10e8804 gcc 7 kono parents: diff changeset	95 return __builtin_neon_vcvths_nsi (__a, __b);
04ced10e8804 gcc 7 kono parents: diff changeset	96 }
04ced10e8804 gcc 7 kono parents: diff changeset	97
04ced10e8804 gcc 7 kono parents: diff changeset	98 __extension__ static __inline uint32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	99 vcvth_n_u32_f16 (float16_t __a, const int __b)
04ced10e8804 gcc 7 kono parents: diff changeset	100 {
04ced10e8804 gcc 7 kono parents: diff changeset	101 return (uint32_t)__builtin_neon_vcvthu_nsi (__a, __b);
04ced10e8804 gcc 7 kono parents: diff changeset	102 }
04ced10e8804 gcc 7 kono parents: diff changeset	103
04ced10e8804 gcc 7 kono parents: diff changeset	104 __extension__ static __inline int32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	105 vcvth_s32_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	106 {
04ced10e8804 gcc 7 kono parents: diff changeset	107 return __builtin_neon_vcvthssi (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	108 }
04ced10e8804 gcc 7 kono parents: diff changeset	109
04ced10e8804 gcc 7 kono parents: diff changeset	110 __extension__ static __inline uint32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	111 vcvth_u32_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	112 {
04ced10e8804 gcc 7 kono parents: diff changeset	113 return __builtin_neon_vcvthusi (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	114 }
04ced10e8804 gcc 7 kono parents: diff changeset	115
04ced10e8804 gcc 7 kono parents: diff changeset	116 __extension__ static __inline int32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	117 vcvtmh_s32_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	118 {
04ced10e8804 gcc 7 kono parents: diff changeset	119 return __builtin_neon_vcvtmhssi (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	120 }
04ced10e8804 gcc 7 kono parents: diff changeset	121
04ced10e8804 gcc 7 kono parents: diff changeset	122 __extension__ static __inline uint32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	123 vcvtmh_u32_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	124 {
04ced10e8804 gcc 7 kono parents: diff changeset	125 return __builtin_neon_vcvtmhusi (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	126 }
04ced10e8804 gcc 7 kono parents: diff changeset	127
04ced10e8804 gcc 7 kono parents: diff changeset	128 __extension__ static __inline int32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	129 vcvtnh_s32_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	130 {
04ced10e8804 gcc 7 kono parents: diff changeset	131 return __builtin_neon_vcvtnhssi (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	132 }
04ced10e8804 gcc 7 kono parents: diff changeset	133
04ced10e8804 gcc 7 kono parents: diff changeset	134 __extension__ static __inline uint32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	135 vcvtnh_u32_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	136 {
04ced10e8804 gcc 7 kono parents: diff changeset	137 return __builtin_neon_vcvtnhusi (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	138 }
04ced10e8804 gcc 7 kono parents: diff changeset	139
04ced10e8804 gcc 7 kono parents: diff changeset	140 __extension__ static __inline int32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	141 vcvtph_s32_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	142 {
04ced10e8804 gcc 7 kono parents: diff changeset	143 return __builtin_neon_vcvtphssi (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	144 }
04ced10e8804 gcc 7 kono parents: diff changeset	145
04ced10e8804 gcc 7 kono parents: diff changeset	146 __extension__ static __inline uint32_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	147 vcvtph_u32_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	148 {
04ced10e8804 gcc 7 kono parents: diff changeset	149 return __builtin_neon_vcvtphusi (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	150 }
04ced10e8804 gcc 7 kono parents: diff changeset	151
04ced10e8804 gcc 7 kono parents: diff changeset	152 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	153 vdivh_f16 (float16_t __a, float16_t __b)
04ced10e8804 gcc 7 kono parents: diff changeset	154 {
04ced10e8804 gcc 7 kono parents: diff changeset	155 return __a / __b;
04ced10e8804 gcc 7 kono parents: diff changeset	156 }
04ced10e8804 gcc 7 kono parents: diff changeset	157
04ced10e8804 gcc 7 kono parents: diff changeset	158 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	159 vfmah_f16 (float16_t __a, float16_t __b, float16_t __c)
04ced10e8804 gcc 7 kono parents: diff changeset	160 {
04ced10e8804 gcc 7 kono parents: diff changeset	161 return __builtin_neon_vfmahf (__a, __b, __c);
04ced10e8804 gcc 7 kono parents: diff changeset	162 }
04ced10e8804 gcc 7 kono parents: diff changeset	163
04ced10e8804 gcc 7 kono parents: diff changeset	164 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	165 vfmsh_f16 (float16_t __a, float16_t __b, float16_t __c)
04ced10e8804 gcc 7 kono parents: diff changeset	166 {
04ced10e8804 gcc 7 kono parents: diff changeset	167 return __builtin_neon_vfmshf (__a, __b, __c);
04ced10e8804 gcc 7 kono parents: diff changeset	168 }
04ced10e8804 gcc 7 kono parents: diff changeset	169
04ced10e8804 gcc 7 kono parents: diff changeset	170 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	171 vmaxnmh_f16 (float16_t __a, float16_t __b)
04ced10e8804 gcc 7 kono parents: diff changeset	172 {
04ced10e8804 gcc 7 kono parents: diff changeset	173 return __builtin_neon_vmaxnmhf (__a, __b);
04ced10e8804 gcc 7 kono parents: diff changeset	174 }
04ced10e8804 gcc 7 kono parents: diff changeset	175
04ced10e8804 gcc 7 kono parents: diff changeset	176 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	177 vminnmh_f16 (float16_t __a, float16_t __b)
04ced10e8804 gcc 7 kono parents: diff changeset	178 {
04ced10e8804 gcc 7 kono parents: diff changeset	179 return __builtin_neon_vminnmhf (__a, __b);
04ced10e8804 gcc 7 kono parents: diff changeset	180 }
04ced10e8804 gcc 7 kono parents: diff changeset	181
04ced10e8804 gcc 7 kono parents: diff changeset	182 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	183 vmulh_f16 (float16_t __a, float16_t __b)
04ced10e8804 gcc 7 kono parents: diff changeset	184 {
04ced10e8804 gcc 7 kono parents: diff changeset	185 return __a * __b;
04ced10e8804 gcc 7 kono parents: diff changeset	186 }
04ced10e8804 gcc 7 kono parents: diff changeset	187
04ced10e8804 gcc 7 kono parents: diff changeset	188 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	189 vnegh_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	190 {
04ced10e8804 gcc 7 kono parents: diff changeset	191 return - __a;
04ced10e8804 gcc 7 kono parents: diff changeset	192 }
04ced10e8804 gcc 7 kono parents: diff changeset	193
04ced10e8804 gcc 7 kono parents: diff changeset	194 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	195 vrndah_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	196 {
04ced10e8804 gcc 7 kono parents: diff changeset	197 return __builtin_neon_vrndahf (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	198 }
04ced10e8804 gcc 7 kono parents: diff changeset	199
04ced10e8804 gcc 7 kono parents: diff changeset	200 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	201 vrndh_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	202 {
04ced10e8804 gcc 7 kono parents: diff changeset	203 return __builtin_neon_vrndhf (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	204 }
04ced10e8804 gcc 7 kono parents: diff changeset	205
04ced10e8804 gcc 7 kono parents: diff changeset	206 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	207 vrndih_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	208 {
04ced10e8804 gcc 7 kono parents: diff changeset	209 return __builtin_neon_vrndihf (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	210 }
04ced10e8804 gcc 7 kono parents: diff changeset	211
04ced10e8804 gcc 7 kono parents: diff changeset	212 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	213 vrndmh_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	214 {
04ced10e8804 gcc 7 kono parents: diff changeset	215 return __builtin_neon_vrndmhf (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	216 }
04ced10e8804 gcc 7 kono parents: diff changeset	217
04ced10e8804 gcc 7 kono parents: diff changeset	218 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	219 vrndnh_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	220 {
04ced10e8804 gcc 7 kono parents: diff changeset	221 return __builtin_neon_vrndnhf (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	222 }
04ced10e8804 gcc 7 kono parents: diff changeset	223
04ced10e8804 gcc 7 kono parents: diff changeset	224 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	225 vrndph_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	226 {
04ced10e8804 gcc 7 kono parents: diff changeset	227 return __builtin_neon_vrndphf (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	228 }
04ced10e8804 gcc 7 kono parents: diff changeset	229
04ced10e8804 gcc 7 kono parents: diff changeset	230 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	231 vrndxh_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	232 {
04ced10e8804 gcc 7 kono parents: diff changeset	233 return __builtin_neon_vrndxhf (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	234 }
04ced10e8804 gcc 7 kono parents: diff changeset	235
04ced10e8804 gcc 7 kono parents: diff changeset	236 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	237 vsqrth_f16 (float16_t __a)
04ced10e8804 gcc 7 kono parents: diff changeset	238 {
04ced10e8804 gcc 7 kono parents: diff changeset	239 return __builtin_neon_vsqrthf (__a);
04ced10e8804 gcc 7 kono parents: diff changeset	240 }
04ced10e8804 gcc 7 kono parents: diff changeset	241
04ced10e8804 gcc 7 kono parents: diff changeset	242 __extension__ static __inline float16_t __attribute__ ((__always_inline__))
04ced10e8804 gcc 7 kono parents: diff changeset	243 vsubh_f16 (float16_t __a, float16_t __b)
04ced10e8804 gcc 7 kono parents: diff changeset	244 {
04ced10e8804 gcc 7 kono parents: diff changeset	245 return __a - __b;
04ced10e8804 gcc 7 kono parents: diff changeset	246 }
04ced10e8804 gcc 7 kono parents: diff changeset	247
04ced10e8804 gcc 7 kono parents: diff changeset	248 #endif /* __ARM_FEATURE_FP16_SCALAR_ARITHMETIC */
04ced10e8804 gcc 7 kono parents: diff changeset	249 #pragma GCC pop_options
04ced10e8804 gcc 7 kono parents: diff changeset	250
04ced10e8804 gcc 7 kono parents: diff changeset	251 #ifdef __cplusplus
04ced10e8804 gcc 7 kono parents: diff changeset	252 }
04ced10e8804 gcc 7 kono parents: diff changeset	253 #endif
04ced10e8804 gcc 7 kono parents: diff changeset	254
04ced10e8804 gcc 7 kono parents: diff changeset	255 #endif

Mercurial > hg > CbC > CbC_gcc

annotate gcc/config/arm/arm_fp16.h @ 111:04ced10e8804