CbC/CbC_gcc: gcc/omp-grid.c annotate

annotate gcc/omp-grid.c @ 116:367f9f4f266e

fix gimple.h

author	mir3636
date	Tue, 28 Nov 2017 20:22:01 +0900
parents	04ced10e8804
children	84e7813d76e9

rev	line source
111 04ced10e8804 gcc 7 kono parents: diff changeset	1 /* Lowering and expansion of OpenMP directives for HSA GPU agents.
04ced10e8804 gcc 7 kono parents: diff changeset	2
04ced10e8804 gcc 7 kono parents: diff changeset	3 Copyright (C) 2013-2017 Free Software Foundation, Inc.
04ced10e8804 gcc 7 kono parents: diff changeset	4
04ced10e8804 gcc 7 kono parents: diff changeset	5 This file is part of GCC.
04ced10e8804 gcc 7 kono parents: diff changeset	6
04ced10e8804 gcc 7 kono parents: diff changeset	7 GCC is free software; you can redistribute it and/or modify it under
04ced10e8804 gcc 7 kono parents: diff changeset	8 the terms of the GNU General Public License as published by the Free
04ced10e8804 gcc 7 kono parents: diff changeset	9 Software Foundation; either version 3, or (at your option) any later
04ced10e8804 gcc 7 kono parents: diff changeset	10 version.
04ced10e8804 gcc 7 kono parents: diff changeset	11
04ced10e8804 gcc 7 kono parents: diff changeset	12 GCC is distributed in the hope that it will be useful, but WITHOUT ANY
04ced10e8804 gcc 7 kono parents: diff changeset	13 WARRANTY; without even the implied warranty of MERCHANTABILITY or
04ced10e8804 gcc 7 kono parents: diff changeset	14 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
04ced10e8804 gcc 7 kono parents: diff changeset	15 for more details.
04ced10e8804 gcc 7 kono parents: diff changeset	16
04ced10e8804 gcc 7 kono parents: diff changeset	17 You should have received a copy of the GNU General Public License
04ced10e8804 gcc 7 kono parents: diff changeset	18 along with GCC; see the file COPYING3. If not see
04ced10e8804 gcc 7 kono parents: diff changeset	19 <http://www.gnu.org/licenses/>. */
04ced10e8804 gcc 7 kono parents: diff changeset	20
04ced10e8804 gcc 7 kono parents: diff changeset	21 #include "config.h"
04ced10e8804 gcc 7 kono parents: diff changeset	22 #include "system.h"
04ced10e8804 gcc 7 kono parents: diff changeset	23 #include "coretypes.h"
04ced10e8804 gcc 7 kono parents: diff changeset	24 #include "backend.h"
04ced10e8804 gcc 7 kono parents: diff changeset	25 #include "tree.h"
04ced10e8804 gcc 7 kono parents: diff changeset	26 #include "gimple.h"
04ced10e8804 gcc 7 kono parents: diff changeset	27 #include "tree-pass.h"
04ced10e8804 gcc 7 kono parents: diff changeset	28 #include "ssa.h"
04ced10e8804 gcc 7 kono parents: diff changeset	29 #include "cgraph.h"
04ced10e8804 gcc 7 kono parents: diff changeset	30 #include "pretty-print.h"
04ced10e8804 gcc 7 kono parents: diff changeset	31 #include "fold-const.h"
04ced10e8804 gcc 7 kono parents: diff changeset	32 #include "gimplify.h"
04ced10e8804 gcc 7 kono parents: diff changeset	33 #include "gimple-iterator.h"
04ced10e8804 gcc 7 kono parents: diff changeset	34 #include "gimple-walk.h"
04ced10e8804 gcc 7 kono parents: diff changeset	35 #include "tree-inline.h"
04ced10e8804 gcc 7 kono parents: diff changeset	36 #include "langhooks.h"
04ced10e8804 gcc 7 kono parents: diff changeset	37 #include "omp-general.h"
04ced10e8804 gcc 7 kono parents: diff changeset	38 #include "omp-low.h"
04ced10e8804 gcc 7 kono parents: diff changeset	39 #include "omp-grid.h"
04ced10e8804 gcc 7 kono parents: diff changeset	40 #include "gimple-pretty-print.h"
04ced10e8804 gcc 7 kono parents: diff changeset	41
04ced10e8804 gcc 7 kono parents: diff changeset	42 /* Return the lastprivate predicate for a given gridified loop described by
04ced10e8804 gcc 7 kono parents: diff changeset	43 FD). */
04ced10e8804 gcc 7 kono parents: diff changeset	44
04ced10e8804 gcc 7 kono parents: diff changeset	45 tree
04ced10e8804 gcc 7 kono parents: diff changeset	46 omp_grid_lastprivate_predicate (struct omp_for_data *fd)
04ced10e8804 gcc 7 kono parents: diff changeset	47 {
04ced10e8804 gcc 7 kono parents: diff changeset	48 /* When dealing with a gridified loop, we need to check up to three collapsed
04ced10e8804 gcc 7 kono parents: diff changeset	49 iteration variables but they are not actually captured in this fd.
04ced10e8804 gcc 7 kono parents: diff changeset	50 Fortunately, we can easily rely on HSA builtins to get this
04ced10e8804 gcc 7 kono parents: diff changeset	51 information. */
04ced10e8804 gcc 7 kono parents: diff changeset	52
04ced10e8804 gcc 7 kono parents: diff changeset	53 tree id, size;
04ced10e8804 gcc 7 kono parents: diff changeset	54 if (gimple_omp_for_kind (fd->for_stmt) == GF_OMP_FOR_KIND_GRID_LOOP
04ced10e8804 gcc 7 kono parents: diff changeset	55 && gimple_omp_for_grid_intra_group (fd->for_stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	56 {
04ced10e8804 gcc 7 kono parents: diff changeset	57 id = builtin_decl_explicit (BUILT_IN_HSA_WORKITEMID);
04ced10e8804 gcc 7 kono parents: diff changeset	58 size = builtin_decl_explicit (BUILT_IN_HSA_CURRENTWORKGROUPSIZE);
04ced10e8804 gcc 7 kono parents: diff changeset	59 }
04ced10e8804 gcc 7 kono parents: diff changeset	60 else
04ced10e8804 gcc 7 kono parents: diff changeset	61 {
04ced10e8804 gcc 7 kono parents: diff changeset	62 id = builtin_decl_explicit (BUILT_IN_HSA_WORKITEMABSID);
04ced10e8804 gcc 7 kono parents: diff changeset	63 size = builtin_decl_explicit (BUILT_IN_HSA_GRIDSIZE);
04ced10e8804 gcc 7 kono parents: diff changeset	64 }
04ced10e8804 gcc 7 kono parents: diff changeset	65 tree cond = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	66 for (int dim = 0; dim < fd->collapse; dim++)
04ced10e8804 gcc 7 kono parents: diff changeset	67 {
04ced10e8804 gcc 7 kono parents: diff changeset	68 tree dim_tree = build_int_cstu (unsigned_type_node, dim);
04ced10e8804 gcc 7 kono parents: diff changeset	69 tree u1 = build_int_cstu (unsigned_type_node, 1);
04ced10e8804 gcc 7 kono parents: diff changeset	70 tree c2
04ced10e8804 gcc 7 kono parents: diff changeset	71 = build2 (EQ_EXPR, boolean_type_node,
04ced10e8804 gcc 7 kono parents: diff changeset	72 build2 (PLUS_EXPR, unsigned_type_node,
04ced10e8804 gcc 7 kono parents: diff changeset	73 build_call_expr (id, 1, dim_tree), u1),
04ced10e8804 gcc 7 kono parents: diff changeset	74 build_call_expr (size, 1, dim_tree));
04ced10e8804 gcc 7 kono parents: diff changeset	75 if (cond)
04ced10e8804 gcc 7 kono parents: diff changeset	76 cond = build2 (TRUTH_AND_EXPR, boolean_type_node, cond, c2);
04ced10e8804 gcc 7 kono parents: diff changeset	77 else
04ced10e8804 gcc 7 kono parents: diff changeset	78 cond = c2;
04ced10e8804 gcc 7 kono parents: diff changeset	79 }
04ced10e8804 gcc 7 kono parents: diff changeset	80 return cond;
04ced10e8804 gcc 7 kono parents: diff changeset	81 }
04ced10e8804 gcc 7 kono parents: diff changeset	82
04ced10e8804 gcc 7 kono parents: diff changeset	83 /* Structure describing the basic properties of the loop we ara analyzing
04ced10e8804 gcc 7 kono parents: diff changeset	84 whether it can be gridified and when it is gridified. */
04ced10e8804 gcc 7 kono parents: diff changeset	85
04ced10e8804 gcc 7 kono parents: diff changeset	86 struct grid_prop
04ced10e8804 gcc 7 kono parents: diff changeset	87 {
04ced10e8804 gcc 7 kono parents: diff changeset	88 /* True when we are doing tiling gridification, i.e. when there is a distinct
04ced10e8804 gcc 7 kono parents: diff changeset	89 distribute loop over groups and a loop construct over work-items. False
04ced10e8804 gcc 7 kono parents: diff changeset	90 when distribute and parallel for loops form a combined construct. */
04ced10e8804 gcc 7 kono parents: diff changeset	91 bool tiling;
04ced10e8804 gcc 7 kono parents: diff changeset	92 /* Location of the target construct for optimization information
04ced10e8804 gcc 7 kono parents: diff changeset	93 messages. */
04ced10e8804 gcc 7 kono parents: diff changeset	94 location_t target_loc;
04ced10e8804 gcc 7 kono parents: diff changeset	95 /* The collapse clause of the involved loops. Collapse value of all of them
04ced10e8804 gcc 7 kono parents: diff changeset	96 must be the same for gridification to take place. */
04ced10e8804 gcc 7 kono parents: diff changeset	97 size_t collapse;
04ced10e8804 gcc 7 kono parents: diff changeset	98 /* Group sizes, if requested by the user or NULL if not requested. */
04ced10e8804 gcc 7 kono parents: diff changeset	99 tree group_sizes[3];
04ced10e8804 gcc 7 kono parents: diff changeset	100 };
04ced10e8804 gcc 7 kono parents: diff changeset	101
04ced10e8804 gcc 7 kono parents: diff changeset	102 #define GRID_MISSED_MSG_PREFIX "Will not turn target construct into a " \
04ced10e8804 gcc 7 kono parents: diff changeset	103 "gridified HSA kernel because "
04ced10e8804 gcc 7 kono parents: diff changeset	104
04ced10e8804 gcc 7 kono parents: diff changeset	105 /* Return true if STMT is an assignment of a register-type into a local
04ced10e8804 gcc 7 kono parents: diff changeset	106 VAR_DECL. If GRID is non-NULL, the assignment additionally must not be to
04ced10e8804 gcc 7 kono parents: diff changeset	107 any of the trees specifying group sizes there. */
04ced10e8804 gcc 7 kono parents: diff changeset	108
04ced10e8804 gcc 7 kono parents: diff changeset	109 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	110 grid_safe_assignment_p (gimple stmt, grid_prop grid)
04ced10e8804 gcc 7 kono parents: diff changeset	111 {
04ced10e8804 gcc 7 kono parents: diff changeset	112 gassign assign = dyn_cast <gassign > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	113 if (!assign)
04ced10e8804 gcc 7 kono parents: diff changeset	114 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	115 if (gimple_clobber_p (assign))
04ced10e8804 gcc 7 kono parents: diff changeset	116 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	117 tree lhs = gimple_assign_lhs (assign);
04ced10e8804 gcc 7 kono parents: diff changeset	118 if (!VAR_P (lhs)
04ced10e8804 gcc 7 kono parents: diff changeset	119 \|\| !is_gimple_reg_type (TREE_TYPE (lhs))
04ced10e8804 gcc 7 kono parents: diff changeset	120 \|\| is_global_var (lhs))
04ced10e8804 gcc 7 kono parents: diff changeset	121 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	122 if (grid)
04ced10e8804 gcc 7 kono parents: diff changeset	123 for (unsigned i = 0; i < grid->collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	124 if (lhs == grid->group_sizes[i])
04ced10e8804 gcc 7 kono parents: diff changeset	125 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	126 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	127 }
04ced10e8804 gcc 7 kono parents: diff changeset	128
04ced10e8804 gcc 7 kono parents: diff changeset	129 /* Return true if all statements in SEQ are assignments to local register-type
04ced10e8804 gcc 7 kono parents: diff changeset	130 variables that do not hold group size information. */
04ced10e8804 gcc 7 kono parents: diff changeset	131
04ced10e8804 gcc 7 kono parents: diff changeset	132 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	133 grid_seq_only_contains_local_assignments (gimple_seq seq, grid_prop *grid)
04ced10e8804 gcc 7 kono parents: diff changeset	134 {
04ced10e8804 gcc 7 kono parents: diff changeset	135 if (!seq)
04ced10e8804 gcc 7 kono parents: diff changeset	136 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	137
04ced10e8804 gcc 7 kono parents: diff changeset	138 gimple_stmt_iterator gsi;
04ced10e8804 gcc 7 kono parents: diff changeset	139 for (gsi = gsi_start (seq); !gsi_end_p (gsi); gsi_next (&gsi))
04ced10e8804 gcc 7 kono parents: diff changeset	140 if (!grid_safe_assignment_p (gsi_stmt (gsi), grid))
04ced10e8804 gcc 7 kono parents: diff changeset	141 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	142 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	143 }
04ced10e8804 gcc 7 kono parents: diff changeset	144
04ced10e8804 gcc 7 kono parents: diff changeset	145 /* Scan statements in SEQ and call itself recursively on any bind. GRID
04ced10e8804 gcc 7 kono parents: diff changeset	146 describes hitherto discovered properties of the loop that is evaluated for
04ced10e8804 gcc 7 kono parents: diff changeset	147 possible gridification. If during whole search only assignments to
04ced10e8804 gcc 7 kono parents: diff changeset	148 register-type local variables (that do not overwrite group size information)
04ced10e8804 gcc 7 kono parents: diff changeset	149 and one single OMP statement is encountered, return true, otherwise return
04ced10e8804 gcc 7 kono parents: diff changeset	150 false. RET is where we store any OMP statement encountered. */
04ced10e8804 gcc 7 kono parents: diff changeset	151
04ced10e8804 gcc 7 kono parents: diff changeset	152 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	153 grid_find_single_omp_among_assignments_1 (gimple_seq seq, grid_prop *grid,
04ced10e8804 gcc 7 kono parents: diff changeset	154 const char name, gimple *ret)
04ced10e8804 gcc 7 kono parents: diff changeset	155 {
04ced10e8804 gcc 7 kono parents: diff changeset	156 gimple_stmt_iterator gsi;
04ced10e8804 gcc 7 kono parents: diff changeset	157 for (gsi = gsi_start (seq); !gsi_end_p (gsi); gsi_next (&gsi))
04ced10e8804 gcc 7 kono parents: diff changeset	158 {
04ced10e8804 gcc 7 kono parents: diff changeset	159 gimple *stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	160
04ced10e8804 gcc 7 kono parents: diff changeset	161 if (grid_safe_assignment_p (stmt, grid))
04ced10e8804 gcc 7 kono parents: diff changeset	162 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	163 if (gbind bind = dyn_cast <gbind > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	164 {
04ced10e8804 gcc 7 kono parents: diff changeset	165 gimple_seq bind_body = gimple_bind_body (bind);
04ced10e8804 gcc 7 kono parents: diff changeset	166 if (!grid_find_single_omp_among_assignments_1 (bind_body, grid, name,
04ced10e8804 gcc 7 kono parents: diff changeset	167 ret))
04ced10e8804 gcc 7 kono parents: diff changeset	168 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	169 }
04ced10e8804 gcc 7 kono parents: diff changeset	170 else if (is_gimple_omp (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	171 {
04ced10e8804 gcc 7 kono parents: diff changeset	172 if (*ret)
04ced10e8804 gcc 7 kono parents: diff changeset	173 {
04ced10e8804 gcc 7 kono parents: diff changeset	174 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	175 {
04ced10e8804 gcc 7 kono parents: diff changeset	176 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	177 GRID_MISSED_MSG_PREFIX "%s construct "
04ced10e8804 gcc 7 kono parents: diff changeset	178 "contains multiple OpenMP constructs\n",
04ced10e8804 gcc 7 kono parents: diff changeset	179 name);
04ced10e8804 gcc 7 kono parents: diff changeset	180 dump_printf_loc (MSG_NOTE, gimple_location (*ret),
04ced10e8804 gcc 7 kono parents: diff changeset	181 "The first OpenMP construct within "
04ced10e8804 gcc 7 kono parents: diff changeset	182 "a parallel\n");
04ced10e8804 gcc 7 kono parents: diff changeset	183 dump_printf_loc (MSG_NOTE, gimple_location (stmt),
04ced10e8804 gcc 7 kono parents: diff changeset	184 "The second OpenMP construct within "
04ced10e8804 gcc 7 kono parents: diff changeset	185 "a parallel\n");
04ced10e8804 gcc 7 kono parents: diff changeset	186 }
04ced10e8804 gcc 7 kono parents: diff changeset	187 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	188 }
04ced10e8804 gcc 7 kono parents: diff changeset	189 *ret = stmt;
04ced10e8804 gcc 7 kono parents: diff changeset	190 }
04ced10e8804 gcc 7 kono parents: diff changeset	191 else
04ced10e8804 gcc 7 kono parents: diff changeset	192 {
04ced10e8804 gcc 7 kono parents: diff changeset	193 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	194 {
04ced10e8804 gcc 7 kono parents: diff changeset	195 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	196 GRID_MISSED_MSG_PREFIX "%s construct contains "
04ced10e8804 gcc 7 kono parents: diff changeset	197 "a complex statement\n", name);
04ced10e8804 gcc 7 kono parents: diff changeset	198 dump_printf_loc (MSG_NOTE, gimple_location (stmt),
04ced10e8804 gcc 7 kono parents: diff changeset	199 "This statement cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	200 "gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	201 }
04ced10e8804 gcc 7 kono parents: diff changeset	202 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	203 }
04ced10e8804 gcc 7 kono parents: diff changeset	204 }
04ced10e8804 gcc 7 kono parents: diff changeset	205 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	206 }
04ced10e8804 gcc 7 kono parents: diff changeset	207
04ced10e8804 gcc 7 kono parents: diff changeset	208 /* Scan statements in SEQ and make sure that it and any binds in it contain
04ced10e8804 gcc 7 kono parents: diff changeset	209 only assignments to local register-type variables (that do not overwrite
04ced10e8804 gcc 7 kono parents: diff changeset	210 group size information) and one OMP construct. If so, return that
04ced10e8804 gcc 7 kono parents: diff changeset	211 construct, otherwise return NULL. GRID describes hitherto discovered
04ced10e8804 gcc 7 kono parents: diff changeset	212 properties of the loop that is evaluated for possible gridification. If
04ced10e8804 gcc 7 kono parents: diff changeset	213 dumping is enabled and function fails, use NAME to dump a note with the
04ced10e8804 gcc 7 kono parents: diff changeset	214 reason for failure. */
04ced10e8804 gcc 7 kono parents: diff changeset	215
04ced10e8804 gcc 7 kono parents: diff changeset	216 static gimple *
04ced10e8804 gcc 7 kono parents: diff changeset	217 grid_find_single_omp_among_assignments (gimple_seq seq, grid_prop *grid,
04ced10e8804 gcc 7 kono parents: diff changeset	218 const char *name)
04ced10e8804 gcc 7 kono parents: diff changeset	219 {
04ced10e8804 gcc 7 kono parents: diff changeset	220 if (!seq)
04ced10e8804 gcc 7 kono parents: diff changeset	221 {
04ced10e8804 gcc 7 kono parents: diff changeset	222 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	223 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	224 GRID_MISSED_MSG_PREFIX "%s construct has empty body\n",
04ced10e8804 gcc 7 kono parents: diff changeset	225 name);
04ced10e8804 gcc 7 kono parents: diff changeset	226 return NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	227 }
04ced10e8804 gcc 7 kono parents: diff changeset	228
04ced10e8804 gcc 7 kono parents: diff changeset	229 gimple *ret = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	230 if (grid_find_single_omp_among_assignments_1 (seq, grid, name, &ret))
04ced10e8804 gcc 7 kono parents: diff changeset	231 {
04ced10e8804 gcc 7 kono parents: diff changeset	232 if (!ret && dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	233 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	234 GRID_MISSED_MSG_PREFIX "%s construct does not contain"
04ced10e8804 gcc 7 kono parents: diff changeset	235 " any other OpenMP construct\n", name);
04ced10e8804 gcc 7 kono parents: diff changeset	236 return ret;
04ced10e8804 gcc 7 kono parents: diff changeset	237 }
04ced10e8804 gcc 7 kono parents: diff changeset	238 else
04ced10e8804 gcc 7 kono parents: diff changeset	239 return NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	240 }
04ced10e8804 gcc 7 kono parents: diff changeset	241
04ced10e8804 gcc 7 kono parents: diff changeset	242 /* Walker function looking for statements there is no point gridifying (and for
04ced10e8804 gcc 7 kono parents: diff changeset	243 noreturn function calls which we cannot do). Return non-NULL if such a
04ced10e8804 gcc 7 kono parents: diff changeset	244 function is found. */
04ced10e8804 gcc 7 kono parents: diff changeset	245
04ced10e8804 gcc 7 kono parents: diff changeset	246 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	247 grid_find_ungridifiable_statement (gimple_stmt_iterator *gsi,
04ced10e8804 gcc 7 kono parents: diff changeset	248 bool *handled_ops_p,
04ced10e8804 gcc 7 kono parents: diff changeset	249 struct walk_stmt_info *wi)
04ced10e8804 gcc 7 kono parents: diff changeset	250 {
04ced10e8804 gcc 7 kono parents: diff changeset	251 *handled_ops_p = false;
04ced10e8804 gcc 7 kono parents: diff changeset	252 gimple stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	253 switch (gimple_code (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	254 {
04ced10e8804 gcc 7 kono parents: diff changeset	255 case GIMPLE_CALL:
04ced10e8804 gcc 7 kono parents: diff changeset	256 if (gimple_call_noreturn_p (as_a <gcall *> (stmt)))
04ced10e8804 gcc 7 kono parents: diff changeset	257 {
04ced10e8804 gcc 7 kono parents: diff changeset	258 *handled_ops_p = true;
04ced10e8804 gcc 7 kono parents: diff changeset	259 wi->info = stmt;
04ced10e8804 gcc 7 kono parents: diff changeset	260 return error_mark_node;
04ced10e8804 gcc 7 kono parents: diff changeset	261 }
04ced10e8804 gcc 7 kono parents: diff changeset	262 break;
04ced10e8804 gcc 7 kono parents: diff changeset	263
04ced10e8804 gcc 7 kono parents: diff changeset	264 /* We may reduce the following list if we find a way to implement the
04ced10e8804 gcc 7 kono parents: diff changeset	265 clauses, but now there is no point trying further. */
04ced10e8804 gcc 7 kono parents: diff changeset	266 case GIMPLE_OMP_CRITICAL:
04ced10e8804 gcc 7 kono parents: diff changeset	267 case GIMPLE_OMP_TASKGROUP:
04ced10e8804 gcc 7 kono parents: diff changeset	268 case GIMPLE_OMP_TASK:
04ced10e8804 gcc 7 kono parents: diff changeset	269 case GIMPLE_OMP_SECTION:
04ced10e8804 gcc 7 kono parents: diff changeset	270 case GIMPLE_OMP_SECTIONS:
04ced10e8804 gcc 7 kono parents: diff changeset	271 case GIMPLE_OMP_SECTIONS_SWITCH:
04ced10e8804 gcc 7 kono parents: diff changeset	272 case GIMPLE_OMP_TARGET:
04ced10e8804 gcc 7 kono parents: diff changeset	273 case GIMPLE_OMP_ORDERED:
04ced10e8804 gcc 7 kono parents: diff changeset	274 *handled_ops_p = true;
04ced10e8804 gcc 7 kono parents: diff changeset	275 wi->info = stmt;
04ced10e8804 gcc 7 kono parents: diff changeset	276 return error_mark_node;
04ced10e8804 gcc 7 kono parents: diff changeset	277 default:
04ced10e8804 gcc 7 kono parents: diff changeset	278 break;
04ced10e8804 gcc 7 kono parents: diff changeset	279 }
04ced10e8804 gcc 7 kono parents: diff changeset	280 return NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	281 }
04ced10e8804 gcc 7 kono parents: diff changeset	282
04ced10e8804 gcc 7 kono parents: diff changeset	283 /* Examine clauses of omp parallel statement PAR and if any prevents
04ced10e8804 gcc 7 kono parents: diff changeset	284 gridification, issue a missed-optimization diagnostics and return false,
04ced10e8804 gcc 7 kono parents: diff changeset	285 otherwise return true. GRID describes hitherto discovered properties of the
04ced10e8804 gcc 7 kono parents: diff changeset	286 loop that is evaluated for possible gridification. */
04ced10e8804 gcc 7 kono parents: diff changeset	287
04ced10e8804 gcc 7 kono parents: diff changeset	288 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	289 grid_parallel_clauses_gridifiable (gomp_parallel *par, location_t tloc)
04ced10e8804 gcc 7 kono parents: diff changeset	290 {
04ced10e8804 gcc 7 kono parents: diff changeset	291 tree clauses = gimple_omp_parallel_clauses (par);
04ced10e8804 gcc 7 kono parents: diff changeset	292 while (clauses)
04ced10e8804 gcc 7 kono parents: diff changeset	293 {
04ced10e8804 gcc 7 kono parents: diff changeset	294 switch (OMP_CLAUSE_CODE (clauses))
04ced10e8804 gcc 7 kono parents: diff changeset	295 {
04ced10e8804 gcc 7 kono parents: diff changeset	296 case OMP_CLAUSE_NUM_THREADS:
04ced10e8804 gcc 7 kono parents: diff changeset	297 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	298 {
04ced10e8804 gcc 7 kono parents: diff changeset	299 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	300 GRID_MISSED_MSG_PREFIX "because there is "
04ced10e8804 gcc 7 kono parents: diff changeset	301 "a num_threads clause of the parallel "
04ced10e8804 gcc 7 kono parents: diff changeset	302 "construct\n");
04ced10e8804 gcc 7 kono parents: diff changeset	303 dump_printf_loc (MSG_NOTE, gimple_location (par),
04ced10e8804 gcc 7 kono parents: diff changeset	304 "Parallel construct has a num_threads clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	305 }
04ced10e8804 gcc 7 kono parents: diff changeset	306 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	307
04ced10e8804 gcc 7 kono parents: diff changeset	308 case OMP_CLAUSE_REDUCTION:
04ced10e8804 gcc 7 kono parents: diff changeset	309 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	310 {
04ced10e8804 gcc 7 kono parents: diff changeset	311 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	312 GRID_MISSED_MSG_PREFIX "a reduction clause "
04ced10e8804 gcc 7 kono parents: diff changeset	313 "is present\n ");
04ced10e8804 gcc 7 kono parents: diff changeset	314 dump_printf_loc (MSG_NOTE, gimple_location (par),
04ced10e8804 gcc 7 kono parents: diff changeset	315 "Parallel construct has a reduction clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	316 }
04ced10e8804 gcc 7 kono parents: diff changeset	317 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	318
04ced10e8804 gcc 7 kono parents: diff changeset	319 default:
04ced10e8804 gcc 7 kono parents: diff changeset	320 break;
04ced10e8804 gcc 7 kono parents: diff changeset	321 }
04ced10e8804 gcc 7 kono parents: diff changeset	322 clauses = OMP_CLAUSE_CHAIN (clauses);
04ced10e8804 gcc 7 kono parents: diff changeset	323 }
04ced10e8804 gcc 7 kono parents: diff changeset	324 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	325 }
04ced10e8804 gcc 7 kono parents: diff changeset	326
04ced10e8804 gcc 7 kono parents: diff changeset	327 /* Examine clauses and the body of omp loop statement GFOR and if something
04ced10e8804 gcc 7 kono parents: diff changeset	328 prevents gridification, issue a missed-optimization diagnostics and return
04ced10e8804 gcc 7 kono parents: diff changeset	329 false, otherwise return true. GRID describes hitherto discovered properties
04ced10e8804 gcc 7 kono parents: diff changeset	330 of the loop that is evaluated for possible gridification. */
04ced10e8804 gcc 7 kono parents: diff changeset	331
04ced10e8804 gcc 7 kono parents: diff changeset	332 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	333 grid_inner_loop_gridifiable_p (gomp_for gfor, grid_prop grid)
04ced10e8804 gcc 7 kono parents: diff changeset	334 {
04ced10e8804 gcc 7 kono parents: diff changeset	335 if (!grid_seq_only_contains_local_assignments (gimple_omp_for_pre_body (gfor),
04ced10e8804 gcc 7 kono parents: diff changeset	336 grid))
04ced10e8804 gcc 7 kono parents: diff changeset	337 {
04ced10e8804 gcc 7 kono parents: diff changeset	338 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	339 {
04ced10e8804 gcc 7 kono parents: diff changeset	340 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	341 GRID_MISSED_MSG_PREFIX "the inner loop "
04ced10e8804 gcc 7 kono parents: diff changeset	342 "loop bounds computation contains a complex "
04ced10e8804 gcc 7 kono parents: diff changeset	343 "statement\n");
04ced10e8804 gcc 7 kono parents: diff changeset	344 dump_printf_loc (MSG_NOTE, gimple_location (gfor),
04ced10e8804 gcc 7 kono parents: diff changeset	345 "Loop construct cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	346 "gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	347 }
04ced10e8804 gcc 7 kono parents: diff changeset	348 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	349 }
04ced10e8804 gcc 7 kono parents: diff changeset	350
04ced10e8804 gcc 7 kono parents: diff changeset	351 tree clauses = gimple_omp_for_clauses (gfor);
04ced10e8804 gcc 7 kono parents: diff changeset	352 while (clauses)
04ced10e8804 gcc 7 kono parents: diff changeset	353 {
04ced10e8804 gcc 7 kono parents: diff changeset	354 switch (OMP_CLAUSE_CODE (clauses))
04ced10e8804 gcc 7 kono parents: diff changeset	355 {
04ced10e8804 gcc 7 kono parents: diff changeset	356 case OMP_CLAUSE_SCHEDULE:
04ced10e8804 gcc 7 kono parents: diff changeset	357 if (OMP_CLAUSE_SCHEDULE_KIND (clauses) != OMP_CLAUSE_SCHEDULE_AUTO)
04ced10e8804 gcc 7 kono parents: diff changeset	358 {
04ced10e8804 gcc 7 kono parents: diff changeset	359 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	360 {
04ced10e8804 gcc 7 kono parents: diff changeset	361 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	362 GRID_MISSED_MSG_PREFIX "the inner loop "
04ced10e8804 gcc 7 kono parents: diff changeset	363 "has a non-automatic schedule clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	364 dump_printf_loc (MSG_NOTE, gimple_location (gfor),
04ced10e8804 gcc 7 kono parents: diff changeset	365 "Loop construct has a non automatic "
04ced10e8804 gcc 7 kono parents: diff changeset	366 "schedule clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	367 }
04ced10e8804 gcc 7 kono parents: diff changeset	368 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	369 }
04ced10e8804 gcc 7 kono parents: diff changeset	370 break;
04ced10e8804 gcc 7 kono parents: diff changeset	371
04ced10e8804 gcc 7 kono parents: diff changeset	372 case OMP_CLAUSE_REDUCTION:
04ced10e8804 gcc 7 kono parents: diff changeset	373 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	374 {
04ced10e8804 gcc 7 kono parents: diff changeset	375 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	376 GRID_MISSED_MSG_PREFIX "a reduction "
04ced10e8804 gcc 7 kono parents: diff changeset	377 "clause is present\n ");
04ced10e8804 gcc 7 kono parents: diff changeset	378 dump_printf_loc (MSG_NOTE, gimple_location (gfor),
04ced10e8804 gcc 7 kono parents: diff changeset	379 "Loop construct has a reduction schedule "
04ced10e8804 gcc 7 kono parents: diff changeset	380 "clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	381 }
04ced10e8804 gcc 7 kono parents: diff changeset	382 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	383
04ced10e8804 gcc 7 kono parents: diff changeset	384 default:
04ced10e8804 gcc 7 kono parents: diff changeset	385 break;
04ced10e8804 gcc 7 kono parents: diff changeset	386 }
04ced10e8804 gcc 7 kono parents: diff changeset	387 clauses = OMP_CLAUSE_CHAIN (clauses);
04ced10e8804 gcc 7 kono parents: diff changeset	388 }
04ced10e8804 gcc 7 kono parents: diff changeset	389 struct walk_stmt_info wi;
04ced10e8804 gcc 7 kono parents: diff changeset	390 memset (&wi, 0, sizeof (wi));
04ced10e8804 gcc 7 kono parents: diff changeset	391 if (walk_gimple_seq (gimple_omp_body (gfor),
04ced10e8804 gcc 7 kono parents: diff changeset	392 grid_find_ungridifiable_statement,
04ced10e8804 gcc 7 kono parents: diff changeset	393 NULL, &wi))
04ced10e8804 gcc 7 kono parents: diff changeset	394 {
04ced10e8804 gcc 7 kono parents: diff changeset	395 gimple bad = (gimple ) wi.info;
04ced10e8804 gcc 7 kono parents: diff changeset	396 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	397 {
04ced10e8804 gcc 7 kono parents: diff changeset	398 if (is_gimple_call (bad))
04ced10e8804 gcc 7 kono parents: diff changeset	399 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	400 GRID_MISSED_MSG_PREFIX "the inner loop contains "
04ced10e8804 gcc 7 kono parents: diff changeset	401 "call to a noreturn function\n");
04ced10e8804 gcc 7 kono parents: diff changeset	402 else
04ced10e8804 gcc 7 kono parents: diff changeset	403 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	404 GRID_MISSED_MSG_PREFIX "the inner loop contains "
04ced10e8804 gcc 7 kono parents: diff changeset	405 "statement %s which cannot be transformed\n",
04ced10e8804 gcc 7 kono parents: diff changeset	406 gimple_code_name[(int) gimple_code (bad)]);
04ced10e8804 gcc 7 kono parents: diff changeset	407 dump_printf_loc (MSG_NOTE, gimple_location (bad),
04ced10e8804 gcc 7 kono parents: diff changeset	408 "This statement cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	409 "gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	410 }
04ced10e8804 gcc 7 kono parents: diff changeset	411 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	412 }
04ced10e8804 gcc 7 kono parents: diff changeset	413 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	414 }
04ced10e8804 gcc 7 kono parents: diff changeset	415
04ced10e8804 gcc 7 kono parents: diff changeset	416 /* Given distribute omp construct represented by DIST, which in the original
04ced10e8804 gcc 7 kono parents: diff changeset	417 source forms a compound construct with a looping construct, return true if it
04ced10e8804 gcc 7 kono parents: diff changeset	418 can be turned into a gridified HSA kernel. Otherwise return false. GRID
04ced10e8804 gcc 7 kono parents: diff changeset	419 describes hitherto discovered properties of the loop that is evaluated for
04ced10e8804 gcc 7 kono parents: diff changeset	420 possible gridification. */
04ced10e8804 gcc 7 kono parents: diff changeset	421
04ced10e8804 gcc 7 kono parents: diff changeset	422 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	423 grid_dist_follows_simple_pattern (gomp_for dist, grid_prop grid)
04ced10e8804 gcc 7 kono parents: diff changeset	424 {
04ced10e8804 gcc 7 kono parents: diff changeset	425 location_t tloc = grid->target_loc;
04ced10e8804 gcc 7 kono parents: diff changeset	426 gimple *stmt = grid_find_single_omp_among_assignments (gimple_omp_body (dist),
04ced10e8804 gcc 7 kono parents: diff changeset	427 grid, "distribute");
04ced10e8804 gcc 7 kono parents: diff changeset	428 gomp_parallel *par;
04ced10e8804 gcc 7 kono parents: diff changeset	429 if (!stmt
04ced10e8804 gcc 7 kono parents: diff changeset	430 \|\| !(par = dyn_cast <gomp_parallel *> (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	431 \|\| !grid_parallel_clauses_gridifiable (par, tloc))
04ced10e8804 gcc 7 kono parents: diff changeset	432 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	433
04ced10e8804 gcc 7 kono parents: diff changeset	434 stmt = grid_find_single_omp_among_assignments (gimple_omp_body (par), grid,
04ced10e8804 gcc 7 kono parents: diff changeset	435 "parallel");
04ced10e8804 gcc 7 kono parents: diff changeset	436 gomp_for *gfor;
04ced10e8804 gcc 7 kono parents: diff changeset	437 if (!stmt \|\| !(gfor = dyn_cast <gomp_for *> (stmt)))
04ced10e8804 gcc 7 kono parents: diff changeset	438 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	439
04ced10e8804 gcc 7 kono parents: diff changeset	440 if (gimple_omp_for_kind (gfor) != GF_OMP_FOR_KIND_FOR)
04ced10e8804 gcc 7 kono parents: diff changeset	441 {
04ced10e8804 gcc 7 kono parents: diff changeset	442 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	443 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	444 GRID_MISSED_MSG_PREFIX "the inner loop is not "
04ced10e8804 gcc 7 kono parents: diff changeset	445 "a simple for loop\n");
04ced10e8804 gcc 7 kono parents: diff changeset	446 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	447 }
04ced10e8804 gcc 7 kono parents: diff changeset	448 gcc_assert (gimple_omp_for_collapse (gfor) == grid->collapse);
04ced10e8804 gcc 7 kono parents: diff changeset	449
04ced10e8804 gcc 7 kono parents: diff changeset	450 if (!grid_inner_loop_gridifiable_p (gfor, grid))
04ced10e8804 gcc 7 kono parents: diff changeset	451 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	452
04ced10e8804 gcc 7 kono parents: diff changeset	453 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	454 }
04ced10e8804 gcc 7 kono parents: diff changeset	455
04ced10e8804 gcc 7 kono parents: diff changeset	456 /* Given an omp loop statement GFOR, return true if it can participate in
04ced10e8804 gcc 7 kono parents: diff changeset	457 tiling gridification, i.e. in one where the distribute and parallel for
04ced10e8804 gcc 7 kono parents: diff changeset	458 loops do not form a compound statement. GRID describes hitherto discovered
04ced10e8804 gcc 7 kono parents: diff changeset	459 properties of the loop that is evaluated for possible gridification. */
04ced10e8804 gcc 7 kono parents: diff changeset	460
04ced10e8804 gcc 7 kono parents: diff changeset	461 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	462 grid_gfor_follows_tiling_pattern (gomp_for gfor, grid_prop grid)
04ced10e8804 gcc 7 kono parents: diff changeset	463 {
04ced10e8804 gcc 7 kono parents: diff changeset	464 if (gimple_omp_for_kind (gfor) != GF_OMP_FOR_KIND_FOR)
04ced10e8804 gcc 7 kono parents: diff changeset	465 {
04ced10e8804 gcc 7 kono parents: diff changeset	466 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	467 {
04ced10e8804 gcc 7 kono parents: diff changeset	468 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	469 GRID_MISSED_MSG_PREFIX "an inner loop is not "
04ced10e8804 gcc 7 kono parents: diff changeset	470 "a simple for loop\n");
04ced10e8804 gcc 7 kono parents: diff changeset	471 dump_printf_loc (MSG_NOTE, gimple_location (gfor),
04ced10e8804 gcc 7 kono parents: diff changeset	472 "This statement is not a simple for loop\n");
04ced10e8804 gcc 7 kono parents: diff changeset	473 }
04ced10e8804 gcc 7 kono parents: diff changeset	474 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	475 }
04ced10e8804 gcc 7 kono parents: diff changeset	476
04ced10e8804 gcc 7 kono parents: diff changeset	477 if (!grid_inner_loop_gridifiable_p (gfor, grid))
04ced10e8804 gcc 7 kono parents: diff changeset	478 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	479
04ced10e8804 gcc 7 kono parents: diff changeset	480 if (gimple_omp_for_collapse (gfor) != grid->collapse)
04ced10e8804 gcc 7 kono parents: diff changeset	481 {
04ced10e8804 gcc 7 kono parents: diff changeset	482 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	483 {
04ced10e8804 gcc 7 kono parents: diff changeset	484 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	485 GRID_MISSED_MSG_PREFIX "an inner loop does not "
04ced10e8804 gcc 7 kono parents: diff changeset	486 "have use the same collapse clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	487 dump_printf_loc (MSG_NOTE, gimple_location (gfor),
04ced10e8804 gcc 7 kono parents: diff changeset	488 "Loop construct uses a different collapse clause\n");
04ced10e8804 gcc 7 kono parents: diff changeset	489 }
04ced10e8804 gcc 7 kono parents: diff changeset	490 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	491 }
04ced10e8804 gcc 7 kono parents: diff changeset	492
04ced10e8804 gcc 7 kono parents: diff changeset	493 struct omp_for_data fd;
04ced10e8804 gcc 7 kono parents: diff changeset	494 struct omp_for_data_loop *loops
04ced10e8804 gcc 7 kono parents: diff changeset	495 = (struct omp_for_data_loop *)alloca (grid->collapse
04ced10e8804 gcc 7 kono parents: diff changeset	496 * sizeof (struct omp_for_data_loop));
04ced10e8804 gcc 7 kono parents: diff changeset	497 omp_extract_for_data (gfor, &fd, loops);
04ced10e8804 gcc 7 kono parents: diff changeset	498 for (unsigned i = 0; i < grid->collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	499 {
04ced10e8804 gcc 7 kono parents: diff changeset	500 tree itype, type = TREE_TYPE (fd.loops[i].v);
04ced10e8804 gcc 7 kono parents: diff changeset	501 if (POINTER_TYPE_P (type))
04ced10e8804 gcc 7 kono parents: diff changeset	502 itype = signed_type_for (type);
04ced10e8804 gcc 7 kono parents: diff changeset	503 else
04ced10e8804 gcc 7 kono parents: diff changeset	504 itype = type;
04ced10e8804 gcc 7 kono parents: diff changeset	505
04ced10e8804 gcc 7 kono parents: diff changeset	506 tree n1 = fold_convert (itype, fd.loops[i].n1);
04ced10e8804 gcc 7 kono parents: diff changeset	507 tree n2 = fold_convert (itype, fd.loops[i].n2);
04ced10e8804 gcc 7 kono parents: diff changeset	508 tree t = build_int_cst (itype,
04ced10e8804 gcc 7 kono parents: diff changeset	509 (fd.loops[i].cond_code == LT_EXPR ? -1 : 1));
04ced10e8804 gcc 7 kono parents: diff changeset	510 t = fold_build2 (PLUS_EXPR, itype, fd.loops[i].step, t);
04ced10e8804 gcc 7 kono parents: diff changeset	511 t = fold_build2 (PLUS_EXPR, itype, t, n2);
04ced10e8804 gcc 7 kono parents: diff changeset	512 t = fold_build2 (MINUS_EXPR, itype, t, n1);
04ced10e8804 gcc 7 kono parents: diff changeset	513 if (TYPE_UNSIGNED (itype) && fd.loops[i].cond_code == GT_EXPR)
04ced10e8804 gcc 7 kono parents: diff changeset	514 t = fold_build2 (TRUNC_DIV_EXPR, itype,
04ced10e8804 gcc 7 kono parents: diff changeset	515 fold_build1 (NEGATE_EXPR, itype, t),
04ced10e8804 gcc 7 kono parents: diff changeset	516 fold_build1 (NEGATE_EXPR, itype, fd.loops[i].step));
04ced10e8804 gcc 7 kono parents: diff changeset	517 else
04ced10e8804 gcc 7 kono parents: diff changeset	518 t = fold_build2 (TRUNC_DIV_EXPR, itype, t, fd.loops[i].step);
04ced10e8804 gcc 7 kono parents: diff changeset	519
04ced10e8804 gcc 7 kono parents: diff changeset	520 if (!operand_equal_p (grid->group_sizes[i], t, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	521 {
04ced10e8804 gcc 7 kono parents: diff changeset	522 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	523 {
04ced10e8804 gcc 7 kono parents: diff changeset	524 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	525 GRID_MISSED_MSG_PREFIX "the distribute and "
04ced10e8804 gcc 7 kono parents: diff changeset	526 "an internal loop do not agree on tile size\n");
04ced10e8804 gcc 7 kono parents: diff changeset	527 dump_printf_loc (MSG_NOTE, gimple_location (gfor),
04ced10e8804 gcc 7 kono parents: diff changeset	528 "Loop construct does not seem to loop over "
04ced10e8804 gcc 7 kono parents: diff changeset	529 "a tile size\n");
04ced10e8804 gcc 7 kono parents: diff changeset	530 }
04ced10e8804 gcc 7 kono parents: diff changeset	531 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	532 }
04ced10e8804 gcc 7 kono parents: diff changeset	533 }
04ced10e8804 gcc 7 kono parents: diff changeset	534 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	535 }
04ced10e8804 gcc 7 kono parents: diff changeset	536
04ced10e8804 gcc 7 kono parents: diff changeset	537 /* Facing a call to FNDECL in the body of a distribute construct, return true
04ced10e8804 gcc 7 kono parents: diff changeset	538 if we can handle it or false if it precludes gridification. */
04ced10e8804 gcc 7 kono parents: diff changeset	539
04ced10e8804 gcc 7 kono parents: diff changeset	540 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	541 grid_call_permissible_in_distribute_p (tree fndecl)
04ced10e8804 gcc 7 kono parents: diff changeset	542 {
04ced10e8804 gcc 7 kono parents: diff changeset	543 if (DECL_PURE_P (fndecl) \|\| TREE_READONLY (fndecl))
04ced10e8804 gcc 7 kono parents: diff changeset	544 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	545
04ced10e8804 gcc 7 kono parents: diff changeset	546 const char *name = IDENTIFIER_POINTER (DECL_NAME (fndecl));
04ced10e8804 gcc 7 kono parents: diff changeset	547 if (strstr (name, "omp_") != name)
04ced10e8804 gcc 7 kono parents: diff changeset	548 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	549
04ced10e8804 gcc 7 kono parents: diff changeset	550 if ((strcmp (name, "omp_get_thread_num") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	551 \|\| (strcmp (name, "omp_get_num_threads") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	552 \|\| (strcmp (name, "omp_get_num_teams") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	553 \|\| (strcmp (name, "omp_get_team_num") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	554 \|\| (strcmp (name, "omp_get_level") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	555 \|\| (strcmp (name, "omp_get_active_level") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	556 \|\| (strcmp (name, "omp_in_parallel") == 0))
04ced10e8804 gcc 7 kono parents: diff changeset	557 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	558
04ced10e8804 gcc 7 kono parents: diff changeset	559 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	560 }
04ced10e8804 gcc 7 kono parents: diff changeset	561
04ced10e8804 gcc 7 kono parents: diff changeset	562 /* Facing a call satisfying grid_call_permissible_in_distribute_p in the body
04ced10e8804 gcc 7 kono parents: diff changeset	563 of a distribute construct that is pointed at by GSI, modify it as necessary
04ced10e8804 gcc 7 kono parents: diff changeset	564 for gridification. If the statement itself got removed, return true. */
04ced10e8804 gcc 7 kono parents: diff changeset	565
04ced10e8804 gcc 7 kono parents: diff changeset	566 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	567 grid_handle_call_in_distribute (gimple_stmt_iterator *gsi)
04ced10e8804 gcc 7 kono parents: diff changeset	568 {
04ced10e8804 gcc 7 kono parents: diff changeset	569 gimple stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	570 tree fndecl = gimple_call_fndecl (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	571 gcc_checking_assert (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	572 if (DECL_PURE_P (fndecl) \|\| TREE_READONLY (fndecl))
04ced10e8804 gcc 7 kono parents: diff changeset	573 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	574
04ced10e8804 gcc 7 kono parents: diff changeset	575 const char *name = IDENTIFIER_POINTER (DECL_NAME (fndecl));
04ced10e8804 gcc 7 kono parents: diff changeset	576 if ((strcmp (name, "omp_get_thread_num") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	577 \|\| (strcmp (name, "omp_get_level") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	578 \|\| (strcmp (name, "omp_get_active_level") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	579 \|\| (strcmp (name, "omp_in_parallel") == 0))
04ced10e8804 gcc 7 kono parents: diff changeset	580 {
04ced10e8804 gcc 7 kono parents: diff changeset	581 tree lhs = gimple_call_lhs (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	582 if (lhs)
04ced10e8804 gcc 7 kono parents: diff changeset	583 {
04ced10e8804 gcc 7 kono parents: diff changeset	584 gassign *assign
04ced10e8804 gcc 7 kono parents: diff changeset	585 = gimple_build_assign (lhs, build_zero_cst (TREE_TYPE (lhs)));
04ced10e8804 gcc 7 kono parents: diff changeset	586 gsi_insert_before (gsi, assign, GSI_SAME_STMT);
04ced10e8804 gcc 7 kono parents: diff changeset	587 }
04ced10e8804 gcc 7 kono parents: diff changeset	588 gsi_remove (gsi, true);
04ced10e8804 gcc 7 kono parents: diff changeset	589 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	590 }
04ced10e8804 gcc 7 kono parents: diff changeset	591
04ced10e8804 gcc 7 kono parents: diff changeset	592 /* The rest of the omp functions can stay as they are, HSA back-end will
04ced10e8804 gcc 7 kono parents: diff changeset	593 handle them correctly. */
04ced10e8804 gcc 7 kono parents: diff changeset	594 gcc_checking_assert ((strcmp (name, "omp_get_num_threads") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	595 \|\| (strcmp (name, "omp_get_num_teams") == 0)
04ced10e8804 gcc 7 kono parents: diff changeset	596 \|\| (strcmp (name, "omp_get_team_num") == 0));
04ced10e8804 gcc 7 kono parents: diff changeset	597 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	598 }
04ced10e8804 gcc 7 kono parents: diff changeset	599
04ced10e8804 gcc 7 kono parents: diff changeset	600 /* Given a sequence of statements within a distribute omp construct or a
04ced10e8804 gcc 7 kono parents: diff changeset	601 parallel construct, which in the original source does not form a compound
04ced10e8804 gcc 7 kono parents: diff changeset	602 construct with a looping construct, return true if it does not prevent us
04ced10e8804 gcc 7 kono parents: diff changeset	603 from turning it into a gridified HSA kernel. Otherwise return false. GRID
04ced10e8804 gcc 7 kono parents: diff changeset	604 describes hitherto discovered properties of the loop that is evaluated for
04ced10e8804 gcc 7 kono parents: diff changeset	605 possible gridification. IN_PARALLEL must be true if seq is within a
04ced10e8804 gcc 7 kono parents: diff changeset	606 parallel construct and flase if it is only within a distribute
04ced10e8804 gcc 7 kono parents: diff changeset	607 construct. */
04ced10e8804 gcc 7 kono parents: diff changeset	608
04ced10e8804 gcc 7 kono parents: diff changeset	609 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	610 grid_dist_follows_tiling_pattern (gimple_seq seq, grid_prop *grid,
04ced10e8804 gcc 7 kono parents: diff changeset	611 bool in_parallel)
04ced10e8804 gcc 7 kono parents: diff changeset	612 {
04ced10e8804 gcc 7 kono parents: diff changeset	613 gimple_stmt_iterator gsi;
04ced10e8804 gcc 7 kono parents: diff changeset	614 for (gsi = gsi_start (seq); !gsi_end_p (gsi); gsi_next (&gsi))
04ced10e8804 gcc 7 kono parents: diff changeset	615 {
04ced10e8804 gcc 7 kono parents: diff changeset	616 gimple *stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	617
04ced10e8804 gcc 7 kono parents: diff changeset	618 if (grid_safe_assignment_p (stmt, grid)
04ced10e8804 gcc 7 kono parents: diff changeset	619 \|\| gimple_code (stmt) == GIMPLE_GOTO
04ced10e8804 gcc 7 kono parents: diff changeset	620 \|\| gimple_code (stmt) == GIMPLE_LABEL
04ced10e8804 gcc 7 kono parents: diff changeset	621 \|\| gimple_code (stmt) == GIMPLE_COND)
04ced10e8804 gcc 7 kono parents: diff changeset	622 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	623 else if (gbind bind = dyn_cast <gbind > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	624 {
04ced10e8804 gcc 7 kono parents: diff changeset	625 if (!grid_dist_follows_tiling_pattern (gimple_bind_body (bind),
04ced10e8804 gcc 7 kono parents: diff changeset	626 grid, in_parallel))
04ced10e8804 gcc 7 kono parents: diff changeset	627 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	628 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	629 }
04ced10e8804 gcc 7 kono parents: diff changeset	630 else if (gtry try_stmt = dyn_cast <gtry > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	631 {
04ced10e8804 gcc 7 kono parents: diff changeset	632 if (gimple_try_kind (try_stmt) == GIMPLE_TRY_CATCH)
04ced10e8804 gcc 7 kono parents: diff changeset	633 {
04ced10e8804 gcc 7 kono parents: diff changeset	634 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	635 {
04ced10e8804 gcc 7 kono parents: diff changeset	636 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	637 GRID_MISSED_MSG_PREFIX "the distribute "
04ced10e8804 gcc 7 kono parents: diff changeset	638 "construct contains a try..catch region\n");
04ced10e8804 gcc 7 kono parents: diff changeset	639 dump_printf_loc (MSG_NOTE, gimple_location (try_stmt),
04ced10e8804 gcc 7 kono parents: diff changeset	640 "This statement cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	641 "tiled gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	642 }
04ced10e8804 gcc 7 kono parents: diff changeset	643 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	644 }
04ced10e8804 gcc 7 kono parents: diff changeset	645 if (!grid_dist_follows_tiling_pattern (gimple_try_eval (try_stmt),
04ced10e8804 gcc 7 kono parents: diff changeset	646 grid, in_parallel))
04ced10e8804 gcc 7 kono parents: diff changeset	647 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	648 if (!grid_dist_follows_tiling_pattern (gimple_try_cleanup (try_stmt),
04ced10e8804 gcc 7 kono parents: diff changeset	649 grid, in_parallel))
04ced10e8804 gcc 7 kono parents: diff changeset	650 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	651 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	652 }
04ced10e8804 gcc 7 kono parents: diff changeset	653 else if (is_gimple_call (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	654 {
04ced10e8804 gcc 7 kono parents: diff changeset	655 tree fndecl = gimple_call_fndecl (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	656 if (fndecl && grid_call_permissible_in_distribute_p (fndecl))
04ced10e8804 gcc 7 kono parents: diff changeset	657 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	658
04ced10e8804 gcc 7 kono parents: diff changeset	659 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	660 {
04ced10e8804 gcc 7 kono parents: diff changeset	661 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	662 GRID_MISSED_MSG_PREFIX "the distribute "
04ced10e8804 gcc 7 kono parents: diff changeset	663 "construct contains a call\n");
04ced10e8804 gcc 7 kono parents: diff changeset	664 dump_printf_loc (MSG_NOTE, gimple_location (stmt),
04ced10e8804 gcc 7 kono parents: diff changeset	665 "This statement cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	666 "tiled gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	667 }
04ced10e8804 gcc 7 kono parents: diff changeset	668 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	669 }
04ced10e8804 gcc 7 kono parents: diff changeset	670 else if (gomp_parallel par = dyn_cast <gomp_parallel > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	671 {
04ced10e8804 gcc 7 kono parents: diff changeset	672 if (in_parallel)
04ced10e8804 gcc 7 kono parents: diff changeset	673 {
04ced10e8804 gcc 7 kono parents: diff changeset	674 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	675 {
04ced10e8804 gcc 7 kono parents: diff changeset	676 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	677 GRID_MISSED_MSG_PREFIX "a parallel "
04ced10e8804 gcc 7 kono parents: diff changeset	678 "construct contains another parallel "
04ced10e8804 gcc 7 kono parents: diff changeset	679 "construct\n");
04ced10e8804 gcc 7 kono parents: diff changeset	680 dump_printf_loc (MSG_NOTE, gimple_location (stmt),
04ced10e8804 gcc 7 kono parents: diff changeset	681 "This parallel construct is nested in "
04ced10e8804 gcc 7 kono parents: diff changeset	682 "another one\n");
04ced10e8804 gcc 7 kono parents: diff changeset	683 }
04ced10e8804 gcc 7 kono parents: diff changeset	684 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	685 }
04ced10e8804 gcc 7 kono parents: diff changeset	686 if (!grid_parallel_clauses_gridifiable (par, grid->target_loc)
04ced10e8804 gcc 7 kono parents: diff changeset	687 \|\| !grid_dist_follows_tiling_pattern (gimple_omp_body (par),
04ced10e8804 gcc 7 kono parents: diff changeset	688 grid, true))
04ced10e8804 gcc 7 kono parents: diff changeset	689 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	690 }
04ced10e8804 gcc 7 kono parents: diff changeset	691 else if (gomp_for gfor = dyn_cast <gomp_for > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	692 {
04ced10e8804 gcc 7 kono parents: diff changeset	693 if (!in_parallel)
04ced10e8804 gcc 7 kono parents: diff changeset	694 {
04ced10e8804 gcc 7 kono parents: diff changeset	695 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	696 {
04ced10e8804 gcc 7 kono parents: diff changeset	697 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	698 GRID_MISSED_MSG_PREFIX "a loop "
04ced10e8804 gcc 7 kono parents: diff changeset	699 "construct is not nested within a parallel "
04ced10e8804 gcc 7 kono parents: diff changeset	700 "construct\n");
04ced10e8804 gcc 7 kono parents: diff changeset	701 dump_printf_loc (MSG_NOTE, gimple_location (stmt),
04ced10e8804 gcc 7 kono parents: diff changeset	702 "This loop construct is not nested in "
04ced10e8804 gcc 7 kono parents: diff changeset	703 "a parallel construct\n");
04ced10e8804 gcc 7 kono parents: diff changeset	704 }
04ced10e8804 gcc 7 kono parents: diff changeset	705 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	706 }
04ced10e8804 gcc 7 kono parents: diff changeset	707 if (!grid_gfor_follows_tiling_pattern (gfor, grid))
04ced10e8804 gcc 7 kono parents: diff changeset	708 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	709 }
04ced10e8804 gcc 7 kono parents: diff changeset	710 else
04ced10e8804 gcc 7 kono parents: diff changeset	711 {
04ced10e8804 gcc 7 kono parents: diff changeset	712 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	713 {
04ced10e8804 gcc 7 kono parents: diff changeset	714 dump_printf_loc (MSG_MISSED_OPTIMIZATION, grid->target_loc,
04ced10e8804 gcc 7 kono parents: diff changeset	715 GRID_MISSED_MSG_PREFIX "the distribute "
04ced10e8804 gcc 7 kono parents: diff changeset	716 "construct contains a complex statement\n");
04ced10e8804 gcc 7 kono parents: diff changeset	717 dump_printf_loc (MSG_NOTE, gimple_location (stmt),
04ced10e8804 gcc 7 kono parents: diff changeset	718 "This statement cannot be analyzed for "
04ced10e8804 gcc 7 kono parents: diff changeset	719 "tiled gridification\n");
04ced10e8804 gcc 7 kono parents: diff changeset	720 }
04ced10e8804 gcc 7 kono parents: diff changeset	721 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	722 }
04ced10e8804 gcc 7 kono parents: diff changeset	723 }
04ced10e8804 gcc 7 kono parents: diff changeset	724 return true;
04ced10e8804 gcc 7 kono parents: diff changeset	725 }
04ced10e8804 gcc 7 kono parents: diff changeset	726
04ced10e8804 gcc 7 kono parents: diff changeset	727 /* If TARGET follows a pattern that can be turned into a gridified HSA kernel,
04ced10e8804 gcc 7 kono parents: diff changeset	728 return true, otherwise return false. In the case of success, also fill in
04ced10e8804 gcc 7 kono parents: diff changeset	729 GRID with information describing the kernel grid. */
04ced10e8804 gcc 7 kono parents: diff changeset	730
04ced10e8804 gcc 7 kono parents: diff changeset	731 static bool
04ced10e8804 gcc 7 kono parents: diff changeset	732 grid_target_follows_gridifiable_pattern (gomp_target target, grid_prop grid)
04ced10e8804 gcc 7 kono parents: diff changeset	733 {
04ced10e8804 gcc 7 kono parents: diff changeset	734 if (gimple_omp_target_kind (target) != GF_OMP_TARGET_KIND_REGION)
04ced10e8804 gcc 7 kono parents: diff changeset	735 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	736
04ced10e8804 gcc 7 kono parents: diff changeset	737 location_t tloc = gimple_location (target);
04ced10e8804 gcc 7 kono parents: diff changeset	738 grid->target_loc = tloc;
04ced10e8804 gcc 7 kono parents: diff changeset	739 gimple *stmt
04ced10e8804 gcc 7 kono parents: diff changeset	740 = grid_find_single_omp_among_assignments (gimple_omp_body (target),
04ced10e8804 gcc 7 kono parents: diff changeset	741 grid, "target");
04ced10e8804 gcc 7 kono parents: diff changeset	742 if (!stmt)
04ced10e8804 gcc 7 kono parents: diff changeset	743 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	744 gomp_teams teams = dyn_cast <gomp_teams > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	745 tree group_size = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	746 if (!teams)
04ced10e8804 gcc 7 kono parents: diff changeset	747 {
04ced10e8804 gcc 7 kono parents: diff changeset	748 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	749 GRID_MISSED_MSG_PREFIX "it does not have a sole teams "
04ced10e8804 gcc 7 kono parents: diff changeset	750 "construct in it.\n");
04ced10e8804 gcc 7 kono parents: diff changeset	751 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	752 }
04ced10e8804 gcc 7 kono parents: diff changeset	753
04ced10e8804 gcc 7 kono parents: diff changeset	754 tree clauses = gimple_omp_teams_clauses (teams);
04ced10e8804 gcc 7 kono parents: diff changeset	755 while (clauses)
04ced10e8804 gcc 7 kono parents: diff changeset	756 {
04ced10e8804 gcc 7 kono parents: diff changeset	757 switch (OMP_CLAUSE_CODE (clauses))
04ced10e8804 gcc 7 kono parents: diff changeset	758 {
04ced10e8804 gcc 7 kono parents: diff changeset	759 case OMP_CLAUSE_NUM_TEAMS:
04ced10e8804 gcc 7 kono parents: diff changeset	760 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	761 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	762 GRID_MISSED_MSG_PREFIX "the teams construct "
04ced10e8804 gcc 7 kono parents: diff changeset	763 "contains a num_teams clause\n ");
04ced10e8804 gcc 7 kono parents: diff changeset	764 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	765
04ced10e8804 gcc 7 kono parents: diff changeset	766 case OMP_CLAUSE_REDUCTION:
04ced10e8804 gcc 7 kono parents: diff changeset	767 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	768 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	769 GRID_MISSED_MSG_PREFIX "a reduction "
04ced10e8804 gcc 7 kono parents: diff changeset	770 "clause is present\n ");
04ced10e8804 gcc 7 kono parents: diff changeset	771 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	772
04ced10e8804 gcc 7 kono parents: diff changeset	773 case OMP_CLAUSE_THREAD_LIMIT:
04ced10e8804 gcc 7 kono parents: diff changeset	774 if (!integer_zerop (OMP_CLAUSE_OPERAND (clauses, 0)))
04ced10e8804 gcc 7 kono parents: diff changeset	775 group_size = OMP_CLAUSE_OPERAND (clauses, 0);
04ced10e8804 gcc 7 kono parents: diff changeset	776 break;
04ced10e8804 gcc 7 kono parents: diff changeset	777
04ced10e8804 gcc 7 kono parents: diff changeset	778 default:
04ced10e8804 gcc 7 kono parents: diff changeset	779 break;
04ced10e8804 gcc 7 kono parents: diff changeset	780 }
04ced10e8804 gcc 7 kono parents: diff changeset	781 clauses = OMP_CLAUSE_CHAIN (clauses);
04ced10e8804 gcc 7 kono parents: diff changeset	782 }
04ced10e8804 gcc 7 kono parents: diff changeset	783
04ced10e8804 gcc 7 kono parents: diff changeset	784 stmt = grid_find_single_omp_among_assignments (gimple_omp_body (teams), grid,
04ced10e8804 gcc 7 kono parents: diff changeset	785 "teams");
04ced10e8804 gcc 7 kono parents: diff changeset	786 if (!stmt)
04ced10e8804 gcc 7 kono parents: diff changeset	787 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	788 gomp_for dist = dyn_cast <gomp_for > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	789 if (!dist)
04ced10e8804 gcc 7 kono parents: diff changeset	790 {
04ced10e8804 gcc 7 kono parents: diff changeset	791 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	792 GRID_MISSED_MSG_PREFIX "the teams construct does not "
04ced10e8804 gcc 7 kono parents: diff changeset	793 "have a single distribute construct in it.\n");
04ced10e8804 gcc 7 kono parents: diff changeset	794 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	795 }
04ced10e8804 gcc 7 kono parents: diff changeset	796
04ced10e8804 gcc 7 kono parents: diff changeset	797 gcc_assert (gimple_omp_for_kind (dist) == GF_OMP_FOR_KIND_DISTRIBUTE);
04ced10e8804 gcc 7 kono parents: diff changeset	798
04ced10e8804 gcc 7 kono parents: diff changeset	799 grid->collapse = gimple_omp_for_collapse (dist);
04ced10e8804 gcc 7 kono parents: diff changeset	800 if (grid->collapse > 3)
04ced10e8804 gcc 7 kono parents: diff changeset	801 {
04ced10e8804 gcc 7 kono parents: diff changeset	802 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	803 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	804 GRID_MISSED_MSG_PREFIX "the distribute construct "
04ced10e8804 gcc 7 kono parents: diff changeset	805 "contains collapse clause with parameter greater "
04ced10e8804 gcc 7 kono parents: diff changeset	806 "than 3\n");
04ced10e8804 gcc 7 kono parents: diff changeset	807 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	808 }
04ced10e8804 gcc 7 kono parents: diff changeset	809
04ced10e8804 gcc 7 kono parents: diff changeset	810 struct omp_for_data fd;
04ced10e8804 gcc 7 kono parents: diff changeset	811 struct omp_for_data_loop *dist_loops
04ced10e8804 gcc 7 kono parents: diff changeset	812 = (struct omp_for_data_loop *)alloca (grid->collapse
04ced10e8804 gcc 7 kono parents: diff changeset	813 * sizeof (struct omp_for_data_loop));
04ced10e8804 gcc 7 kono parents: diff changeset	814 omp_extract_for_data (dist, &fd, dist_loops);
04ced10e8804 gcc 7 kono parents: diff changeset	815 if (fd.chunk_size)
04ced10e8804 gcc 7 kono parents: diff changeset	816 {
04ced10e8804 gcc 7 kono parents: diff changeset	817 if (group_size && !operand_equal_p (group_size, fd.chunk_size, 0))
04ced10e8804 gcc 7 kono parents: diff changeset	818 {
04ced10e8804 gcc 7 kono parents: diff changeset	819 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	820 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	821 GRID_MISSED_MSG_PREFIX "the teams "
04ced10e8804 gcc 7 kono parents: diff changeset	822 "thread limit is different from distribute "
04ced10e8804 gcc 7 kono parents: diff changeset	823 "schedule chunk\n");
04ced10e8804 gcc 7 kono parents: diff changeset	824 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	825 }
04ced10e8804 gcc 7 kono parents: diff changeset	826 group_size = fd.chunk_size;
04ced10e8804 gcc 7 kono parents: diff changeset	827 }
04ced10e8804 gcc 7 kono parents: diff changeset	828 if (group_size && grid->collapse > 1)
04ced10e8804 gcc 7 kono parents: diff changeset	829 {
04ced10e8804 gcc 7 kono parents: diff changeset	830 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	831 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	832 GRID_MISSED_MSG_PREFIX "group size cannot be "
04ced10e8804 gcc 7 kono parents: diff changeset	833 "set using thread_limit or schedule clauses "
04ced10e8804 gcc 7 kono parents: diff changeset	834 "when also using a collapse clause greater than 1\n");
04ced10e8804 gcc 7 kono parents: diff changeset	835 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	836 }
04ced10e8804 gcc 7 kono parents: diff changeset	837
04ced10e8804 gcc 7 kono parents: diff changeset	838 if (gimple_omp_for_combined_p (dist))
04ced10e8804 gcc 7 kono parents: diff changeset	839 {
04ced10e8804 gcc 7 kono parents: diff changeset	840 grid->tiling = false;
04ced10e8804 gcc 7 kono parents: diff changeset	841 grid->group_sizes[0] = group_size;
04ced10e8804 gcc 7 kono parents: diff changeset	842 for (unsigned i = 1; i < grid->collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	843 grid->group_sizes[i] = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	844 return grid_dist_follows_simple_pattern (dist, grid);
04ced10e8804 gcc 7 kono parents: diff changeset	845 }
04ced10e8804 gcc 7 kono parents: diff changeset	846 else
04ced10e8804 gcc 7 kono parents: diff changeset	847 {
04ced10e8804 gcc 7 kono parents: diff changeset	848 grid->tiling = true;
04ced10e8804 gcc 7 kono parents: diff changeset	849 if (group_size)
04ced10e8804 gcc 7 kono parents: diff changeset	850 {
04ced10e8804 gcc 7 kono parents: diff changeset	851 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	852 dump_printf_loc (MSG_MISSED_OPTIMIZATION, tloc,
04ced10e8804 gcc 7 kono parents: diff changeset	853 GRID_MISSED_MSG_PREFIX "group size cannot be set "
04ced10e8804 gcc 7 kono parents: diff changeset	854 "using thread_limit or schedule clauses when "
04ced10e8804 gcc 7 kono parents: diff changeset	855 "distribute and loop constructs do not form "
04ced10e8804 gcc 7 kono parents: diff changeset	856 "one combined construct\n");
04ced10e8804 gcc 7 kono parents: diff changeset	857 return false;
04ced10e8804 gcc 7 kono parents: diff changeset	858 }
04ced10e8804 gcc 7 kono parents: diff changeset	859 for (unsigned i = 0; i < grid->collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	860 {
04ced10e8804 gcc 7 kono parents: diff changeset	861 if (fd.loops[i].cond_code == GT_EXPR)
04ced10e8804 gcc 7 kono parents: diff changeset	862 grid->group_sizes[i] = fold_build1 (NEGATE_EXPR,
04ced10e8804 gcc 7 kono parents: diff changeset	863 TREE_TYPE (fd.loops[i].step),
04ced10e8804 gcc 7 kono parents: diff changeset	864 fd.loops[i].step);
04ced10e8804 gcc 7 kono parents: diff changeset	865 else
04ced10e8804 gcc 7 kono parents: diff changeset	866 grid->group_sizes[i] = fd.loops[i].step;
04ced10e8804 gcc 7 kono parents: diff changeset	867 }
04ced10e8804 gcc 7 kono parents: diff changeset	868 return grid_dist_follows_tiling_pattern (gimple_omp_body (dist), grid,
04ced10e8804 gcc 7 kono parents: diff changeset	869 false);
04ced10e8804 gcc 7 kono parents: diff changeset	870 }
04ced10e8804 gcc 7 kono parents: diff changeset	871 }
04ced10e8804 gcc 7 kono parents: diff changeset	872
04ced10e8804 gcc 7 kono parents: diff changeset	873 /* Operand walker, used to remap pre-body declarations according to a hash map
04ced10e8804 gcc 7 kono parents: diff changeset	874 provided in DATA. */
04ced10e8804 gcc 7 kono parents: diff changeset	875
04ced10e8804 gcc 7 kono parents: diff changeset	876 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	877 grid_remap_prebody_decls (tree tp, int walk_subtrees, void *data)
04ced10e8804 gcc 7 kono parents: diff changeset	878 {
04ced10e8804 gcc 7 kono parents: diff changeset	879 tree t = *tp;
04ced10e8804 gcc 7 kono parents: diff changeset	880
04ced10e8804 gcc 7 kono parents: diff changeset	881 if (DECL_P (t) \|\| TYPE_P (t))
04ced10e8804 gcc 7 kono parents: diff changeset	882 *walk_subtrees = 0;
04ced10e8804 gcc 7 kono parents: diff changeset	883 else
04ced10e8804 gcc 7 kono parents: diff changeset	884 *walk_subtrees = 1;
04ced10e8804 gcc 7 kono parents: diff changeset	885
04ced10e8804 gcc 7 kono parents: diff changeset	886 if (VAR_P (t))
04ced10e8804 gcc 7 kono parents: diff changeset	887 {
04ced10e8804 gcc 7 kono parents: diff changeset	888 struct walk_stmt_info wi = (struct walk_stmt_info ) data;
04ced10e8804 gcc 7 kono parents: diff changeset	889 hash_map<tree, tree> declmap = (hash_map<tree, tree> ) wi->info;
04ced10e8804 gcc 7 kono parents: diff changeset	890 tree *repl = declmap->get (t);
04ced10e8804 gcc 7 kono parents: diff changeset	891 if (repl)
04ced10e8804 gcc 7 kono parents: diff changeset	892 tp = repl;
04ced10e8804 gcc 7 kono parents: diff changeset	893 }
04ced10e8804 gcc 7 kono parents: diff changeset	894 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	895 }
04ced10e8804 gcc 7 kono parents: diff changeset	896
04ced10e8804 gcc 7 kono parents: diff changeset	897 /* Identifiers of segments into which a particular variable should be places
04ced10e8804 gcc 7 kono parents: diff changeset	898 when gridifying. */
04ced10e8804 gcc 7 kono parents: diff changeset	899
04ced10e8804 gcc 7 kono parents: diff changeset	900 enum grid_var_segment {GRID_SEGMENT_PRIVATE, GRID_SEGMENT_GROUP,
04ced10e8804 gcc 7 kono parents: diff changeset	901 GRID_SEGMENT_GLOBAL};
04ced10e8804 gcc 7 kono parents: diff changeset	902
04ced10e8804 gcc 7 kono parents: diff changeset	903 /* Mark VAR so that it is eventually placed into SEGMENT. Place an artificial
04ced10e8804 gcc 7 kono parents: diff changeset	904 builtin call into SEQ that will make sure the variable is always considered
04ced10e8804 gcc 7 kono parents: diff changeset	905 address taken. */
04ced10e8804 gcc 7 kono parents: diff changeset	906
04ced10e8804 gcc 7 kono parents: diff changeset	907 static void
04ced10e8804 gcc 7 kono parents: diff changeset	908 grid_mark_variable_segment (tree var, enum grid_var_segment segment)
04ced10e8804 gcc 7 kono parents: diff changeset	909 {
04ced10e8804 gcc 7 kono parents: diff changeset	910 /* Making a non-addressable variables would require that we re-gimplify all
04ced10e8804 gcc 7 kono parents: diff changeset	911 their uses. Fortunately, we do not have to do this because if they are
04ced10e8804 gcc 7 kono parents: diff changeset	912 not addressable, it means they are not used in atomic or parallel
04ced10e8804 gcc 7 kono parents: diff changeset	913 statements and so relaxed GPU consistency rules mean we can just keep them
04ced10e8804 gcc 7 kono parents: diff changeset	914 private. */
04ced10e8804 gcc 7 kono parents: diff changeset	915 if (!TREE_ADDRESSABLE (var))
04ced10e8804 gcc 7 kono parents: diff changeset	916 return;
04ced10e8804 gcc 7 kono parents: diff changeset	917
04ced10e8804 gcc 7 kono parents: diff changeset	918 switch (segment)
04ced10e8804 gcc 7 kono parents: diff changeset	919 {
04ced10e8804 gcc 7 kono parents: diff changeset	920 case GRID_SEGMENT_GROUP:
04ced10e8804 gcc 7 kono parents: diff changeset	921 DECL_ATTRIBUTES (var) = tree_cons (get_identifier ("hsa_group_segment"),
04ced10e8804 gcc 7 kono parents: diff changeset	922 NULL, DECL_ATTRIBUTES (var));
04ced10e8804 gcc 7 kono parents: diff changeset	923 break;
04ced10e8804 gcc 7 kono parents: diff changeset	924 case GRID_SEGMENT_GLOBAL:
04ced10e8804 gcc 7 kono parents: diff changeset	925 DECL_ATTRIBUTES (var) = tree_cons (get_identifier ("hsa_global_segment"),
04ced10e8804 gcc 7 kono parents: diff changeset	926 NULL, DECL_ATTRIBUTES (var));
04ced10e8804 gcc 7 kono parents: diff changeset	927 break;
04ced10e8804 gcc 7 kono parents: diff changeset	928 default:
04ced10e8804 gcc 7 kono parents: diff changeset	929 gcc_unreachable ();
04ced10e8804 gcc 7 kono parents: diff changeset	930 }
04ced10e8804 gcc 7 kono parents: diff changeset	931
04ced10e8804 gcc 7 kono parents: diff changeset	932 if (!TREE_STATIC (var))
04ced10e8804 gcc 7 kono parents: diff changeset	933 {
04ced10e8804 gcc 7 kono parents: diff changeset	934 TREE_STATIC (var) = 1;
04ced10e8804 gcc 7 kono parents: diff changeset	935 varpool_node::finalize_decl (var);
04ced10e8804 gcc 7 kono parents: diff changeset	936 }
04ced10e8804 gcc 7 kono parents: diff changeset	937
04ced10e8804 gcc 7 kono parents: diff changeset	938 }
04ced10e8804 gcc 7 kono parents: diff changeset	939
04ced10e8804 gcc 7 kono parents: diff changeset	940 /* Copy leading register-type assignments to local variables in SRC to just
04ced10e8804 gcc 7 kono parents: diff changeset	941 before DST, Creating temporaries, adjusting mapping of operands in WI and
04ced10e8804 gcc 7 kono parents: diff changeset	942 remapping operands as necessary. Add any new temporaries to TGT_BIND.
04ced10e8804 gcc 7 kono parents: diff changeset	943 Return the first statement that does not conform to grid_safe_assignment_p
04ced10e8804 gcc 7 kono parents: diff changeset	944 or NULL. If VAR_SEGMENT is not GRID_SEGMENT_PRIVATE, also mark all
04ced10e8804 gcc 7 kono parents: diff changeset	945 variables in traversed bind statements so that they are put into the
04ced10e8804 gcc 7 kono parents: diff changeset	946 appropriate segment. */
04ced10e8804 gcc 7 kono parents: diff changeset	947
04ced10e8804 gcc 7 kono parents: diff changeset	948 static gimple *
04ced10e8804 gcc 7 kono parents: diff changeset	949 grid_copy_leading_local_assignments (gimple_seq src, gimple_stmt_iterator *dst,
04ced10e8804 gcc 7 kono parents: diff changeset	950 gbind *tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	951 enum grid_var_segment var_segment,
04ced10e8804 gcc 7 kono parents: diff changeset	952 struct walk_stmt_info *wi)
04ced10e8804 gcc 7 kono parents: diff changeset	953 {
04ced10e8804 gcc 7 kono parents: diff changeset	954 hash_map<tree, tree> declmap = (hash_map<tree, tree> ) wi->info;
04ced10e8804 gcc 7 kono parents: diff changeset	955 gimple_stmt_iterator gsi;
04ced10e8804 gcc 7 kono parents: diff changeset	956 for (gsi = gsi_start (src); !gsi_end_p (gsi); gsi_next (&gsi))
04ced10e8804 gcc 7 kono parents: diff changeset	957 {
04ced10e8804 gcc 7 kono parents: diff changeset	958 gimple *stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	959 if (gbind bind = dyn_cast <gbind > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	960 {
04ced10e8804 gcc 7 kono parents: diff changeset	961 gimple *r = grid_copy_leading_local_assignments
04ced10e8804 gcc 7 kono parents: diff changeset	962 (gimple_bind_body (bind), dst, tgt_bind, var_segment, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	963
04ced10e8804 gcc 7 kono parents: diff changeset	964 if (var_segment != GRID_SEGMENT_PRIVATE)
04ced10e8804 gcc 7 kono parents: diff changeset	965 for (tree var = gimple_bind_vars (bind);
04ced10e8804 gcc 7 kono parents: diff changeset	966 var;
04ced10e8804 gcc 7 kono parents: diff changeset	967 var = DECL_CHAIN (var))
04ced10e8804 gcc 7 kono parents: diff changeset	968 grid_mark_variable_segment (var, var_segment);
04ced10e8804 gcc 7 kono parents: diff changeset	969 if (r)
04ced10e8804 gcc 7 kono parents: diff changeset	970 return r;
04ced10e8804 gcc 7 kono parents: diff changeset	971 else
04ced10e8804 gcc 7 kono parents: diff changeset	972 continue;
04ced10e8804 gcc 7 kono parents: diff changeset	973 }
04ced10e8804 gcc 7 kono parents: diff changeset	974 if (!grid_safe_assignment_p (stmt, NULL))
04ced10e8804 gcc 7 kono parents: diff changeset	975 return stmt;
04ced10e8804 gcc 7 kono parents: diff changeset	976 tree lhs = gimple_assign_lhs (as_a <gassign *> (stmt));
04ced10e8804 gcc 7 kono parents: diff changeset	977 tree repl = copy_var_decl (lhs, create_tmp_var_name (NULL),
04ced10e8804 gcc 7 kono parents: diff changeset	978 TREE_TYPE (lhs));
04ced10e8804 gcc 7 kono parents: diff changeset	979 DECL_CONTEXT (repl) = current_function_decl;
04ced10e8804 gcc 7 kono parents: diff changeset	980 gimple_bind_append_vars (tgt_bind, repl);
04ced10e8804 gcc 7 kono parents: diff changeset	981
04ced10e8804 gcc 7 kono parents: diff changeset	982 declmap->put (lhs, repl);
04ced10e8804 gcc 7 kono parents: diff changeset	983 gassign copy = as_a <gassign > (gimple_copy (stmt));
04ced10e8804 gcc 7 kono parents: diff changeset	984 walk_gimple_op (copy, grid_remap_prebody_decls, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	985 gsi_insert_before (dst, copy, GSI_SAME_STMT);
04ced10e8804 gcc 7 kono parents: diff changeset	986 }
04ced10e8804 gcc 7 kono parents: diff changeset	987 return NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	988 }
04ced10e8804 gcc 7 kono parents: diff changeset	989
04ced10e8804 gcc 7 kono parents: diff changeset	990 /* Statement walker function to make adjustments to statements within the
04ced10e8804 gcc 7 kono parents: diff changeset	991 gridifed kernel copy. */
04ced10e8804 gcc 7 kono parents: diff changeset	992
04ced10e8804 gcc 7 kono parents: diff changeset	993 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	994 grid_process_grid_body (gimple_stmt_iterator gsi, bool handled_ops_p,
04ced10e8804 gcc 7 kono parents: diff changeset	995 struct walk_stmt_info *)
04ced10e8804 gcc 7 kono parents: diff changeset	996 {
04ced10e8804 gcc 7 kono parents: diff changeset	997 *handled_ops_p = false;
04ced10e8804 gcc 7 kono parents: diff changeset	998 gimple stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	999 if (gimple_code (stmt) == GIMPLE_OMP_FOR
04ced10e8804 gcc 7 kono parents: diff changeset	1000 && (gimple_omp_for_kind (stmt) & GF_OMP_FOR_SIMD))
04ced10e8804 gcc 7 kono parents: diff changeset	1001 {
04ced10e8804 gcc 7 kono parents: diff changeset	1002 gomp_for loop = as_a <gomp_for > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1003 tree clauses = gimple_omp_for_clauses (loop);
04ced10e8804 gcc 7 kono parents: diff changeset	1004 tree cl = omp_find_clause (clauses, OMP_CLAUSE_SAFELEN);
04ced10e8804 gcc 7 kono parents: diff changeset	1005 if (cl)
04ced10e8804 gcc 7 kono parents: diff changeset	1006 OMP_CLAUSE_SAFELEN_EXPR (cl) = integer_one_node;
04ced10e8804 gcc 7 kono parents: diff changeset	1007 else
04ced10e8804 gcc 7 kono parents: diff changeset	1008 {
04ced10e8804 gcc 7 kono parents: diff changeset	1009 tree c = build_omp_clause (UNKNOWN_LOCATION, OMP_CLAUSE_SAFELEN);
04ced10e8804 gcc 7 kono parents: diff changeset	1010 OMP_CLAUSE_SAFELEN_EXPR (c) = integer_one_node;
04ced10e8804 gcc 7 kono parents: diff changeset	1011 OMP_CLAUSE_CHAIN (c) = clauses;
04ced10e8804 gcc 7 kono parents: diff changeset	1012 gimple_omp_for_set_clauses (loop, c);
04ced10e8804 gcc 7 kono parents: diff changeset	1013 }
04ced10e8804 gcc 7 kono parents: diff changeset	1014 }
04ced10e8804 gcc 7 kono parents: diff changeset	1015 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	1016 }
04ced10e8804 gcc 7 kono parents: diff changeset	1017
04ced10e8804 gcc 7 kono parents: diff changeset	1018 /* Given a PARLOOP that is a normal for looping construct but also a part of a
04ced10e8804 gcc 7 kono parents: diff changeset	1019 combined construct with a simd loop, eliminate the simd loop. */
04ced10e8804 gcc 7 kono parents: diff changeset	1020
04ced10e8804 gcc 7 kono parents: diff changeset	1021 static void
04ced10e8804 gcc 7 kono parents: diff changeset	1022 grid_eliminate_combined_simd_part (gomp_for *parloop)
04ced10e8804 gcc 7 kono parents: diff changeset	1023 {
04ced10e8804 gcc 7 kono parents: diff changeset	1024 struct walk_stmt_info wi;
04ced10e8804 gcc 7 kono parents: diff changeset	1025
04ced10e8804 gcc 7 kono parents: diff changeset	1026 memset (&wi, 0, sizeof (wi));
04ced10e8804 gcc 7 kono parents: diff changeset	1027 wi.val_only = true;
04ced10e8804 gcc 7 kono parents: diff changeset	1028 enum gf_mask msk = GF_OMP_FOR_SIMD;
04ced10e8804 gcc 7 kono parents: diff changeset	1029 wi.info = (void *) &msk;
04ced10e8804 gcc 7 kono parents: diff changeset	1030 walk_gimple_seq (gimple_omp_body (parloop), omp_find_combined_for, NULL, &wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1031 gimple stmt = (gimple ) wi.info;
04ced10e8804 gcc 7 kono parents: diff changeset	1032 /* We expect that the SIMD id the only statement in the parallel loop. */
04ced10e8804 gcc 7 kono parents: diff changeset	1033 gcc_assert (stmt
04ced10e8804 gcc 7 kono parents: diff changeset	1034 && gimple_code (stmt) == GIMPLE_OMP_FOR
04ced10e8804 gcc 7 kono parents: diff changeset	1035 && (gimple_omp_for_kind (stmt) == GF_OMP_FOR_SIMD)
04ced10e8804 gcc 7 kono parents: diff changeset	1036 && gimple_omp_for_combined_into_p (stmt)
04ced10e8804 gcc 7 kono parents: diff changeset	1037 && !gimple_omp_for_combined_p (stmt));
04ced10e8804 gcc 7 kono parents: diff changeset	1038 gomp_for simd = as_a <gomp_for > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1039
04ced10e8804 gcc 7 kono parents: diff changeset	1040 /* Copy over the iteration properties because the body refers to the index in
04ced10e8804 gcc 7 kono parents: diff changeset	1041 the bottmom-most loop. */
04ced10e8804 gcc 7 kono parents: diff changeset	1042 unsigned i, collapse = gimple_omp_for_collapse (parloop);
04ced10e8804 gcc 7 kono parents: diff changeset	1043 gcc_checking_assert (collapse == gimple_omp_for_collapse (simd));
04ced10e8804 gcc 7 kono parents: diff changeset	1044 for (i = 0; i < collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	1045 {
04ced10e8804 gcc 7 kono parents: diff changeset	1046 gimple_omp_for_set_index (parloop, i, gimple_omp_for_index (simd, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1047 gimple_omp_for_set_initial (parloop, i, gimple_omp_for_initial (simd, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1048 gimple_omp_for_set_final (parloop, i, gimple_omp_for_final (simd, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1049 gimple_omp_for_set_incr (parloop, i, gimple_omp_for_incr (simd, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1050 }
04ced10e8804 gcc 7 kono parents: diff changeset	1051
04ced10e8804 gcc 7 kono parents: diff changeset	1052 tree *tgt= gimple_omp_for_clauses_ptr (parloop);
04ced10e8804 gcc 7 kono parents: diff changeset	1053 while (*tgt)
04ced10e8804 gcc 7 kono parents: diff changeset	1054 tgt = &OMP_CLAUSE_CHAIN (*tgt);
04ced10e8804 gcc 7 kono parents: diff changeset	1055
04ced10e8804 gcc 7 kono parents: diff changeset	1056 /* Copy over all clauses, except for linaer clauses, which are turned into
04ced10e8804 gcc 7 kono parents: diff changeset	1057 private clauses, and all other simd-specificl clauses, which are
04ced10e8804 gcc 7 kono parents: diff changeset	1058 ignored. */
04ced10e8804 gcc 7 kono parents: diff changeset	1059 tree *pc = gimple_omp_for_clauses_ptr (simd);
04ced10e8804 gcc 7 kono parents: diff changeset	1060 while (*pc)
04ced10e8804 gcc 7 kono parents: diff changeset	1061 {
04ced10e8804 gcc 7 kono parents: diff changeset	1062 tree c = *pc;
04ced10e8804 gcc 7 kono parents: diff changeset	1063 switch (TREE_CODE (c))
04ced10e8804 gcc 7 kono parents: diff changeset	1064 {
04ced10e8804 gcc 7 kono parents: diff changeset	1065 case OMP_CLAUSE_LINEAR:
04ced10e8804 gcc 7 kono parents: diff changeset	1066 {
04ced10e8804 gcc 7 kono parents: diff changeset	1067 tree priv = build_omp_clause (UNKNOWN_LOCATION, OMP_CLAUSE_PRIVATE);
04ced10e8804 gcc 7 kono parents: diff changeset	1068 OMP_CLAUSE_DECL (priv) = OMP_CLAUSE_DECL (c);
04ced10e8804 gcc 7 kono parents: diff changeset	1069 OMP_CLAUSE_CHAIN (priv) = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1070 *tgt = priv;
04ced10e8804 gcc 7 kono parents: diff changeset	1071 tgt = &OMP_CLAUSE_CHAIN (priv);
04ced10e8804 gcc 7 kono parents: diff changeset	1072 pc = &OMP_CLAUSE_CHAIN (c);
04ced10e8804 gcc 7 kono parents: diff changeset	1073 break;
04ced10e8804 gcc 7 kono parents: diff changeset	1074 }
04ced10e8804 gcc 7 kono parents: diff changeset	1075
04ced10e8804 gcc 7 kono parents: diff changeset	1076 case OMP_CLAUSE_SAFELEN:
04ced10e8804 gcc 7 kono parents: diff changeset	1077 case OMP_CLAUSE_SIMDLEN:
04ced10e8804 gcc 7 kono parents: diff changeset	1078 case OMP_CLAUSE_ALIGNED:
04ced10e8804 gcc 7 kono parents: diff changeset	1079 pc = &OMP_CLAUSE_CHAIN (c);
04ced10e8804 gcc 7 kono parents: diff changeset	1080 break;
04ced10e8804 gcc 7 kono parents: diff changeset	1081
04ced10e8804 gcc 7 kono parents: diff changeset	1082 default:
04ced10e8804 gcc 7 kono parents: diff changeset	1083 *pc = OMP_CLAUSE_CHAIN (c);
04ced10e8804 gcc 7 kono parents: diff changeset	1084 OMP_CLAUSE_CHAIN (c) = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1085 *tgt = c;
04ced10e8804 gcc 7 kono parents: diff changeset	1086 tgt = &OMP_CLAUSE_CHAIN(c);
04ced10e8804 gcc 7 kono parents: diff changeset	1087 break;
04ced10e8804 gcc 7 kono parents: diff changeset	1088 }
04ced10e8804 gcc 7 kono parents: diff changeset	1089 }
04ced10e8804 gcc 7 kono parents: diff changeset	1090
04ced10e8804 gcc 7 kono parents: diff changeset	1091 /* Finally, throw away the simd and mark the parallel loop as not
04ced10e8804 gcc 7 kono parents: diff changeset	1092 combined. */
04ced10e8804 gcc 7 kono parents: diff changeset	1093 gimple_omp_set_body (parloop, gimple_omp_body (simd));
04ced10e8804 gcc 7 kono parents: diff changeset	1094 gimple_omp_for_set_combined_p (parloop, false);
04ced10e8804 gcc 7 kono parents: diff changeset	1095 }
04ced10e8804 gcc 7 kono parents: diff changeset	1096
04ced10e8804 gcc 7 kono parents: diff changeset	1097 /* Statement walker function marking all parallels as grid_phony and loops as
04ced10e8804 gcc 7 kono parents: diff changeset	1098 grid ones representing threads of a particular thread group. */
04ced10e8804 gcc 7 kono parents: diff changeset	1099
04ced10e8804 gcc 7 kono parents: diff changeset	1100 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	1101 grid_mark_tiling_loops (gimple_stmt_iterator gsi, bool handled_ops_p,
04ced10e8804 gcc 7 kono parents: diff changeset	1102 struct walk_stmt_info *wi_in)
04ced10e8804 gcc 7 kono parents: diff changeset	1103 {
04ced10e8804 gcc 7 kono parents: diff changeset	1104 *handled_ops_p = false;
04ced10e8804 gcc 7 kono parents: diff changeset	1105 if (gomp_for loop = dyn_cast <gomp_for > (gsi_stmt (*gsi)))
04ced10e8804 gcc 7 kono parents: diff changeset	1106 {
04ced10e8804 gcc 7 kono parents: diff changeset	1107 *handled_ops_p = true;
04ced10e8804 gcc 7 kono parents: diff changeset	1108 gimple_omp_for_set_kind (loop, GF_OMP_FOR_KIND_GRID_LOOP);
04ced10e8804 gcc 7 kono parents: diff changeset	1109 gimple_omp_for_set_grid_intra_group (loop, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1110 if (gimple_omp_for_combined_p (loop))
04ced10e8804 gcc 7 kono parents: diff changeset	1111 grid_eliminate_combined_simd_part (loop);
04ced10e8804 gcc 7 kono parents: diff changeset	1112
04ced10e8804 gcc 7 kono parents: diff changeset	1113 struct walk_stmt_info body_wi;
04ced10e8804 gcc 7 kono parents: diff changeset	1114 memset (&body_wi, 0, sizeof (body_wi));
04ced10e8804 gcc 7 kono parents: diff changeset	1115 walk_gimple_seq_mod (gimple_omp_body_ptr (loop),
04ced10e8804 gcc 7 kono parents: diff changeset	1116 grid_process_grid_body, NULL, &body_wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1117
04ced10e8804 gcc 7 kono parents: diff changeset	1118 gbind bind = (gbind ) wi_in->info;
04ced10e8804 gcc 7 kono parents: diff changeset	1119 tree c;
04ced10e8804 gcc 7 kono parents: diff changeset	1120 for (c = gimple_omp_for_clauses (loop); c; c = OMP_CLAUSE_CHAIN (c))
04ced10e8804 gcc 7 kono parents: diff changeset	1121 if (OMP_CLAUSE_CODE (c) == OMP_CLAUSE_LASTPRIVATE)
04ced10e8804 gcc 7 kono parents: diff changeset	1122 {
04ced10e8804 gcc 7 kono parents: diff changeset	1123 push_gimplify_context ();
04ced10e8804 gcc 7 kono parents: diff changeset	1124 tree ov = OMP_CLAUSE_DECL (c);
04ced10e8804 gcc 7 kono parents: diff changeset	1125 tree gv = copy_var_decl (ov, create_tmp_var_name (NULL),
04ced10e8804 gcc 7 kono parents: diff changeset	1126 TREE_TYPE (ov));
04ced10e8804 gcc 7 kono parents: diff changeset	1127
04ced10e8804 gcc 7 kono parents: diff changeset	1128 grid_mark_variable_segment (gv, GRID_SEGMENT_GROUP);
04ced10e8804 gcc 7 kono parents: diff changeset	1129 DECL_CONTEXT (gv) = current_function_decl;
04ced10e8804 gcc 7 kono parents: diff changeset	1130 gimple_bind_append_vars (bind, gv);
04ced10e8804 gcc 7 kono parents: diff changeset	1131 tree x = lang_hooks.decls.omp_clause_assign_op (c, gv, ov);
04ced10e8804 gcc 7 kono parents: diff changeset	1132 gimplify_and_add (x, &OMP_CLAUSE_LASTPRIVATE_GIMPLE_SEQ (c));
04ced10e8804 gcc 7 kono parents: diff changeset	1133 x = lang_hooks.decls.omp_clause_copy_ctor (c, ov, gv);
04ced10e8804 gcc 7 kono parents: diff changeset	1134 gimple_seq l = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1135 gimplify_and_add (x, &l);
04ced10e8804 gcc 7 kono parents: diff changeset	1136 gsi_insert_seq_after (gsi, l, GSI_SAME_STMT);
04ced10e8804 gcc 7 kono parents: diff changeset	1137 pop_gimplify_context (bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1138 }
04ced10e8804 gcc 7 kono parents: diff changeset	1139 }
04ced10e8804 gcc 7 kono parents: diff changeset	1140 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	1141 }
04ced10e8804 gcc 7 kono parents: diff changeset	1142
04ced10e8804 gcc 7 kono parents: diff changeset	1143 /* Statement walker function marking all parallels as grid_phony and loops as
04ced10e8804 gcc 7 kono parents: diff changeset	1144 grid ones representing threads of a particular thread group. */
04ced10e8804 gcc 7 kono parents: diff changeset	1145
04ced10e8804 gcc 7 kono parents: diff changeset	1146 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	1147 grid_mark_tiling_parallels_and_loops (gimple_stmt_iterator *gsi,
04ced10e8804 gcc 7 kono parents: diff changeset	1148 bool *handled_ops_p,
04ced10e8804 gcc 7 kono parents: diff changeset	1149 struct walk_stmt_info *wi_in)
04ced10e8804 gcc 7 kono parents: diff changeset	1150 {
04ced10e8804 gcc 7 kono parents: diff changeset	1151 *handled_ops_p = false;
04ced10e8804 gcc 7 kono parents: diff changeset	1152 wi_in->removed_stmt = false;
04ced10e8804 gcc 7 kono parents: diff changeset	1153 gimple stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	1154 if (gbind bind = dyn_cast <gbind > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	1155 {
04ced10e8804 gcc 7 kono parents: diff changeset	1156 for (tree var = gimple_bind_vars (bind); var; var = DECL_CHAIN (var))
04ced10e8804 gcc 7 kono parents: diff changeset	1157 grid_mark_variable_segment (var, GRID_SEGMENT_GROUP);
04ced10e8804 gcc 7 kono parents: diff changeset	1158 }
04ced10e8804 gcc 7 kono parents: diff changeset	1159 else if (gomp_parallel parallel = dyn_cast <gomp_parallel > (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	1160 {
04ced10e8804 gcc 7 kono parents: diff changeset	1161 *handled_ops_p = true;
04ced10e8804 gcc 7 kono parents: diff changeset	1162 gimple_omp_parallel_set_grid_phony (parallel, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1163
04ced10e8804 gcc 7 kono parents: diff changeset	1164 gbind *new_bind = gimple_build_bind (NULL, NULL, make_node (BLOCK));
04ced10e8804 gcc 7 kono parents: diff changeset	1165 gimple_bind_set_body (new_bind, gimple_omp_body (parallel));
04ced10e8804 gcc 7 kono parents: diff changeset	1166 gimple_seq s = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1167 gimple_seq_add_stmt (&s, new_bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1168 gimple_omp_set_body (parallel, s);
04ced10e8804 gcc 7 kono parents: diff changeset	1169
04ced10e8804 gcc 7 kono parents: diff changeset	1170 struct walk_stmt_info wi_par;
04ced10e8804 gcc 7 kono parents: diff changeset	1171 memset (&wi_par, 0, sizeof (wi_par));
04ced10e8804 gcc 7 kono parents: diff changeset	1172 wi_par.info = new_bind;
04ced10e8804 gcc 7 kono parents: diff changeset	1173 walk_gimple_seq_mod (gimple_bind_body_ptr (new_bind),
04ced10e8804 gcc 7 kono parents: diff changeset	1174 grid_mark_tiling_loops, NULL, &wi_par);
04ced10e8804 gcc 7 kono parents: diff changeset	1175 }
04ced10e8804 gcc 7 kono parents: diff changeset	1176 else if (is_a <gcall *> (stmt))
04ced10e8804 gcc 7 kono parents: diff changeset	1177 wi_in->removed_stmt = grid_handle_call_in_distribute (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	1178 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	1179 }
04ced10e8804 gcc 7 kono parents: diff changeset	1180
04ced10e8804 gcc 7 kono parents: diff changeset	1181 /* Given freshly copied top level kernel SEQ, identify the individual OMP
04ced10e8804 gcc 7 kono parents: diff changeset	1182 components, mark them as part of kernel, copy assignment leading to them
04ced10e8804 gcc 7 kono parents: diff changeset	1183 just before DST, remapping them using WI and adding new temporaries to
04ced10e8804 gcc 7 kono parents: diff changeset	1184 TGT_BIND, and and return the loop that will be used for kernel dispatch. */
04ced10e8804 gcc 7 kono parents: diff changeset	1185
04ced10e8804 gcc 7 kono parents: diff changeset	1186 static gomp_for *
04ced10e8804 gcc 7 kono parents: diff changeset	1187 grid_process_kernel_body_copy (grid_prop *grid, gimple_seq seq,
04ced10e8804 gcc 7 kono parents: diff changeset	1188 gimple_stmt_iterator *dst,
04ced10e8804 gcc 7 kono parents: diff changeset	1189 gbind tgt_bind, struct walk_stmt_info wi)
04ced10e8804 gcc 7 kono parents: diff changeset	1190 {
04ced10e8804 gcc 7 kono parents: diff changeset	1191 gimple *stmt = grid_copy_leading_local_assignments (seq, dst, tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	1192 GRID_SEGMENT_GLOBAL, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1193 gomp_teams teams = dyn_cast <gomp_teams > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1194 gcc_assert (teams);
04ced10e8804 gcc 7 kono parents: diff changeset	1195 gimple_omp_teams_set_grid_phony (teams, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1196 stmt = grid_copy_leading_local_assignments (gimple_omp_body (teams), dst,
04ced10e8804 gcc 7 kono parents: diff changeset	1197 tgt_bind, GRID_SEGMENT_GLOBAL,
04ced10e8804 gcc 7 kono parents: diff changeset	1198 wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1199 gcc_checking_assert (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1200 gomp_for dist = dyn_cast <gomp_for > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1201 gcc_assert (dist);
04ced10e8804 gcc 7 kono parents: diff changeset	1202 gimple_seq prebody = gimple_omp_for_pre_body (dist);
04ced10e8804 gcc 7 kono parents: diff changeset	1203 if (prebody)
04ced10e8804 gcc 7 kono parents: diff changeset	1204 grid_copy_leading_local_assignments (prebody, dst, tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	1205 GRID_SEGMENT_GROUP, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1206
04ced10e8804 gcc 7 kono parents: diff changeset	1207 if (grid->tiling)
04ced10e8804 gcc 7 kono parents: diff changeset	1208 {
04ced10e8804 gcc 7 kono parents: diff changeset	1209 gimple_omp_for_set_kind (dist, GF_OMP_FOR_KIND_GRID_LOOP);
04ced10e8804 gcc 7 kono parents: diff changeset	1210 gimple_omp_for_set_grid_group_iter (dist, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1211
04ced10e8804 gcc 7 kono parents: diff changeset	1212 struct walk_stmt_info wi_tiled;
04ced10e8804 gcc 7 kono parents: diff changeset	1213 memset (&wi_tiled, 0, sizeof (wi_tiled));
04ced10e8804 gcc 7 kono parents: diff changeset	1214 walk_gimple_seq_mod (gimple_omp_body_ptr (dist),
04ced10e8804 gcc 7 kono parents: diff changeset	1215 grid_mark_tiling_parallels_and_loops, NULL,
04ced10e8804 gcc 7 kono parents: diff changeset	1216 &wi_tiled);
04ced10e8804 gcc 7 kono parents: diff changeset	1217 return dist;
04ced10e8804 gcc 7 kono parents: diff changeset	1218 }
04ced10e8804 gcc 7 kono parents: diff changeset	1219 else
04ced10e8804 gcc 7 kono parents: diff changeset	1220 {
04ced10e8804 gcc 7 kono parents: diff changeset	1221 gimple_omp_for_set_grid_phony (dist, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1222 stmt = grid_copy_leading_local_assignments (gimple_omp_body (dist), dst,
04ced10e8804 gcc 7 kono parents: diff changeset	1223 tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	1224 GRID_SEGMENT_PRIVATE, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1225 gcc_checking_assert (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1226 gomp_parallel parallel = as_a <gomp_parallel > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1227 gimple_omp_parallel_set_grid_phony (parallel, true);
04ced10e8804 gcc 7 kono parents: diff changeset	1228 stmt = grid_copy_leading_local_assignments (gimple_omp_body (parallel),
04ced10e8804 gcc 7 kono parents: diff changeset	1229 dst, tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	1230 GRID_SEGMENT_PRIVATE, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1231 gomp_for inner_loop = as_a <gomp_for > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1232 gimple_omp_for_set_kind (inner_loop, GF_OMP_FOR_KIND_GRID_LOOP);
04ced10e8804 gcc 7 kono parents: diff changeset	1233 prebody = gimple_omp_for_pre_body (inner_loop);
04ced10e8804 gcc 7 kono parents: diff changeset	1234 if (prebody)
04ced10e8804 gcc 7 kono parents: diff changeset	1235 grid_copy_leading_local_assignments (prebody, dst, tgt_bind,
04ced10e8804 gcc 7 kono parents: diff changeset	1236 GRID_SEGMENT_PRIVATE, wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1237
04ced10e8804 gcc 7 kono parents: diff changeset	1238 if (gimple_omp_for_combined_p (inner_loop))
04ced10e8804 gcc 7 kono parents: diff changeset	1239 grid_eliminate_combined_simd_part (inner_loop);
04ced10e8804 gcc 7 kono parents: diff changeset	1240 struct walk_stmt_info body_wi;;
04ced10e8804 gcc 7 kono parents: diff changeset	1241 memset (&body_wi, 0, sizeof (body_wi));
04ced10e8804 gcc 7 kono parents: diff changeset	1242 walk_gimple_seq_mod (gimple_omp_body_ptr (inner_loop),
04ced10e8804 gcc 7 kono parents: diff changeset	1243 grid_process_grid_body, NULL, &body_wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1244
04ced10e8804 gcc 7 kono parents: diff changeset	1245 return inner_loop;
04ced10e8804 gcc 7 kono parents: diff changeset	1246 }
04ced10e8804 gcc 7 kono parents: diff changeset	1247 }
04ced10e8804 gcc 7 kono parents: diff changeset	1248
04ced10e8804 gcc 7 kono parents: diff changeset	1249 /* If TARGET points to a GOMP_TARGET which follows a gridifiable pattern,
04ced10e8804 gcc 7 kono parents: diff changeset	1250 create a GPU kernel for it. GSI must point to the same statement, TGT_BIND
04ced10e8804 gcc 7 kono parents: diff changeset	1251 is the bind into which temporaries inserted before TARGET should be
04ced10e8804 gcc 7 kono parents: diff changeset	1252 added. */
04ced10e8804 gcc 7 kono parents: diff changeset	1253
04ced10e8804 gcc 7 kono parents: diff changeset	1254 static void
04ced10e8804 gcc 7 kono parents: diff changeset	1255 grid_attempt_target_gridification (gomp_target *target,
04ced10e8804 gcc 7 kono parents: diff changeset	1256 gimple_stmt_iterator *gsi,
04ced10e8804 gcc 7 kono parents: diff changeset	1257 gbind *tgt_bind)
04ced10e8804 gcc 7 kono parents: diff changeset	1258 {
04ced10e8804 gcc 7 kono parents: diff changeset	1259 /* removed group_size */
04ced10e8804 gcc 7 kono parents: diff changeset	1260 grid_prop grid;
04ced10e8804 gcc 7 kono parents: diff changeset	1261 memset (&grid, 0, sizeof (grid));
04ced10e8804 gcc 7 kono parents: diff changeset	1262 if (!target \|\| !grid_target_follows_gridifiable_pattern (target, &grid))
04ced10e8804 gcc 7 kono parents: diff changeset	1263 return;
04ced10e8804 gcc 7 kono parents: diff changeset	1264
04ced10e8804 gcc 7 kono parents: diff changeset	1265 location_t loc = gimple_location (target);
04ced10e8804 gcc 7 kono parents: diff changeset	1266 if (dump_enabled_p ())
04ced10e8804 gcc 7 kono parents: diff changeset	1267 dump_printf_loc (MSG_OPTIMIZED_LOCATIONS, loc,
04ced10e8804 gcc 7 kono parents: diff changeset	1268 "Target construct will be turned into a gridified HSA "
04ced10e8804 gcc 7 kono parents: diff changeset	1269 "kernel\n");
04ced10e8804 gcc 7 kono parents: diff changeset	1270
04ced10e8804 gcc 7 kono parents: diff changeset	1271 /* Copy target body to a GPUKERNEL construct: */
04ced10e8804 gcc 7 kono parents: diff changeset	1272 gimple_seq kernel_seq = copy_gimple_seq_and_replace_locals
04ced10e8804 gcc 7 kono parents: diff changeset	1273 (gimple_omp_body (target));
04ced10e8804 gcc 7 kono parents: diff changeset	1274
04ced10e8804 gcc 7 kono parents: diff changeset	1275 hash_map<tree, tree> *declmap = new hash_map<tree, tree>;
04ced10e8804 gcc 7 kono parents: diff changeset	1276 struct walk_stmt_info wi;
04ced10e8804 gcc 7 kono parents: diff changeset	1277 memset (&wi, 0, sizeof (struct walk_stmt_info));
04ced10e8804 gcc 7 kono parents: diff changeset	1278 wi.info = declmap;
04ced10e8804 gcc 7 kono parents: diff changeset	1279
04ced10e8804 gcc 7 kono parents: diff changeset	1280 /* Copy assignments in between OMP statements before target, mark OMP
04ced10e8804 gcc 7 kono parents: diff changeset	1281 statements within copy appropriately. */
04ced10e8804 gcc 7 kono parents: diff changeset	1282 gomp_for *inner_loop = grid_process_kernel_body_copy (&grid, kernel_seq, gsi,
04ced10e8804 gcc 7 kono parents: diff changeset	1283 tgt_bind, &wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1284
04ced10e8804 gcc 7 kono parents: diff changeset	1285 gbind *old_bind
04ced10e8804 gcc 7 kono parents: diff changeset	1286 = as_a <gbind *> (gimple_seq_first (gimple_omp_body (target)));
04ced10e8804 gcc 7 kono parents: diff changeset	1287 gbind new_bind = as_a <gbind > (gimple_seq_first (kernel_seq));
04ced10e8804 gcc 7 kono parents: diff changeset	1288 tree new_block = gimple_bind_block (new_bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1289 tree enc_block = BLOCK_SUPERCONTEXT (gimple_bind_block (old_bind));
04ced10e8804 gcc 7 kono parents: diff changeset	1290 BLOCK_CHAIN (new_block) = BLOCK_SUBBLOCKS (enc_block);
04ced10e8804 gcc 7 kono parents: diff changeset	1291 BLOCK_SUBBLOCKS (enc_block) = new_block;
04ced10e8804 gcc 7 kono parents: diff changeset	1292 BLOCK_SUPERCONTEXT (new_block) = enc_block;
04ced10e8804 gcc 7 kono parents: diff changeset	1293 gimple *gpukernel = gimple_build_omp_grid_body (kernel_seq);
04ced10e8804 gcc 7 kono parents: diff changeset	1294 gimple_seq_add_stmt
04ced10e8804 gcc 7 kono parents: diff changeset	1295 (gimple_bind_body_ptr (as_a <gbind *> (gimple_omp_body (target))),
04ced10e8804 gcc 7 kono parents: diff changeset	1296 gpukernel);
04ced10e8804 gcc 7 kono parents: diff changeset	1297
04ced10e8804 gcc 7 kono parents: diff changeset	1298 for (size_t i = 0; i < grid.collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	1299 walk_tree (&grid.group_sizes[i], grid_remap_prebody_decls, &wi, NULL);
04ced10e8804 gcc 7 kono parents: diff changeset	1300 push_gimplify_context ();
04ced10e8804 gcc 7 kono parents: diff changeset	1301 for (size_t i = 0; i < grid.collapse; i++)
04ced10e8804 gcc 7 kono parents: diff changeset	1302 {
04ced10e8804 gcc 7 kono parents: diff changeset	1303 tree itype, type = TREE_TYPE (gimple_omp_for_index (inner_loop, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1304 if (POINTER_TYPE_P (type))
04ced10e8804 gcc 7 kono parents: diff changeset	1305 itype = signed_type_for (type);
04ced10e8804 gcc 7 kono parents: diff changeset	1306 else
04ced10e8804 gcc 7 kono parents: diff changeset	1307 itype = type;
04ced10e8804 gcc 7 kono parents: diff changeset	1308
04ced10e8804 gcc 7 kono parents: diff changeset	1309 enum tree_code cond_code = gimple_omp_for_cond (inner_loop, i);
04ced10e8804 gcc 7 kono parents: diff changeset	1310 tree n1 = unshare_expr (gimple_omp_for_initial (inner_loop, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1311 walk_tree (&n1, grid_remap_prebody_decls, &wi, NULL);
04ced10e8804 gcc 7 kono parents: diff changeset	1312 tree n2 = unshare_expr (gimple_omp_for_final (inner_loop, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1313 walk_tree (&n2, grid_remap_prebody_decls, &wi, NULL);
04ced10e8804 gcc 7 kono parents: diff changeset	1314 omp_adjust_for_condition (loc, &cond_code, &n2);
04ced10e8804 gcc 7 kono parents: diff changeset	1315 n1 = fold_convert (itype, n1);
04ced10e8804 gcc 7 kono parents: diff changeset	1316 n2 = fold_convert (itype, n2);
04ced10e8804 gcc 7 kono parents: diff changeset	1317
04ced10e8804 gcc 7 kono parents: diff changeset	1318 tree step
04ced10e8804 gcc 7 kono parents: diff changeset	1319 = omp_get_for_step_from_incr (loc, gimple_omp_for_incr (inner_loop, i));
04ced10e8804 gcc 7 kono parents: diff changeset	1320
04ced10e8804 gcc 7 kono parents: diff changeset	1321 tree t = build_int_cst (itype, (cond_code == LT_EXPR ? -1 : 1));
04ced10e8804 gcc 7 kono parents: diff changeset	1322 t = fold_build2 (PLUS_EXPR, itype, step, t);
04ced10e8804 gcc 7 kono parents: diff changeset	1323 t = fold_build2 (PLUS_EXPR, itype, t, n2);
04ced10e8804 gcc 7 kono parents: diff changeset	1324 t = fold_build2 (MINUS_EXPR, itype, t, n1);
04ced10e8804 gcc 7 kono parents: diff changeset	1325 if (TYPE_UNSIGNED (itype) && cond_code == GT_EXPR)
04ced10e8804 gcc 7 kono parents: diff changeset	1326 t = fold_build2 (TRUNC_DIV_EXPR, itype,
04ced10e8804 gcc 7 kono parents: diff changeset	1327 fold_build1 (NEGATE_EXPR, itype, t),
04ced10e8804 gcc 7 kono parents: diff changeset	1328 fold_build1 (NEGATE_EXPR, itype, step));
04ced10e8804 gcc 7 kono parents: diff changeset	1329 else
04ced10e8804 gcc 7 kono parents: diff changeset	1330 t = fold_build2 (TRUNC_DIV_EXPR, itype, t, step);
04ced10e8804 gcc 7 kono parents: diff changeset	1331 if (grid.tiling)
04ced10e8804 gcc 7 kono parents: diff changeset	1332 {
04ced10e8804 gcc 7 kono parents: diff changeset	1333 if (cond_code == GT_EXPR)
04ced10e8804 gcc 7 kono parents: diff changeset	1334 step = fold_build1 (NEGATE_EXPR, itype, step);
04ced10e8804 gcc 7 kono parents: diff changeset	1335 t = fold_build2 (MULT_EXPR, itype, t, step);
04ced10e8804 gcc 7 kono parents: diff changeset	1336 }
04ced10e8804 gcc 7 kono parents: diff changeset	1337
04ced10e8804 gcc 7 kono parents: diff changeset	1338 tree gs = fold_convert (uint32_type_node, t);
04ced10e8804 gcc 7 kono parents: diff changeset	1339 gimple_seq tmpseq = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1340 gimplify_expr (&gs, &tmpseq, NULL, is_gimple_val, fb_rvalue);
04ced10e8804 gcc 7 kono parents: diff changeset	1341 if (!gimple_seq_empty_p (tmpseq))
04ced10e8804 gcc 7 kono parents: diff changeset	1342 gsi_insert_seq_before (gsi, tmpseq, GSI_SAME_STMT);
04ced10e8804 gcc 7 kono parents: diff changeset	1343
04ced10e8804 gcc 7 kono parents: diff changeset	1344 tree ws;
04ced10e8804 gcc 7 kono parents: diff changeset	1345 if (grid.group_sizes[i])
04ced10e8804 gcc 7 kono parents: diff changeset	1346 {
04ced10e8804 gcc 7 kono parents: diff changeset	1347 ws = fold_convert (uint32_type_node, grid.group_sizes[i]);
04ced10e8804 gcc 7 kono parents: diff changeset	1348 tmpseq = NULL;
04ced10e8804 gcc 7 kono parents: diff changeset	1349 gimplify_expr (&ws, &tmpseq, NULL, is_gimple_val, fb_rvalue);
04ced10e8804 gcc 7 kono parents: diff changeset	1350 if (!gimple_seq_empty_p (tmpseq))
04ced10e8804 gcc 7 kono parents: diff changeset	1351 gsi_insert_seq_before (gsi, tmpseq, GSI_SAME_STMT);
04ced10e8804 gcc 7 kono parents: diff changeset	1352 }
04ced10e8804 gcc 7 kono parents: diff changeset	1353 else
04ced10e8804 gcc 7 kono parents: diff changeset	1354 ws = build_zero_cst (uint32_type_node);
04ced10e8804 gcc 7 kono parents: diff changeset	1355
04ced10e8804 gcc 7 kono parents: diff changeset	1356 tree c = build_omp_clause (UNKNOWN_LOCATION, OMP_CLAUSE__GRIDDIM_);
04ced10e8804 gcc 7 kono parents: diff changeset	1357 OMP_CLAUSE__GRIDDIM__DIMENSION (c) = i;
04ced10e8804 gcc 7 kono parents: diff changeset	1358 OMP_CLAUSE__GRIDDIM__SIZE (c) = gs;
04ced10e8804 gcc 7 kono parents: diff changeset	1359 OMP_CLAUSE__GRIDDIM__GROUP (c) = ws;
04ced10e8804 gcc 7 kono parents: diff changeset	1360 OMP_CLAUSE_CHAIN (c) = gimple_omp_target_clauses (target);
04ced10e8804 gcc 7 kono parents: diff changeset	1361 gimple_omp_target_set_clauses (target, c);
04ced10e8804 gcc 7 kono parents: diff changeset	1362 }
04ced10e8804 gcc 7 kono parents: diff changeset	1363 pop_gimplify_context (tgt_bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1364 delete declmap;
04ced10e8804 gcc 7 kono parents: diff changeset	1365 return;
04ced10e8804 gcc 7 kono parents: diff changeset	1366 }
04ced10e8804 gcc 7 kono parents: diff changeset	1367
04ced10e8804 gcc 7 kono parents: diff changeset	1368 /* Walker function doing all the work for create_target_kernels. */
04ced10e8804 gcc 7 kono parents: diff changeset	1369
04ced10e8804 gcc 7 kono parents: diff changeset	1370 static tree
04ced10e8804 gcc 7 kono parents: diff changeset	1371 grid_gridify_all_targets_stmt (gimple_stmt_iterator *gsi,
04ced10e8804 gcc 7 kono parents: diff changeset	1372 bool *handled_ops_p,
04ced10e8804 gcc 7 kono parents: diff changeset	1373 struct walk_stmt_info *incoming)
04ced10e8804 gcc 7 kono parents: diff changeset	1374 {
04ced10e8804 gcc 7 kono parents: diff changeset	1375 *handled_ops_p = false;
04ced10e8804 gcc 7 kono parents: diff changeset	1376
04ced10e8804 gcc 7 kono parents: diff changeset	1377 gimple stmt = gsi_stmt (gsi);
04ced10e8804 gcc 7 kono parents: diff changeset	1378 gomp_target target = dyn_cast <gomp_target > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1379 if (target)
04ced10e8804 gcc 7 kono parents: diff changeset	1380 {
04ced10e8804 gcc 7 kono parents: diff changeset	1381 gbind tgt_bind = (gbind ) incoming->info;
04ced10e8804 gcc 7 kono parents: diff changeset	1382 gcc_checking_assert (tgt_bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1383 grid_attempt_target_gridification (target, gsi, tgt_bind);
04ced10e8804 gcc 7 kono parents: diff changeset	1384 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	1385 }
04ced10e8804 gcc 7 kono parents: diff changeset	1386 gbind bind = dyn_cast <gbind > (stmt);
04ced10e8804 gcc 7 kono parents: diff changeset	1387 if (bind)
04ced10e8804 gcc 7 kono parents: diff changeset	1388 {
04ced10e8804 gcc 7 kono parents: diff changeset	1389 *handled_ops_p = true;
04ced10e8804 gcc 7 kono parents: diff changeset	1390 struct walk_stmt_info wi;
04ced10e8804 gcc 7 kono parents: diff changeset	1391 memset (&wi, 0, sizeof (wi));
04ced10e8804 gcc 7 kono parents: diff changeset	1392 wi.info = bind;
04ced10e8804 gcc 7 kono parents: diff changeset	1393 walk_gimple_seq_mod (gimple_bind_body_ptr (bind),
04ced10e8804 gcc 7 kono parents: diff changeset	1394 grid_gridify_all_targets_stmt, NULL, &wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1395 }
04ced10e8804 gcc 7 kono parents: diff changeset	1396 return NULL_TREE;
04ced10e8804 gcc 7 kono parents: diff changeset	1397 }
04ced10e8804 gcc 7 kono parents: diff changeset	1398
04ced10e8804 gcc 7 kono parents: diff changeset	1399 /* Attempt to gridify all target constructs in BODY_P. All such targets will
04ced10e8804 gcc 7 kono parents: diff changeset	1400 have their bodies duplicated, with the new copy being put into a
04ced10e8804 gcc 7 kono parents: diff changeset	1401 gimple_omp_grid_body statement. All kernel-related construct within the
04ced10e8804 gcc 7 kono parents: diff changeset	1402 grid_body will be marked with phony flags or kernel kinds. Moreover, some
04ced10e8804 gcc 7 kono parents: diff changeset	1403 re-structuring is often needed, such as copying pre-bodies before the target
04ced10e8804 gcc 7 kono parents: diff changeset	1404 construct so that kernel grid sizes can be computed. */
04ced10e8804 gcc 7 kono parents: diff changeset	1405
04ced10e8804 gcc 7 kono parents: diff changeset	1406 void
04ced10e8804 gcc 7 kono parents: diff changeset	1407 omp_grid_gridify_all_targets (gimple_seq *body_p)
04ced10e8804 gcc 7 kono parents: diff changeset	1408 {
04ced10e8804 gcc 7 kono parents: diff changeset	1409 struct walk_stmt_info wi;
04ced10e8804 gcc 7 kono parents: diff changeset	1410 memset (&wi, 0, sizeof (wi));
04ced10e8804 gcc 7 kono parents: diff changeset	1411 walk_gimple_seq_mod (body_p, grid_gridify_all_targets_stmt, NULL, &wi);
04ced10e8804 gcc 7 kono parents: diff changeset	1412 }

Mercurial > hg > CbC > CbC_gcc

annotate gcc/omp-grid.c @ 116:367f9f4f266e