CbC/CbC_llvm: clang/lib/Lex/DependencyDirectivesSourceMinimizer.cpp annotate

annotate clang/lib/Lex/DependencyDirectivesSourceMinimizer.cpp @ 176:de4ac79aef9d

...

author	Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date	Mon, 25 May 2020 17:13:11 +0900
parents	0572611fdcc8
children	2e18cbf3894f

rev	line source
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	1 //===- DependencyDirectivesSourceMinimizer.cpp - -------------------------===//
1d019706d866 LLVM10 anatofuz parents: diff changeset	2 //
1d019706d866 LLVM10 anatofuz parents: diff changeset	3 // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
1d019706d866 LLVM10 anatofuz parents: diff changeset	4 // See https://llvm.org/LICENSE.txt for license information.
1d019706d866 LLVM10 anatofuz parents: diff changeset	5 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
1d019706d866 LLVM10 anatofuz parents: diff changeset	6 //
1d019706d866 LLVM10 anatofuz parents: diff changeset	7 //===----------------------------------------------------------------------===//
1d019706d866 LLVM10 anatofuz parents: diff changeset	8 ///
1d019706d866 LLVM10 anatofuz parents: diff changeset	9 /// \file
1d019706d866 LLVM10 anatofuz parents: diff changeset	10 /// This is the implementation for minimizing header and source files to the
1d019706d866 LLVM10 anatofuz parents: diff changeset	11 /// minimum necessary preprocessor directives for evaluating includes. It
1d019706d866 LLVM10 anatofuz parents: diff changeset	12 /// reduces the source down to #define, #include, #import, @import, and any
1d019706d866 LLVM10 anatofuz parents: diff changeset	13 /// conditional preprocessor logic that contains one of those.
1d019706d866 LLVM10 anatofuz parents: diff changeset	14 ///
1d019706d866 LLVM10 anatofuz parents: diff changeset	15 //===----------------------------------------------------------------------===//
1d019706d866 LLVM10 anatofuz parents: diff changeset	16
1d019706d866 LLVM10 anatofuz parents: diff changeset	17 #include "clang/Lex/DependencyDirectivesSourceMinimizer.h"
1d019706d866 LLVM10 anatofuz parents: diff changeset	18 #include "clang/Basic/CharInfo.h"
1d019706d866 LLVM10 anatofuz parents: diff changeset	19 #include "clang/Basic/Diagnostic.h"
1d019706d866 LLVM10 anatofuz parents: diff changeset	20 #include "clang/Lex/LexDiagnostic.h"
173 0572611fdcc8 reorgnization done Shinji KONO <kono@ie.u-ryukyu.ac.jp> parents: 150 diff changeset	21 #include "llvm/ADT/StringMap.h"
150 1d019706d866 LLVM10 anatofuz parents: diff changeset	22 #include "llvm/ADT/StringSwitch.h"
1d019706d866 LLVM10 anatofuz parents: diff changeset	23 #include "llvm/Support/MemoryBuffer.h"
1d019706d866 LLVM10 anatofuz parents: diff changeset	24
1d019706d866 LLVM10 anatofuz parents: diff changeset	25 using namespace llvm;
1d019706d866 LLVM10 anatofuz parents: diff changeset	26 using namespace clang;
1d019706d866 LLVM10 anatofuz parents: diff changeset	27 using namespace clang::minimize_source_to_dependency_directives;
1d019706d866 LLVM10 anatofuz parents: diff changeset	28
1d019706d866 LLVM10 anatofuz parents: diff changeset	29 namespace {
1d019706d866 LLVM10 anatofuz parents: diff changeset	30
1d019706d866 LLVM10 anatofuz parents: diff changeset	31 struct Minimizer {
1d019706d866 LLVM10 anatofuz parents: diff changeset	32 /// Minimized output.
1d019706d866 LLVM10 anatofuz parents: diff changeset	33 SmallVectorImpl<char> &Out;
1d019706d866 LLVM10 anatofuz parents: diff changeset	34 /// The known tokens encountered during the minimization.
1d019706d866 LLVM10 anatofuz parents: diff changeset	35 SmallVectorImpl<Token> &Tokens;
1d019706d866 LLVM10 anatofuz parents: diff changeset	36
1d019706d866 LLVM10 anatofuz parents: diff changeset	37 Minimizer(SmallVectorImpl<char> &Out, SmallVectorImpl<Token> &Tokens,
1d019706d866 LLVM10 anatofuz parents: diff changeset	38 StringRef Input, DiagnosticsEngine *Diags,
1d019706d866 LLVM10 anatofuz parents: diff changeset	39 SourceLocation InputSourceLoc)
1d019706d866 LLVM10 anatofuz parents: diff changeset	40 : Out(Out), Tokens(Tokens), Input(Input), Diags(Diags),
1d019706d866 LLVM10 anatofuz parents: diff changeset	41 InputSourceLoc(InputSourceLoc) {}
1d019706d866 LLVM10 anatofuz parents: diff changeset	42
1d019706d866 LLVM10 anatofuz parents: diff changeset	43 /// Lex the provided source and emit the minimized output.
1d019706d866 LLVM10 anatofuz parents: diff changeset	44 ///
1d019706d866 LLVM10 anatofuz parents: diff changeset	45 /// \returns True on error.
1d019706d866 LLVM10 anatofuz parents: diff changeset	46 bool minimize();
1d019706d866 LLVM10 anatofuz parents: diff changeset	47
1d019706d866 LLVM10 anatofuz parents: diff changeset	48 private:
1d019706d866 LLVM10 anatofuz parents: diff changeset	49 struct IdInfo {
1d019706d866 LLVM10 anatofuz parents: diff changeset	50 const char *Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	51 StringRef Name;
1d019706d866 LLVM10 anatofuz parents: diff changeset	52 };
1d019706d866 LLVM10 anatofuz parents: diff changeset	53
1d019706d866 LLVM10 anatofuz parents: diff changeset	54 /// Lex an identifier.
1d019706d866 LLVM10 anatofuz parents: diff changeset	55 ///
1d019706d866 LLVM10 anatofuz parents: diff changeset	56 /// \pre First points at a valid identifier head.
1d019706d866 LLVM10 anatofuz parents: diff changeset	57 LLVM_NODISCARD IdInfo lexIdentifier(const char First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	58 LLVM_NODISCARD bool isNextIdentifier(StringRef Id, const char *&First,
1d019706d866 LLVM10 anatofuz parents: diff changeset	59 const char *const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	60 LLVM_NODISCARD bool minimizeImpl(const char First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	61 LLVM_NODISCARD bool lexPPLine(const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	62 LLVM_NODISCARD bool lexAt(const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	63 LLVM_NODISCARD bool lexModule(const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	64 LLVM_NODISCARD bool lexDefine(const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	65 LLVM_NODISCARD bool lexPragma(const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	66 LLVM_NODISCARD bool lexEndif(const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	67 LLVM_NODISCARD bool lexDefault(TokenKind Kind, StringRef Directive,
1d019706d866 LLVM10 anatofuz parents: diff changeset	68 const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	69 Token &makeToken(TokenKind K) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	70 Tokens.emplace_back(K, Out.size());
1d019706d866 LLVM10 anatofuz parents: diff changeset	71 return Tokens.back();
1d019706d866 LLVM10 anatofuz parents: diff changeset	72 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	73 void popToken() {
1d019706d866 LLVM10 anatofuz parents: diff changeset	74 Out.resize(Tokens.back().Offset);
1d019706d866 LLVM10 anatofuz parents: diff changeset	75 Tokens.pop_back();
1d019706d866 LLVM10 anatofuz parents: diff changeset	76 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	77 TokenKind top() const { return Tokens.empty() ? pp_none : Tokens.back().K; }
1d019706d866 LLVM10 anatofuz parents: diff changeset	78
1d019706d866 LLVM10 anatofuz parents: diff changeset	79 Minimizer &put(char Byte) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	80 Out.push_back(Byte);
1d019706d866 LLVM10 anatofuz parents: diff changeset	81 return *this;
1d019706d866 LLVM10 anatofuz parents: diff changeset	82 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	83 Minimizer &append(StringRef S) { return append(S.begin(), S.end()); }
1d019706d866 LLVM10 anatofuz parents: diff changeset	84 Minimizer &append(const char First, const char Last) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	85 Out.append(First, Last);
1d019706d866 LLVM10 anatofuz parents: diff changeset	86 return *this;
1d019706d866 LLVM10 anatofuz parents: diff changeset	87 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	88
1d019706d866 LLVM10 anatofuz parents: diff changeset	89 void printToNewline(const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	90 void printAdjacentModuleNameParts(const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	91 LLVM_NODISCARD bool printAtImportBody(const char *&First,
1d019706d866 LLVM10 anatofuz parents: diff changeset	92 const char *const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	93 void printDirectiveBody(const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	94 void printAdjacentMacroArgs(const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	95 LLVM_NODISCARD bool printMacroArgs(const char &First, const char const End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	96
1d019706d866 LLVM10 anatofuz parents: diff changeset	97 /// Reports a diagnostic if the diagnostic engine is provided. Always returns
1d019706d866 LLVM10 anatofuz parents: diff changeset	98 /// true at the end.
1d019706d866 LLVM10 anatofuz parents: diff changeset	99 bool reportError(const char *CurPtr, unsigned Err);
1d019706d866 LLVM10 anatofuz parents: diff changeset	100
1d019706d866 LLVM10 anatofuz parents: diff changeset	101 StringMap<char> SplitIds;
1d019706d866 LLVM10 anatofuz parents: diff changeset	102 StringRef Input;
1d019706d866 LLVM10 anatofuz parents: diff changeset	103 DiagnosticsEngine *Diags;
1d019706d866 LLVM10 anatofuz parents: diff changeset	104 SourceLocation InputSourceLoc;
1d019706d866 LLVM10 anatofuz parents: diff changeset	105 };
1d019706d866 LLVM10 anatofuz parents: diff changeset	106
1d019706d866 LLVM10 anatofuz parents: diff changeset	107 } // end anonymous namespace
1d019706d866 LLVM10 anatofuz parents: diff changeset	108
1d019706d866 LLVM10 anatofuz parents: diff changeset	109 bool Minimizer::reportError(const char *CurPtr, unsigned Err) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	110 if (!Diags)
1d019706d866 LLVM10 anatofuz parents: diff changeset	111 return true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	112 assert(CurPtr >= Input.data() && "invalid buffer ptr");
1d019706d866 LLVM10 anatofuz parents: diff changeset	113 Diags->Report(InputSourceLoc.getLocWithOffset(CurPtr - Input.data()), Err);
1d019706d866 LLVM10 anatofuz parents: diff changeset	114 return true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	115 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	116
1d019706d866 LLVM10 anatofuz parents: diff changeset	117 static void skipOverSpaces(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	118 while (First != End && isHorizontalWhitespace(*First))
1d019706d866 LLVM10 anatofuz parents: diff changeset	119 ++First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	120 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	121
1d019706d866 LLVM10 anatofuz parents: diff changeset	122 LLVM_NODISCARD static bool isRawStringLiteral(const char *First,
1d019706d866 LLVM10 anatofuz parents: diff changeset	123 const char *Current) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	124 assert(First <= Current);
1d019706d866 LLVM10 anatofuz parents: diff changeset	125
1d019706d866 LLVM10 anatofuz parents: diff changeset	126 // Check if we can even back up.
1d019706d866 LLVM10 anatofuz parents: diff changeset	127 if (*Current != '"' \|\| First == Current)
1d019706d866 LLVM10 anatofuz parents: diff changeset	128 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	129
1d019706d866 LLVM10 anatofuz parents: diff changeset	130 // Check for an "R".
1d019706d866 LLVM10 anatofuz parents: diff changeset	131 --Current;
1d019706d866 LLVM10 anatofuz parents: diff changeset	132 if (*Current != 'R')
1d019706d866 LLVM10 anatofuz parents: diff changeset	133 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	134 if (First == Current \|\| !isIdentifierBody(*--Current))
1d019706d866 LLVM10 anatofuz parents: diff changeset	135 return true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	136
1d019706d866 LLVM10 anatofuz parents: diff changeset	137 // Check for a prefix of "u", "U", or "L".
1d019706d866 LLVM10 anatofuz parents: diff changeset	138 if (Current == 'u' \|\| Current == 'U' \|\| *Current == 'L')
1d019706d866 LLVM10 anatofuz parents: diff changeset	139 return First == Current \|\| !isIdentifierBody(*--Current);
1d019706d866 LLVM10 anatofuz parents: diff changeset	140
1d019706d866 LLVM10 anatofuz parents: diff changeset	141 // Check for a prefix of "u8".
1d019706d866 LLVM10 anatofuz parents: diff changeset	142 if (Current != '8' \|\| First == Current \|\| Current-- != 'u')
1d019706d866 LLVM10 anatofuz parents: diff changeset	143 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	144 return First == Current \|\| !isIdentifierBody(*--Current);
1d019706d866 LLVM10 anatofuz parents: diff changeset	145 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	146
1d019706d866 LLVM10 anatofuz parents: diff changeset	147 static void skipRawString(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	148 assert(First[0] == '"');
1d019706d866 LLVM10 anatofuz parents: diff changeset	149 assert(First[-1] == 'R');
1d019706d866 LLVM10 anatofuz parents: diff changeset	150
1d019706d866 LLVM10 anatofuz parents: diff changeset	151 const char *Last = ++First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	152 while (Last != End && *Last != '(')
1d019706d866 LLVM10 anatofuz parents: diff changeset	153 ++Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	154 if (Last == End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	155 First = Last; // Hit the end... just give up.
1d019706d866 LLVM10 anatofuz parents: diff changeset	156 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	157 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	158
1d019706d866 LLVM10 anatofuz parents: diff changeset	159 StringRef Terminator(First, Last - First);
1d019706d866 LLVM10 anatofuz parents: diff changeset	160 for (;;) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	161 // Move First to just past the next ")".
1d019706d866 LLVM10 anatofuz parents: diff changeset	162 First = Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	163 while (First != End && *First != ')')
1d019706d866 LLVM10 anatofuz parents: diff changeset	164 ++First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	165 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	166 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	167 ++First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	168
1d019706d866 LLVM10 anatofuz parents: diff changeset	169 // Look ahead for the terminator sequence.
1d019706d866 LLVM10 anatofuz parents: diff changeset	170 Last = First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	171 while (Last != End && size_t(Last - First) < Terminator.size() &&
1d019706d866 LLVM10 anatofuz parents: diff changeset	172 Terminator[Last - First] == *Last)
1d019706d866 LLVM10 anatofuz parents: diff changeset	173 ++Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	174
1d019706d866 LLVM10 anatofuz parents: diff changeset	175 // Check if we hit it (or the end of the file).
1d019706d866 LLVM10 anatofuz parents: diff changeset	176 if (Last == End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	177 First = Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	178 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	179 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	180 if (size_t(Last - First) < Terminator.size())
1d019706d866 LLVM10 anatofuz parents: diff changeset	181 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	182 if (*Last != '"')
1d019706d866 LLVM10 anatofuz parents: diff changeset	183 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	184 First = Last + 1;
1d019706d866 LLVM10 anatofuz parents: diff changeset	185 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	186 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	187 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	188
1d019706d866 LLVM10 anatofuz parents: diff changeset	189 // Returns the length of EOL, either 0 (no end-of-line), 1 (\n) or 2 (\r\n)
1d019706d866 LLVM10 anatofuz parents: diff changeset	190 static unsigned isEOL(const char First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	191 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	192 return 0;
1d019706d866 LLVM10 anatofuz parents: diff changeset	193 if (End - First > 1 && isVerticalWhitespace(First[0]) &&
1d019706d866 LLVM10 anatofuz parents: diff changeset	194 isVerticalWhitespace(First[1]) && First[0] != First[1])
1d019706d866 LLVM10 anatofuz parents: diff changeset	195 return 2;
1d019706d866 LLVM10 anatofuz parents: diff changeset	196 return !!isVerticalWhitespace(First[0]);
1d019706d866 LLVM10 anatofuz parents: diff changeset	197 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	198
1d019706d866 LLVM10 anatofuz parents: diff changeset	199 static void skipString(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	200 assert(First == '\'' \|\| First == '"' \|\| *First == '<');
1d019706d866 LLVM10 anatofuz parents: diff changeset	201 const char Terminator = First == '<' ? '>' : First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	202 for (++First; First != End && *First != Terminator; ++First) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	203 // String and character literals don't extend past the end of the line.
1d019706d866 LLVM10 anatofuz parents: diff changeset	204 if (isVerticalWhitespace(*First))
1d019706d866 LLVM10 anatofuz parents: diff changeset	205 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	206 if (*First != '\\')
1d019706d866 LLVM10 anatofuz parents: diff changeset	207 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	208 // Skip past backslash to the next character. This ensures that the
1d019706d866 LLVM10 anatofuz parents: diff changeset	209 // character right after it is skipped as well, which matters if it's
1d019706d866 LLVM10 anatofuz parents: diff changeset	210 // the terminator.
1d019706d866 LLVM10 anatofuz parents: diff changeset	211 if (++First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	212 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	213 if (!isWhitespace(*First))
1d019706d866 LLVM10 anatofuz parents: diff changeset	214 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	215 // Whitespace after the backslash might indicate a line continuation.
1d019706d866 LLVM10 anatofuz parents: diff changeset	216 const char *FirstAfterBackslashPastSpace = First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	217 skipOverSpaces(FirstAfterBackslashPastSpace, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	218 if (unsigned NLSize = isEOL(FirstAfterBackslashPastSpace, End)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	219 // Advance the character pointer to the next line for the next
1d019706d866 LLVM10 anatofuz parents: diff changeset	220 // iteration.
1d019706d866 LLVM10 anatofuz parents: diff changeset	221 First = FirstAfterBackslashPastSpace + NLSize - 1;
1d019706d866 LLVM10 anatofuz parents: diff changeset	222 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	223 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	224 if (First != End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	225 ++First; // Finish off the string.
1d019706d866 LLVM10 anatofuz parents: diff changeset	226 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	227
1d019706d866 LLVM10 anatofuz parents: diff changeset	228 // Returns the length of the skipped newline
1d019706d866 LLVM10 anatofuz parents: diff changeset	229 static unsigned skipNewline(const char &First, const char End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	230 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	231 return 0;
1d019706d866 LLVM10 anatofuz parents: diff changeset	232 assert(isVerticalWhitespace(*First));
1d019706d866 LLVM10 anatofuz parents: diff changeset	233 unsigned Len = isEOL(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	234 assert(Len && "expected newline");
1d019706d866 LLVM10 anatofuz parents: diff changeset	235 First += Len;
1d019706d866 LLVM10 anatofuz parents: diff changeset	236 return Len;
1d019706d866 LLVM10 anatofuz parents: diff changeset	237 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	238
1d019706d866 LLVM10 anatofuz parents: diff changeset	239 static bool wasLineContinuation(const char *First, unsigned EOLLen) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	240 return *(First - (int)EOLLen - 1) == '\\';
1d019706d866 LLVM10 anatofuz parents: diff changeset	241 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	242
1d019706d866 LLVM10 anatofuz parents: diff changeset	243 static void skipToNewlineRaw(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	244 for (;;) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	245 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	246 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	247
1d019706d866 LLVM10 anatofuz parents: diff changeset	248 unsigned Len = isEOL(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	249 if (Len)
1d019706d866 LLVM10 anatofuz parents: diff changeset	250 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	251
1d019706d866 LLVM10 anatofuz parents: diff changeset	252 do {
1d019706d866 LLVM10 anatofuz parents: diff changeset	253 if (++First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	254 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	255 Len = isEOL(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	256 } while (!Len);
1d019706d866 LLVM10 anatofuz parents: diff changeset	257
1d019706d866 LLVM10 anatofuz parents: diff changeset	258 if (First[-1] != '\\')
1d019706d866 LLVM10 anatofuz parents: diff changeset	259 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	260
1d019706d866 LLVM10 anatofuz parents: diff changeset	261 First += Len;
1d019706d866 LLVM10 anatofuz parents: diff changeset	262 // Keep skipping lines...
1d019706d866 LLVM10 anatofuz parents: diff changeset	263 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	264 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	265
1d019706d866 LLVM10 anatofuz parents: diff changeset	266 static const char findLastNonSpace(const char First, const char *Last) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	267 assert(First <= Last);
1d019706d866 LLVM10 anatofuz parents: diff changeset	268 while (First != Last && isHorizontalWhitespace(Last[-1]))
1d019706d866 LLVM10 anatofuz parents: diff changeset	269 --Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	270 return Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	271 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	272
1d019706d866 LLVM10 anatofuz parents: diff changeset	273 static const char findFirstTrailingSpace(const char First,
1d019706d866 LLVM10 anatofuz parents: diff changeset	274 const char *Last) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	275 const char *LastNonSpace = findLastNonSpace(First, Last);
1d019706d866 LLVM10 anatofuz parents: diff changeset	276 if (Last == LastNonSpace)
1d019706d866 LLVM10 anatofuz parents: diff changeset	277 return Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	278 assert(isHorizontalWhitespace(LastNonSpace[0]));
1d019706d866 LLVM10 anatofuz parents: diff changeset	279 return LastNonSpace + 1;
1d019706d866 LLVM10 anatofuz parents: diff changeset	280 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	281
1d019706d866 LLVM10 anatofuz parents: diff changeset	282 static void skipLineComment(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	283 assert(First[0] == '/' && First[1] == '/');
1d019706d866 LLVM10 anatofuz parents: diff changeset	284 First += 2;
1d019706d866 LLVM10 anatofuz parents: diff changeset	285 skipToNewlineRaw(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	286 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	287
1d019706d866 LLVM10 anatofuz parents: diff changeset	288 static void skipBlockComment(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	289 assert(First[0] == '/' && First[1] == '*');
1d019706d866 LLVM10 anatofuz parents: diff changeset	290 if (End - First < 4) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	291 First = End;
1d019706d866 LLVM10 anatofuz parents: diff changeset	292 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	293 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	294 for (First += 3; First != End; ++First)
1d019706d866 LLVM10 anatofuz parents: diff changeset	295 if (First[-1] == '*' && First[0] == '/') {
1d019706d866 LLVM10 anatofuz parents: diff changeset	296 ++First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	297 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	298 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	299 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	300
1d019706d866 LLVM10 anatofuz parents: diff changeset	301 /// \returns True if the current single quotation mark character is a C++ 14
1d019706d866 LLVM10 anatofuz parents: diff changeset	302 /// digit separator.
1d019706d866 LLVM10 anatofuz parents: diff changeset	303 static bool isQuoteCppDigitSeparator(const char *const Start,
1d019706d866 LLVM10 anatofuz parents: diff changeset	304 const char *const Cur,
1d019706d866 LLVM10 anatofuz parents: diff changeset	305 const char *const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	306 assert(*Cur == '\'' && "expected quotation character");
1d019706d866 LLVM10 anatofuz parents: diff changeset	307 // skipLine called in places where we don't expect a valid number
1d019706d866 LLVM10 anatofuz parents: diff changeset	308 // body before `start` on the same line, so always return false at the start.
1d019706d866 LLVM10 anatofuz parents: diff changeset	309 if (Start == Cur)
1d019706d866 LLVM10 anatofuz parents: diff changeset	310 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	311 // The previous character must be a valid PP number character.
1d019706d866 LLVM10 anatofuz parents: diff changeset	312 // Make sure that the L, u, U, u8 prefixes don't get marked as a
1d019706d866 LLVM10 anatofuz parents: diff changeset	313 // separator though.
1d019706d866 LLVM10 anatofuz parents: diff changeset	314 char Prev = *(Cur - 1);
1d019706d866 LLVM10 anatofuz parents: diff changeset	315 if (Prev == 'L' \|\| Prev == 'U' \|\| Prev == 'u')
1d019706d866 LLVM10 anatofuz parents: diff changeset	316 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	317 if (Prev == '8' && (Cur - 1 != Start) && *(Cur - 2) == 'u')
1d019706d866 LLVM10 anatofuz parents: diff changeset	318 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	319 if (!isPreprocessingNumberBody(Prev))
1d019706d866 LLVM10 anatofuz parents: diff changeset	320 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	321 // The next character should be a valid identifier body character.
1d019706d866 LLVM10 anatofuz parents: diff changeset	322 return (Cur + 1) < End && isIdentifierBody(*(Cur + 1));
1d019706d866 LLVM10 anatofuz parents: diff changeset	323 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	324
1d019706d866 LLVM10 anatofuz parents: diff changeset	325 static void skipLine(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	326 for (;;) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	327 assert(First <= End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	328 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	329 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	330
1d019706d866 LLVM10 anatofuz parents: diff changeset	331 if (isVerticalWhitespace(*First)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	332 skipNewline(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	333 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	334 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	335 const char *Start = First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	336 while (First != End && !isVerticalWhitespace(*First)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	337 // Iterate over strings correctly to avoid comments and newlines.
1d019706d866 LLVM10 anatofuz parents: diff changeset	338 if (*First == '"' \|\|
1d019706d866 LLVM10 anatofuz parents: diff changeset	339 (*First == '\'' && !isQuoteCppDigitSeparator(Start, First, End))) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	340 if (isRawStringLiteral(Start, First))
1d019706d866 LLVM10 anatofuz parents: diff changeset	341 skipRawString(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	342 else
1d019706d866 LLVM10 anatofuz parents: diff changeset	343 skipString(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	344 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	345 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	346
1d019706d866 LLVM10 anatofuz parents: diff changeset	347 // Iterate over comments correctly.
1d019706d866 LLVM10 anatofuz parents: diff changeset	348 if (*First != '/' \|\| End - First < 2) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	349 ++First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	350 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	351 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	352
1d019706d866 LLVM10 anatofuz parents: diff changeset	353 if (First[1] == '/') {
1d019706d866 LLVM10 anatofuz parents: diff changeset	354 // "//...".
1d019706d866 LLVM10 anatofuz parents: diff changeset	355 skipLineComment(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	356 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	357 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	358
1d019706d866 LLVM10 anatofuz parents: diff changeset	359 if (First[1] != '*') {
1d019706d866 LLVM10 anatofuz parents: diff changeset	360 ++First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	361 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	362 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	363
1d019706d866 LLVM10 anatofuz parents: diff changeset	364 // "/.../".
1d019706d866 LLVM10 anatofuz parents: diff changeset	365 skipBlockComment(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	366 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	367 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	368 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	369
1d019706d866 LLVM10 anatofuz parents: diff changeset	370 // Skip over the newline.
1d019706d866 LLVM10 anatofuz parents: diff changeset	371 unsigned Len = skipNewline(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	372 if (!wasLineContinuation(First, Len)) // Continue past line-continuations.
1d019706d866 LLVM10 anatofuz parents: diff changeset	373 break;
1d019706d866 LLVM10 anatofuz parents: diff changeset	374 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	375 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	376
1d019706d866 LLVM10 anatofuz parents: diff changeset	377 static void skipDirective(StringRef Name, const char *&First,
1d019706d866 LLVM10 anatofuz parents: diff changeset	378 const char *const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	379 if (llvm::StringSwitch<bool>(Name)
1d019706d866 LLVM10 anatofuz parents: diff changeset	380 .Case("warning", true)
1d019706d866 LLVM10 anatofuz parents: diff changeset	381 .Case("error", true)
1d019706d866 LLVM10 anatofuz parents: diff changeset	382 .Default(false))
1d019706d866 LLVM10 anatofuz parents: diff changeset	383 // Do not process quotes or comments.
1d019706d866 LLVM10 anatofuz parents: diff changeset	384 skipToNewlineRaw(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	385 else
1d019706d866 LLVM10 anatofuz parents: diff changeset	386 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	387 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	388
1d019706d866 LLVM10 anatofuz parents: diff changeset	389 void Minimizer::printToNewline(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	390 while (First != End && !isVerticalWhitespace(*First)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	391 const char *Last = First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	392 do {
1d019706d866 LLVM10 anatofuz parents: diff changeset	393 // Iterate over strings correctly to avoid comments and newlines.
1d019706d866 LLVM10 anatofuz parents: diff changeset	394 if (Last == '"' \|\| Last == '\'' \|\|
1d019706d866 LLVM10 anatofuz parents: diff changeset	395 (*Last == '<' && top() == pp_include)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	396 if (LLVM_UNLIKELY(isRawStringLiteral(First, Last)))
1d019706d866 LLVM10 anatofuz parents: diff changeset	397 skipRawString(Last, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	398 else
1d019706d866 LLVM10 anatofuz parents: diff changeset	399 skipString(Last, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	400 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	401 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	402 if (*Last != '/' \|\| End - Last < 2) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	403 ++Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	404 continue; // Gather the rest up to print verbatim.
1d019706d866 LLVM10 anatofuz parents: diff changeset	405 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	406
1d019706d866 LLVM10 anatofuz parents: diff changeset	407 if (Last[1] != '/' && Last[1] != '*') {
1d019706d866 LLVM10 anatofuz parents: diff changeset	408 ++Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	409 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	410 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	411
1d019706d866 LLVM10 anatofuz parents: diff changeset	412 // Deal with "//..." and "/.../".
1d019706d866 LLVM10 anatofuz parents: diff changeset	413 append(First, findFirstTrailingSpace(First, Last));
1d019706d866 LLVM10 anatofuz parents: diff changeset	414 First = Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	415
1d019706d866 LLVM10 anatofuz parents: diff changeset	416 if (Last[1] == '/') {
1d019706d866 LLVM10 anatofuz parents: diff changeset	417 skipLineComment(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	418 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	419 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	420
1d019706d866 LLVM10 anatofuz parents: diff changeset	421 put(' ');
1d019706d866 LLVM10 anatofuz parents: diff changeset	422 skipBlockComment(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	423 skipOverSpaces(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	424 Last = First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	425 } while (Last != End && !isVerticalWhitespace(*Last));
1d019706d866 LLVM10 anatofuz parents: diff changeset	426
1d019706d866 LLVM10 anatofuz parents: diff changeset	427 // Print out the string.
1d019706d866 LLVM10 anatofuz parents: diff changeset	428 const char *LastBeforeTrailingSpace = findLastNonSpace(First, Last);
1d019706d866 LLVM10 anatofuz parents: diff changeset	429 if (Last == End \|\| LastBeforeTrailingSpace == First \|\|
1d019706d866 LLVM10 anatofuz parents: diff changeset	430 LastBeforeTrailingSpace[-1] != '\\') {
1d019706d866 LLVM10 anatofuz parents: diff changeset	431 append(First, LastBeforeTrailingSpace);
1d019706d866 LLVM10 anatofuz parents: diff changeset	432 First = Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	433 skipNewline(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	434 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	435 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	436
1d019706d866 LLVM10 anatofuz parents: diff changeset	437 // Print up to the backslash, backing up over spaces. Preserve at least one
1d019706d866 LLVM10 anatofuz parents: diff changeset	438 // space, as the space matters when tokens are separated by a line
1d019706d866 LLVM10 anatofuz parents: diff changeset	439 // continuation.
1d019706d866 LLVM10 anatofuz parents: diff changeset	440 append(First, findFirstTrailingSpace(
1d019706d866 LLVM10 anatofuz parents: diff changeset	441 First, LastBeforeTrailingSpace - 1));
1d019706d866 LLVM10 anatofuz parents: diff changeset	442
1d019706d866 LLVM10 anatofuz parents: diff changeset	443 First = Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	444 skipNewline(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	445 skipOverSpaces(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	446 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	447 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	448
1d019706d866 LLVM10 anatofuz parents: diff changeset	449 static void skipWhitespace(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	450 for (;;) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	451 assert(First <= End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	452 skipOverSpaces(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	453
1d019706d866 LLVM10 anatofuz parents: diff changeset	454 if (End - First < 2)
1d019706d866 LLVM10 anatofuz parents: diff changeset	455 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	456
1d019706d866 LLVM10 anatofuz parents: diff changeset	457 if (First[0] == '\\' && isVerticalWhitespace(First[1])) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	458 skipNewline(++First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	459 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	460 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	461
1d019706d866 LLVM10 anatofuz parents: diff changeset	462 // Check for a non-comment character.
1d019706d866 LLVM10 anatofuz parents: diff changeset	463 if (First[0] != '/')
1d019706d866 LLVM10 anatofuz parents: diff changeset	464 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	465
1d019706d866 LLVM10 anatofuz parents: diff changeset	466 // "// ...".
1d019706d866 LLVM10 anatofuz parents: diff changeset	467 if (First[1] == '/') {
1d019706d866 LLVM10 anatofuz parents: diff changeset	468 skipLineComment(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	469 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	470 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	471
1d019706d866 LLVM10 anatofuz parents: diff changeset	472 // Cannot be a comment.
1d019706d866 LLVM10 anatofuz parents: diff changeset	473 if (First[1] != '*')
1d019706d866 LLVM10 anatofuz parents: diff changeset	474 return;
1d019706d866 LLVM10 anatofuz parents: diff changeset	475
1d019706d866 LLVM10 anatofuz parents: diff changeset	476 // "/.../".
1d019706d866 LLVM10 anatofuz parents: diff changeset	477 skipBlockComment(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	478 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	479 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	480
1d019706d866 LLVM10 anatofuz parents: diff changeset	481 void Minimizer::printAdjacentModuleNameParts(const char *&First,
1d019706d866 LLVM10 anatofuz parents: diff changeset	482 const char *const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	483 // Skip over parts of the body.
1d019706d866 LLVM10 anatofuz parents: diff changeset	484 const char *Last = First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	485 do
1d019706d866 LLVM10 anatofuz parents: diff changeset	486 ++Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	487 while (Last != End && (isIdentifierBody(Last) \|\| Last == '.'));
1d019706d866 LLVM10 anatofuz parents: diff changeset	488 append(First, Last);
1d019706d866 LLVM10 anatofuz parents: diff changeset	489 First = Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	490 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	491
1d019706d866 LLVM10 anatofuz parents: diff changeset	492 bool Minimizer::printAtImportBody(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	493 for (;;) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	494 skipWhitespace(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	495 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	496 return true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	497
1d019706d866 LLVM10 anatofuz parents: diff changeset	498 if (isVerticalWhitespace(*First)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	499 skipNewline(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	500 continue;
1d019706d866 LLVM10 anatofuz parents: diff changeset	501 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	502
1d019706d866 LLVM10 anatofuz parents: diff changeset	503 // Found a semicolon.
1d019706d866 LLVM10 anatofuz parents: diff changeset	504 if (*First == ';') {
1d019706d866 LLVM10 anatofuz parents: diff changeset	505 put(*First++).put('\n');
1d019706d866 LLVM10 anatofuz parents: diff changeset	506 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	507 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	508
1d019706d866 LLVM10 anatofuz parents: diff changeset	509 // Don't handle macro expansions inside @import for now.
1d019706d866 LLVM10 anatofuz parents: diff changeset	510 if (!isIdentifierBody(First) && First != '.')
1d019706d866 LLVM10 anatofuz parents: diff changeset	511 return true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	512
1d019706d866 LLVM10 anatofuz parents: diff changeset	513 printAdjacentModuleNameParts(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	514 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	515 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	516
1d019706d866 LLVM10 anatofuz parents: diff changeset	517 void Minimizer::printDirectiveBody(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	518 skipWhitespace(First, End); // Skip initial whitespace.
1d019706d866 LLVM10 anatofuz parents: diff changeset	519 printToNewline(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	520 while (Out.back() == ' ')
1d019706d866 LLVM10 anatofuz parents: diff changeset	521 Out.pop_back();
1d019706d866 LLVM10 anatofuz parents: diff changeset	522 put('\n');
1d019706d866 LLVM10 anatofuz parents: diff changeset	523 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	524
1d019706d866 LLVM10 anatofuz parents: diff changeset	525 LLVM_NODISCARD static const char lexRawIdentifier(const char First,
1d019706d866 LLVM10 anatofuz parents: diff changeset	526 const char *const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	527 assert(isIdentifierBody(*First) && "invalid identifer");
1d019706d866 LLVM10 anatofuz parents: diff changeset	528 const char *Last = First + 1;
1d019706d866 LLVM10 anatofuz parents: diff changeset	529 while (Last != End && isIdentifierBody(*Last))
1d019706d866 LLVM10 anatofuz parents: diff changeset	530 ++Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	531 return Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	532 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	533
1d019706d866 LLVM10 anatofuz parents: diff changeset	534 LLVM_NODISCARD static const char *
1d019706d866 LLVM10 anatofuz parents: diff changeset	535 getIdentifierContinuation(const char First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	536 if (End - First < 3 \|\| First[0] != '\\' \|\| !isVerticalWhitespace(First[1]))
1d019706d866 LLVM10 anatofuz parents: diff changeset	537 return nullptr;
1d019706d866 LLVM10 anatofuz parents: diff changeset	538
1d019706d866 LLVM10 anatofuz parents: diff changeset	539 ++First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	540 skipNewline(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	541 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	542 return nullptr;
1d019706d866 LLVM10 anatofuz parents: diff changeset	543 return isIdentifierBody(First[0]) ? First : nullptr;
1d019706d866 LLVM10 anatofuz parents: diff changeset	544 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	545
1d019706d866 LLVM10 anatofuz parents: diff changeset	546 Minimizer::IdInfo Minimizer::lexIdentifier(const char *First,
1d019706d866 LLVM10 anatofuz parents: diff changeset	547 const char *const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	548 const char *Last = lexRawIdentifier(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	549 const char *Next = getIdentifierContinuation(Last, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	550 if (LLVM_LIKELY(!Next))
1d019706d866 LLVM10 anatofuz parents: diff changeset	551 return IdInfo{Last, StringRef(First, Last - First)};
1d019706d866 LLVM10 anatofuz parents: diff changeset	552
1d019706d866 LLVM10 anatofuz parents: diff changeset	553 // Slow path, where identifiers are split over lines.
1d019706d866 LLVM10 anatofuz parents: diff changeset	554 SmallVector<char, 64> Id(First, Last);
1d019706d866 LLVM10 anatofuz parents: diff changeset	555 while (Next) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	556 Last = lexRawIdentifier(Next, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	557 Id.append(Next, Last);
1d019706d866 LLVM10 anatofuz parents: diff changeset	558 Next = getIdentifierContinuation(Last, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	559 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	560 return IdInfo{
1d019706d866 LLVM10 anatofuz parents: diff changeset	561 Last,
1d019706d866 LLVM10 anatofuz parents: diff changeset	562 SplitIds.try_emplace(StringRef(Id.begin(), Id.size()), 0).first->first()};
1d019706d866 LLVM10 anatofuz parents: diff changeset	563 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	564
1d019706d866 LLVM10 anatofuz parents: diff changeset	565 void Minimizer::printAdjacentMacroArgs(const char *&First,
1d019706d866 LLVM10 anatofuz parents: diff changeset	566 const char *const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	567 // Skip over parts of the body.
1d019706d866 LLVM10 anatofuz parents: diff changeset	568 const char *Last = First;
1d019706d866 LLVM10 anatofuz parents: diff changeset	569 do
1d019706d866 LLVM10 anatofuz parents: diff changeset	570 ++Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	571 while (Last != End &&
1d019706d866 LLVM10 anatofuz parents: diff changeset	572 (isIdentifierBody(Last) \|\| Last == '.' \|\| *Last == ','));
1d019706d866 LLVM10 anatofuz parents: diff changeset	573 append(First, Last);
1d019706d866 LLVM10 anatofuz parents: diff changeset	574 First = Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	575 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	576
1d019706d866 LLVM10 anatofuz parents: diff changeset	577 bool Minimizer::printMacroArgs(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	578 assert(*First == '(');
1d019706d866 LLVM10 anatofuz parents: diff changeset	579 put(*First++);
1d019706d866 LLVM10 anatofuz parents: diff changeset	580 for (;;) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	581 skipWhitespace(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	582 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	583 return true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	584
1d019706d866 LLVM10 anatofuz parents: diff changeset	585 if (*First == ')') {
1d019706d866 LLVM10 anatofuz parents: diff changeset	586 put(*First++);
1d019706d866 LLVM10 anatofuz parents: diff changeset	587 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	588 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	589
1d019706d866 LLVM10 anatofuz parents: diff changeset	590 // This is intentionally fairly liberal.
1d019706d866 LLVM10 anatofuz parents: diff changeset	591 if (!(isIdentifierBody(First) \|\| First == '.' \|\| *First == ','))
1d019706d866 LLVM10 anatofuz parents: diff changeset	592 return true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	593
1d019706d866 LLVM10 anatofuz parents: diff changeset	594 printAdjacentMacroArgs(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	595 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	596 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	597
1d019706d866 LLVM10 anatofuz parents: diff changeset	598 /// Looks for an identifier starting from Last.
1d019706d866 LLVM10 anatofuz parents: diff changeset	599 ///
1d019706d866 LLVM10 anatofuz parents: diff changeset	600 /// Updates "First" to just past the next identifier, if any. Returns true iff
1d019706d866 LLVM10 anatofuz parents: diff changeset	601 /// the identifier matches "Id".
1d019706d866 LLVM10 anatofuz parents: diff changeset	602 bool Minimizer::isNextIdentifier(StringRef Id, const char *&First,
1d019706d866 LLVM10 anatofuz parents: diff changeset	603 const char *const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	604 skipWhitespace(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	605 if (First == End \|\| !isIdentifierHead(*First))
1d019706d866 LLVM10 anatofuz parents: diff changeset	606 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	607
1d019706d866 LLVM10 anatofuz parents: diff changeset	608 IdInfo FoundId = lexIdentifier(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	609 First = FoundId.Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	610 return FoundId.Name == Id;
1d019706d866 LLVM10 anatofuz parents: diff changeset	611 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	612
1d019706d866 LLVM10 anatofuz parents: diff changeset	613 bool Minimizer::lexAt(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	614 // Handle "@import".
1d019706d866 LLVM10 anatofuz parents: diff changeset	615 const char *ImportLoc = First++;
1d019706d866 LLVM10 anatofuz parents: diff changeset	616 if (!isNextIdentifier("import", First, End)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	617 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	618 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	619 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	620 makeToken(decl_at_import);
1d019706d866 LLVM10 anatofuz parents: diff changeset	621 append("@import ");
1d019706d866 LLVM10 anatofuz parents: diff changeset	622 if (printAtImportBody(First, End))
1d019706d866 LLVM10 anatofuz parents: diff changeset	623 return reportError(
1d019706d866 LLVM10 anatofuz parents: diff changeset	624 ImportLoc, diag::err_dep_source_minimizer_missing_sema_after_at_import);
1d019706d866 LLVM10 anatofuz parents: diff changeset	625 skipWhitespace(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	626 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	627 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	628 if (!isVerticalWhitespace(*First))
1d019706d866 LLVM10 anatofuz parents: diff changeset	629 return reportError(
1d019706d866 LLVM10 anatofuz parents: diff changeset	630 ImportLoc, diag::err_dep_source_minimizer_unexpected_tokens_at_import);
1d019706d866 LLVM10 anatofuz parents: diff changeset	631 skipNewline(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	632 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	633 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	634
1d019706d866 LLVM10 anatofuz parents: diff changeset	635 bool Minimizer::lexModule(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	636 IdInfo Id = lexIdentifier(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	637 First = Id.Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	638 bool Export = false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	639 if (Id.Name == "export") {
1d019706d866 LLVM10 anatofuz parents: diff changeset	640 Export = true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	641 skipWhitespace(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	642 if (!isIdentifierBody(*First)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	643 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	644 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	645 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	646 Id = lexIdentifier(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	647 First = Id.Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	648 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	649
1d019706d866 LLVM10 anatofuz parents: diff changeset	650 if (Id.Name != "module" && Id.Name != "import") {
1d019706d866 LLVM10 anatofuz parents: diff changeset	651 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	652 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	653 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	654
1d019706d866 LLVM10 anatofuz parents: diff changeset	655 skipWhitespace(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	656
1d019706d866 LLVM10 anatofuz parents: diff changeset	657 // Ignore this as a module directive if the next character can't be part of
1d019706d866 LLVM10 anatofuz parents: diff changeset	658 // an import.
1d019706d866 LLVM10 anatofuz parents: diff changeset	659
1d019706d866 LLVM10 anatofuz parents: diff changeset	660 switch (*First) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	661 case ':':
1d019706d866 LLVM10 anatofuz parents: diff changeset	662 case '<':
1d019706d866 LLVM10 anatofuz parents: diff changeset	663 case '"':
1d019706d866 LLVM10 anatofuz parents: diff changeset	664 break;
1d019706d866 LLVM10 anatofuz parents: diff changeset	665 default:
1d019706d866 LLVM10 anatofuz parents: diff changeset	666 if (!isIdentifierBody(*First)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	667 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	668 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	669 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	670 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	671
1d019706d866 LLVM10 anatofuz parents: diff changeset	672 if (Export) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	673 makeToken(cxx_export_decl);
1d019706d866 LLVM10 anatofuz parents: diff changeset	674 append("export ");
1d019706d866 LLVM10 anatofuz parents: diff changeset	675 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	676
1d019706d866 LLVM10 anatofuz parents: diff changeset	677 if (Id.Name == "module")
1d019706d866 LLVM10 anatofuz parents: diff changeset	678 makeToken(cxx_module_decl);
1d019706d866 LLVM10 anatofuz parents: diff changeset	679 else
1d019706d866 LLVM10 anatofuz parents: diff changeset	680 makeToken(cxx_import_decl);
1d019706d866 LLVM10 anatofuz parents: diff changeset	681 append(Id.Name);
1d019706d866 LLVM10 anatofuz parents: diff changeset	682 append(" ");
1d019706d866 LLVM10 anatofuz parents: diff changeset	683 printToNewline(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	684 append("\n");
1d019706d866 LLVM10 anatofuz parents: diff changeset	685 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	686 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	687
1d019706d866 LLVM10 anatofuz parents: diff changeset	688 bool Minimizer::lexDefine(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	689 makeToken(pp_define);
1d019706d866 LLVM10 anatofuz parents: diff changeset	690 append("#define ");
1d019706d866 LLVM10 anatofuz parents: diff changeset	691 skipWhitespace(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	692
1d019706d866 LLVM10 anatofuz parents: diff changeset	693 if (!isIdentifierHead(*First))
1d019706d866 LLVM10 anatofuz parents: diff changeset	694 return reportError(First, diag::err_pp_macro_not_identifier);
1d019706d866 LLVM10 anatofuz parents: diff changeset	695
1d019706d866 LLVM10 anatofuz parents: diff changeset	696 IdInfo Id = lexIdentifier(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	697 const char *Last = Id.Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	698 append(Id.Name);
1d019706d866 LLVM10 anatofuz parents: diff changeset	699 if (Last == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	700 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	701 if (*Last == '(') {
1d019706d866 LLVM10 anatofuz parents: diff changeset	702 size_t Size = Out.size();
1d019706d866 LLVM10 anatofuz parents: diff changeset	703 if (printMacroArgs(Last, End)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	704 // Be robust to bad macro arguments, since they can show up in disabled
1d019706d866 LLVM10 anatofuz parents: diff changeset	705 // code.
1d019706d866 LLVM10 anatofuz parents: diff changeset	706 Out.resize(Size);
1d019706d866 LLVM10 anatofuz parents: diff changeset	707 append("(/* invalid */\n");
1d019706d866 LLVM10 anatofuz parents: diff changeset	708 skipLine(Last, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	709 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	710 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	711 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	712 skipWhitespace(Last, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	713 if (Last == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	714 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	715 if (!isVerticalWhitespace(*Last))
1d019706d866 LLVM10 anatofuz parents: diff changeset	716 put(' ');
1d019706d866 LLVM10 anatofuz parents: diff changeset	717 printDirectiveBody(Last, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	718 First = Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	719 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	720 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	721
1d019706d866 LLVM10 anatofuz parents: diff changeset	722 bool Minimizer::lexPragma(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	723 // #pragma.
1d019706d866 LLVM10 anatofuz parents: diff changeset	724 skipWhitespace(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	725 if (First == End \|\| !isIdentifierHead(*First))
1d019706d866 LLVM10 anatofuz parents: diff changeset	726 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	727
1d019706d866 LLVM10 anatofuz parents: diff changeset	728 IdInfo FoundId = lexIdentifier(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	729 First = FoundId.Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	730 if (FoundId.Name == "once") {
1d019706d866 LLVM10 anatofuz parents: diff changeset	731 // #pragma once
1d019706d866 LLVM10 anatofuz parents: diff changeset	732 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	733 makeToken(pp_pragma_once);
1d019706d866 LLVM10 anatofuz parents: diff changeset	734 append("#pragma once\n");
1d019706d866 LLVM10 anatofuz parents: diff changeset	735 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	736 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	737
1d019706d866 LLVM10 anatofuz parents: diff changeset	738 if (FoundId.Name != "clang") {
1d019706d866 LLVM10 anatofuz parents: diff changeset	739 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	740 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	741 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	742
1d019706d866 LLVM10 anatofuz parents: diff changeset	743 // #pragma clang.
1d019706d866 LLVM10 anatofuz parents: diff changeset	744 if (!isNextIdentifier("module", First, End)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	745 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	746 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	747 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	748
1d019706d866 LLVM10 anatofuz parents: diff changeset	749 // #pragma clang module.
1d019706d866 LLVM10 anatofuz parents: diff changeset	750 if (!isNextIdentifier("import", First, End)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	751 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	752 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	753 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	754
1d019706d866 LLVM10 anatofuz parents: diff changeset	755 // #pragma clang module import.
1d019706d866 LLVM10 anatofuz parents: diff changeset	756 makeToken(pp_pragma_import);
1d019706d866 LLVM10 anatofuz parents: diff changeset	757 append("#pragma clang module import ");
1d019706d866 LLVM10 anatofuz parents: diff changeset	758 printDirectiveBody(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	759 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	760 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	761
1d019706d866 LLVM10 anatofuz parents: diff changeset	762 bool Minimizer::lexEndif(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	763 // Strip out "#else" if it's empty.
1d019706d866 LLVM10 anatofuz parents: diff changeset	764 if (top() == pp_else)
1d019706d866 LLVM10 anatofuz parents: diff changeset	765 popToken();
1d019706d866 LLVM10 anatofuz parents: diff changeset	766
1d019706d866 LLVM10 anatofuz parents: diff changeset	767 // If "#ifdef" is empty, strip it and skip the "#endif".
1d019706d866 LLVM10 anatofuz parents: diff changeset	768 //
1d019706d866 LLVM10 anatofuz parents: diff changeset	769 // FIXME: Once/if Clang starts disallowing __has_include in macro expansions,
1d019706d866 LLVM10 anatofuz parents: diff changeset	770 // we can skip empty `#if` and `#elif` blocks as well after scanning for a
1d019706d866 LLVM10 anatofuz parents: diff changeset	771 // literal __has_include in the condition. Even without that rule we could
1d019706d866 LLVM10 anatofuz parents: diff changeset	772 // drop the tokens if we scan for identifiers in the condition and find none.
1d019706d866 LLVM10 anatofuz parents: diff changeset	773 if (top() == pp_ifdef \|\| top() == pp_ifndef) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	774 popToken();
1d019706d866 LLVM10 anatofuz parents: diff changeset	775 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	776 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	777 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	778
1d019706d866 LLVM10 anatofuz parents: diff changeset	779 return lexDefault(pp_endif, "endif", First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	780 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	781
1d019706d866 LLVM10 anatofuz parents: diff changeset	782 bool Minimizer::lexDefault(TokenKind Kind, StringRef Directive,
1d019706d866 LLVM10 anatofuz parents: diff changeset	783 const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	784 makeToken(Kind);
1d019706d866 LLVM10 anatofuz parents: diff changeset	785 put('#').append(Directive).put(' ');
1d019706d866 LLVM10 anatofuz parents: diff changeset	786 printDirectiveBody(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	787 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	788 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	789
1d019706d866 LLVM10 anatofuz parents: diff changeset	790 static bool isStartOfRelevantLine(char First) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	791 switch (First) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	792 case '#':
1d019706d866 LLVM10 anatofuz parents: diff changeset	793 case '@':
1d019706d866 LLVM10 anatofuz parents: diff changeset	794 case 'i':
1d019706d866 LLVM10 anatofuz parents: diff changeset	795 case 'e':
1d019706d866 LLVM10 anatofuz parents: diff changeset	796 case 'm':
1d019706d866 LLVM10 anatofuz parents: diff changeset	797 return true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	798 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	799 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	800 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	801
1d019706d866 LLVM10 anatofuz parents: diff changeset	802 bool Minimizer::lexPPLine(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	803 assert(First != End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	804
1d019706d866 LLVM10 anatofuz parents: diff changeset	805 skipWhitespace(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	806 assert(First <= End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	807 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	808 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	809
1d019706d866 LLVM10 anatofuz parents: diff changeset	810 if (!isStartOfRelevantLine(*First)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	811 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	812 assert(First <= End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	813 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	814 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	815
1d019706d866 LLVM10 anatofuz parents: diff changeset	816 // Handle "@import".
1d019706d866 LLVM10 anatofuz parents: diff changeset	817 if (*First == '@')
1d019706d866 LLVM10 anatofuz parents: diff changeset	818 return lexAt(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	819
1d019706d866 LLVM10 anatofuz parents: diff changeset	820 if (First == 'i' \|\| First == 'e' \|\| *First == 'm')
1d019706d866 LLVM10 anatofuz parents: diff changeset	821 return lexModule(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	822
1d019706d866 LLVM10 anatofuz parents: diff changeset	823 // Handle preprocessing directives.
1d019706d866 LLVM10 anatofuz parents: diff changeset	824 ++First; // Skip over '#'.
1d019706d866 LLVM10 anatofuz parents: diff changeset	825 skipWhitespace(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	826
1d019706d866 LLVM10 anatofuz parents: diff changeset	827 if (First == End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	828 return reportError(First, diag::err_pp_expected_eol);
1d019706d866 LLVM10 anatofuz parents: diff changeset	829
1d019706d866 LLVM10 anatofuz parents: diff changeset	830 if (!isIdentifierHead(*First)) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	831 skipLine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	832 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	833 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	834
1d019706d866 LLVM10 anatofuz parents: diff changeset	835 // Figure out the token.
1d019706d866 LLVM10 anatofuz parents: diff changeset	836 IdInfo Id = lexIdentifier(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	837 First = Id.Last;
1d019706d866 LLVM10 anatofuz parents: diff changeset	838 auto Kind = llvm::StringSwitch<TokenKind>(Id.Name)
1d019706d866 LLVM10 anatofuz parents: diff changeset	839 .Case("include", pp_include)
1d019706d866 LLVM10 anatofuz parents: diff changeset	840 .Case("__include_macros", pp___include_macros)
1d019706d866 LLVM10 anatofuz parents: diff changeset	841 .Case("define", pp_define)
1d019706d866 LLVM10 anatofuz parents: diff changeset	842 .Case("undef", pp_undef)
1d019706d866 LLVM10 anatofuz parents: diff changeset	843 .Case("import", pp_import)
1d019706d866 LLVM10 anatofuz parents: diff changeset	844 .Case("include_next", pp_include_next)
1d019706d866 LLVM10 anatofuz parents: diff changeset	845 .Case("if", pp_if)
1d019706d866 LLVM10 anatofuz parents: diff changeset	846 .Case("ifdef", pp_ifdef)
1d019706d866 LLVM10 anatofuz parents: diff changeset	847 .Case("ifndef", pp_ifndef)
1d019706d866 LLVM10 anatofuz parents: diff changeset	848 .Case("elif", pp_elif)
1d019706d866 LLVM10 anatofuz parents: diff changeset	849 .Case("else", pp_else)
1d019706d866 LLVM10 anatofuz parents: diff changeset	850 .Case("endif", pp_endif)
1d019706d866 LLVM10 anatofuz parents: diff changeset	851 .Case("pragma", pp_pragma_import)
1d019706d866 LLVM10 anatofuz parents: diff changeset	852 .Default(pp_none);
1d019706d866 LLVM10 anatofuz parents: diff changeset	853 if (Kind == pp_none) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	854 skipDirective(Id.Name, First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	855 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	856 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	857
1d019706d866 LLVM10 anatofuz parents: diff changeset	858 if (Kind == pp_endif)
1d019706d866 LLVM10 anatofuz parents: diff changeset	859 return lexEndif(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	860
1d019706d866 LLVM10 anatofuz parents: diff changeset	861 if (Kind == pp_define)
1d019706d866 LLVM10 anatofuz parents: diff changeset	862 return lexDefine(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	863
1d019706d866 LLVM10 anatofuz parents: diff changeset	864 if (Kind == pp_pragma_import)
1d019706d866 LLVM10 anatofuz parents: diff changeset	865 return lexPragma(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	866
1d019706d866 LLVM10 anatofuz parents: diff changeset	867 // Everything else.
1d019706d866 LLVM10 anatofuz parents: diff changeset	868 return lexDefault(Kind, Id.Name, First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	869 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	870
1d019706d866 LLVM10 anatofuz parents: diff changeset	871 static void skipUTF8ByteOrderMark(const char &First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	872 if ((End - First) >= 3 && First[0] == '\xef' && First[1] == '\xbb' &&
1d019706d866 LLVM10 anatofuz parents: diff changeset	873 First[2] == '\xbf')
1d019706d866 LLVM10 anatofuz parents: diff changeset	874 First += 3;
1d019706d866 LLVM10 anatofuz parents: diff changeset	875 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	876
1d019706d866 LLVM10 anatofuz parents: diff changeset	877 bool Minimizer::minimizeImpl(const char First, const char const End) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	878 skipUTF8ByteOrderMark(First, End);
1d019706d866 LLVM10 anatofuz parents: diff changeset	879 while (First != End)
1d019706d866 LLVM10 anatofuz parents: diff changeset	880 if (lexPPLine(First, End))
1d019706d866 LLVM10 anatofuz parents: diff changeset	881 return true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	882 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	883 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	884
1d019706d866 LLVM10 anatofuz parents: diff changeset	885 bool Minimizer::minimize() {
1d019706d866 LLVM10 anatofuz parents: diff changeset	886 bool Error = minimizeImpl(Input.begin(), Input.end());
1d019706d866 LLVM10 anatofuz parents: diff changeset	887
1d019706d866 LLVM10 anatofuz parents: diff changeset	888 if (!Error) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	889 // Add a trailing newline and an EOF on success.
1d019706d866 LLVM10 anatofuz parents: diff changeset	890 if (!Out.empty() && Out.back() != '\n')
1d019706d866 LLVM10 anatofuz parents: diff changeset	891 Out.push_back('\n');
1d019706d866 LLVM10 anatofuz parents: diff changeset	892 makeToken(pp_eof);
1d019706d866 LLVM10 anatofuz parents: diff changeset	893 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	894
1d019706d866 LLVM10 anatofuz parents: diff changeset	895 // Null-terminate the output. This way the memory buffer that's passed to
1d019706d866 LLVM10 anatofuz parents: diff changeset	896 // Clang will not have to worry about the terminating '\0'.
1d019706d866 LLVM10 anatofuz parents: diff changeset	897 Out.push_back(0);
1d019706d866 LLVM10 anatofuz parents: diff changeset	898 Out.pop_back();
1d019706d866 LLVM10 anatofuz parents: diff changeset	899 return Error;
1d019706d866 LLVM10 anatofuz parents: diff changeset	900 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	901
1d019706d866 LLVM10 anatofuz parents: diff changeset	902 bool clang::minimize_source_to_dependency_directives::computeSkippedRanges(
1d019706d866 LLVM10 anatofuz parents: diff changeset	903 ArrayRef<Token> Input, llvm::SmallVectorImpl<SkippedRange> &Range) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	904 struct Directive {
1d019706d866 LLVM10 anatofuz parents: diff changeset	905 enum DirectiveKind {
1d019706d866 LLVM10 anatofuz parents: diff changeset	906 If, // if/ifdef/ifndef
1d019706d866 LLVM10 anatofuz parents: diff changeset	907 Else // elif,else
1d019706d866 LLVM10 anatofuz parents: diff changeset	908 };
1d019706d866 LLVM10 anatofuz parents: diff changeset	909 int Offset;
1d019706d866 LLVM10 anatofuz parents: diff changeset	910 DirectiveKind Kind;
1d019706d866 LLVM10 anatofuz parents: diff changeset	911 };
1d019706d866 LLVM10 anatofuz parents: diff changeset	912 llvm::SmallVector<Directive, 32> Offsets;
1d019706d866 LLVM10 anatofuz parents: diff changeset	913 for (const Token &T : Input) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	914 switch (T.K) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	915 case pp_if:
1d019706d866 LLVM10 anatofuz parents: diff changeset	916 case pp_ifdef:
1d019706d866 LLVM10 anatofuz parents: diff changeset	917 case pp_ifndef:
1d019706d866 LLVM10 anatofuz parents: diff changeset	918 Offsets.push_back({T.Offset, Directive::If});
1d019706d866 LLVM10 anatofuz parents: diff changeset	919 break;
1d019706d866 LLVM10 anatofuz parents: diff changeset	920
1d019706d866 LLVM10 anatofuz parents: diff changeset	921 case pp_elif:
1d019706d866 LLVM10 anatofuz parents: diff changeset	922 case pp_else: {
1d019706d866 LLVM10 anatofuz parents: diff changeset	923 if (Offsets.empty())
1d019706d866 LLVM10 anatofuz parents: diff changeset	924 return true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	925 int PreviousOffset = Offsets.back().Offset;
1d019706d866 LLVM10 anatofuz parents: diff changeset	926 Range.push_back({PreviousOffset, T.Offset - PreviousOffset});
1d019706d866 LLVM10 anatofuz parents: diff changeset	927 Offsets.push_back({T.Offset, Directive::Else});
1d019706d866 LLVM10 anatofuz parents: diff changeset	928 break;
1d019706d866 LLVM10 anatofuz parents: diff changeset	929 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	930
1d019706d866 LLVM10 anatofuz parents: diff changeset	931 case pp_endif: {
1d019706d866 LLVM10 anatofuz parents: diff changeset	932 if (Offsets.empty())
1d019706d866 LLVM10 anatofuz parents: diff changeset	933 return true;
1d019706d866 LLVM10 anatofuz parents: diff changeset	934 int PreviousOffset = Offsets.back().Offset;
1d019706d866 LLVM10 anatofuz parents: diff changeset	935 Range.push_back({PreviousOffset, T.Offset - PreviousOffset});
1d019706d866 LLVM10 anatofuz parents: diff changeset	936 do {
1d019706d866 LLVM10 anatofuz parents: diff changeset	937 Directive::DirectiveKind Kind = Offsets.pop_back_val().Kind;
1d019706d866 LLVM10 anatofuz parents: diff changeset	938 if (Kind == Directive::If)
1d019706d866 LLVM10 anatofuz parents: diff changeset	939 break;
1d019706d866 LLVM10 anatofuz parents: diff changeset	940 } while (!Offsets.empty());
1d019706d866 LLVM10 anatofuz parents: diff changeset	941 break;
1d019706d866 LLVM10 anatofuz parents: diff changeset	942 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	943 default:
1d019706d866 LLVM10 anatofuz parents: diff changeset	944 break;
1d019706d866 LLVM10 anatofuz parents: diff changeset	945 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	946 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	947 return false;
1d019706d866 LLVM10 anatofuz parents: diff changeset	948 }
1d019706d866 LLVM10 anatofuz parents: diff changeset	949
1d019706d866 LLVM10 anatofuz parents: diff changeset	950 bool clang::minimizeSourceToDependencyDirectives(
1d019706d866 LLVM10 anatofuz parents: diff changeset	951 StringRef Input, SmallVectorImpl<char> &Output,
1d019706d866 LLVM10 anatofuz parents: diff changeset	952 SmallVectorImpl<Token> &Tokens, DiagnosticsEngine *Diags,
1d019706d866 LLVM10 anatofuz parents: diff changeset	953 SourceLocation InputSourceLoc) {
1d019706d866 LLVM10 anatofuz parents: diff changeset	954 Output.clear();
1d019706d866 LLVM10 anatofuz parents: diff changeset	955 Tokens.clear();
1d019706d866 LLVM10 anatofuz parents: diff changeset	956 return Minimizer(Output, Tokens, Input, Diags, InputSourceLoc).minimize();
1d019706d866 LLVM10 anatofuz parents: diff changeset	957 }

Mercurial > hg > CbC > CbC_llvm

annotate clang/lib/Lex/DependencyDirectivesSourceMinimizer.cpp @ 176:de4ac79aef9d