Module: ORB::Patterns

Included in:: Tokenizer2

Defined in:: lib/orb/patterns.rb

Constant Summary collapse

SPACE_CHARS =

/\s/

TAG_NAME =

%r{[^\s>/=$]+}

ATTRIBUTE_NAME =

/[a-zA-Z_:@][-a-zA-Z0-9_:.]*/

UNQUOTED_VALUE_INVALID_CHARS =

/["'=<`]/

UNQUOTED_VALUE =

%r{[^\s/>]+}

BLOCK_NAME_CHARS =

/[^\s}]+/

START_TAG_START =

/</

START_TAG_END =

/>/

START_TAG_END_SELF_CLOSING =

%r{/>}

START_TAG_END_VERBATIM =

/\$>/

END_TAG_START =

%r{</}

END_TAG_END =

/>/

END_TAG_END_VERBATIM =

/\$>/

PUBLIC_COMMENT_START =

/<!--/

PUBLIC_COMMENT_END =

/-->/

PRIVATE_COMMENT_START =

/{!--/

PRIVATE_COMMENT_END =

/--}/

PRINTING_EXPRESSION_START =

/{{ */

PRINTING_EXPRESSION_END =

/ *}}/

CONTROL_EXPRESSION_START =

/{% */

CONTROL_EXPRESSION_END =

/ *%}/

BLOCK_OPEN =

/{#/

BLOCK_CLOSE =

%r[{/]

ATTRIBUTE_ASSIGN =

/=/

SINGLE_QUOTE =

/'/

DOUBLE_QUOTE =

/"/

SPLAT_ATTRIBUTE =

%r{\*[^\s>/=]+}

SPLAT_EXPRESSION_START =

/\*\*\{/

BRACE_OPEN =

/\{/

BRACE_CLOSE =

/\}/

CR =

/\r/

NEWLINE =

/\n/

CRLF =

/\r\n/

BLANK =

/[[:blank:]]/

OTHER =

/./

INITIAL_TEXT = Greedy multi-character patterns for bulk scanning in each tokenizer state. Each pattern excludes only the characters that could start a delimiter in that state, so the tokenizer consumes runs of “boring” text in one match instead of character-by-character.

/[^\n\r{<]+/

EXPRESSION_TEXT =

/[^\n\r{}]+/

COMMENT_TEXT =

/[^\n\r-]+/

VERBATIM_TEXT =

/[^\n\r<]+/

SINGLE_QUOTED_TEXT =

/[^\n\r']+/

DOUBLE_QUOTED_TEXT =

/[^\n\r"]+/

BLOCK_CONTENT_TEXT =

/[^{}\n\r]+/