Правило приоритета вопроса с грако
Я переделываю мини-язык, который я изначально построил на Perl (см.Chessa # на GitHub), но я сталкиваюсь с рядом проблем, когда применяю семантику.
(* integers *)
DEC = /([1-9][0-9]*|0+)/;
int = /(0b[01]+|0o[0-7]+|0x[0-9a-fA-F]+)/ | DEC;
(* floats *)
pointfloat = /([0-9]*\.[0-9]+|[0-9]+\.)/;
expfloat = /([0-9]+\.?|[0-9]*\.)[eE][+-]?[0-9]+/;
float = pointfloat | expfloat;
list = '[' @+:atom {',' @+:atom}* ']';
(* atoms *)
identifier = /[_a-zA-Z][_a-zA-Z0-9]*/;
symbol = int |
float |
identifier |
list;
(* functions *)
arglist = @+:atom {',' @+:atom}*;
function = identifier '(' [arglist] ')';
atom = function | symbol;
prec8 = '(' atom ')' | atom;
prec7 = [('+' | '-' | '~')] prec8;
prec6 = prec7 ['!'];
prec5 = [prec6 '**'] prec6;
prec4 = [prec5 ('*' | '/' | '%' | 'd')] prec5;
prec3 = [prec4 ('+' | '-')] prec4;
(* <| and >| are rotate-left and rotate-right, respectively. They assume the nearest C size. *)
prec2 = [prec3 ('<<' | '>>' | '<|' | '>|')] prec3;
prec1 = [prec2 ('&' | '|' | '^')] prec2;
expr = prec1 $;
Проблема, с которой я сталкиваюсь, заключается в том, чтоd
оператор втягивается в правило идентификатора, когда между оператором и любыми последующими буквенно-цифровыми строками нет пробелов. Хотя сама грамматика LL (2), я не понимаю, в чем здесь проблема.
Например,4d6
останавливает анализатор, потому что он интерпретируется как4
d6
, гдеd6
это идентификатор. Что должно произойти, это то, что это интерпретируется как4
d
6
сd
будучи оператором. В парсере LL это действительно так.
Возможное решение было бы запретитьd
от начала идентификатора, но это будет запрещать такие функции, какdrop
быть названным таковым.