Написание парсера для регулярных выражений

Даже после многих лет программирования мне стыдно сказать, что я никогда не понимал регулярные выражения. В общем, когда проблема требует регулярного выражения, я обычно (после множества ссылок на синтаксис) могу найти подходящий, но я все чаще использую эту технику.

Итак, чтобы научить себя и понимать регулярные выражениядолжным образомЯ решил делать то, что всегда делаю, когда пытаюсь чему-то научиться; то есть, попытайтесь написать что-то амбициозное, от которого я, вероятно, откажусь, как только почувствую, что достаточно выучил.

Для этого я хочу написать синтаксический анализатор регулярных выражений в Python. В этом случае «достаточно выучить» означает, что я хочу реализовать синтаксический анализатор, который может полностью понимать расширенный синтаксис регулярных выражений Perl. Тем не менее, он не должен быть самым эффективным парсером или даже обязательно используемым в реальном мире. Он просто должен правильно соответствовать или не соответствовать шаблону в строке.

Вопрос в том, с чего мне начать? Я почти ничего не знаю о том, как регулярные выражения анализируются и интерпретируются, за исключением того факта, что они каким-то образом связаны с конечным автоматом. Будем весьма благодарны за любые предложения о том, как подойти к этой довольно сложной проблеме.

РЕДАКТИРОВАТЬ: Я должен уточнить, что пока я собираюсьвоплощать в жизнь синтаксический анализатор регулярных выражений в Python, я не слишком беспокоюсь о том, на каком языке программирования написаны примеры или статьи. Пока он не в Brainfuck, я, вероятно, пойму его достаточно, чтобы оно того стоило.

Ответы на вопрос(5)

Ваш ответ на вопрос