Регулярное выражение для замены «экранированных» символов их оригиналами
ПРИМЕЧАНИЕ: яя не разбираю много или HTML или общий HTML с регулярным выражением. Я знаю это'плохо
TL; DR:
У меня есть такие строки, как
A sentence with an exclamation\! Next is a \* character
Где естьубежали» символы в исходной разметке. Я хочу заменить их на своиоригиналы», И получить:
A sentence with an exclamation! Next is a * character
У меня есть небольшие данные, которые мне нужно извлечь из некоторой вики-разметки.
Я имею дело только с параграфами / фрагментами здесь, поэтому я нене нужно большое надежное решение. В Python я попробовал тест:
s = "test \\* \\! test * !! **"
r = re.compile("""\\.""") # Slash followed by anything
r.sub("-", s)
Это ДОЛЖНО дать
test - - test * !! **
Но это неничего не делай. Я что-то здесь упускаю?
Кроме того, яЯ не уверен, как идти о замене любого данного экранированного символа его оригиналом, поэтому я, вероятно, просто сделал бы список и подпрограмму с определенными регулярными выражениями, такими как:
\\\*
а также
\\!
Там'Вероятно, это намного более чистый способ сделать это, поэтому любая помощь будет принята с благодарностью.