Нумерация предложений внутри <P> в XML-файле?
я начинающий программист и яЯ застрял в этой, возможно, простой проблеме: я хочу автоматически добавлять числа к предложениям, содержащимся в тегах P файла .xml. Таким образом, пример абзаца в файле .xml выглядит следующим образом:
<p>Sentence1. Sentence2. Sentence3.</p>
Я хочу преобразовать это в:
<p>1Sentence1.2 Sentence2.3 Sentence3.</p>
Однако должны быть пронумерованы только теги P, содержащие как минимум 2 предложения, если они содержат только 1 предложение, я хочу оставить его без изменений.
Вот подход, который я до сих пор предлагал, используя регулярные выражения:
\.\s.* # Reliably finds the second sentence, Insert 2 after it.
[^>]*2 # Finds the beginning of the first sentence if a second sentence exists.
Однако я чувствую, что это действительно неловкий подход, который я бы нея действительно знаю, как расширить абзацы, содержащие 20 или более предложений, или XML-документы, содержащие много абзацев. Есть ли лучшее регулярное выражение для достижения этого или лучший (Python) инструмент, чем регулярные выражения?