Как анализировать / извлекать данные из размеченной статьи в MediaWiki через Python

Исходная разметка Mediawiki

Прямо сейчас я использую множество регулярных выражений для «разбора» данных в разметке MediaWiki на списки / словари, чтобы можно было использовать элементы в статье.

Это едва ли не лучший метод, так как число дел, которые нужно сделать, велико.

Как можно было бы разобрать разметку MediaWiki статьи на множество объектов Python, чтобы можно было использовать данные внутри?

Примером является:

Извлеките все заголовки в словарь, хэшируя его с разделом.Возьмите все ссылки на вики и вставьте их в список (я знаю,
это можно сделать из API, но я бы предпочел иметь только один вызов API для
уменьшить использование полосы пропускания).Извлеките все имена изображений и добавьте их в разделы

Разнообразные регулярные выражения могут достичь вышеупомянутого, но я считаю, что число, которое я должен сделать, довольно большое.

ВотMediaWiki неофициальная спецификация (Я не нахожу их официальныйСпецификация как полезно).

Ответы на вопрос(4)

Ваш ответ на вопрос