Как извлечь номера строк, которые соответствуют регулярному выражению в текстовом файле
Я делаю проект по статистическому машинному переводу, в котором мне нужно извлечь номера строк из текстового файла с тегами POS, которые соответствуют регулярному выражению (любой неразделенный фразовый глагол с частицей 'out'), и записать номера строк в файл (в Python).
У меня есть это регулярное выражение: '\ w * _VB.? \ Sout_RP' и мой текстовый файл с тегами POS: 'Corpus.txt'. Я хотел бы получить выходной файл с номерами строк, которые соответствуют вышеупомянутому регулярному выражению, и выходной файл должен иметь только один номер строки на строку (без пустых строк), например:
2
5
44
Пока что все, что у меня есть в моем сценарии:
OutputLineNumbers = open('OutputLineNumbers', 'w')
with open('Corpus.txt', 'r') as textfile:
phrase='\w*_VB.?\sout_RP'
for phrase in textfile:
OutputLineNumbers.close()
Есть идеи, как решить эту проблему?
Заранее спасибо за помощь!