Извлечение строки из любого недвоичного файла независимо от его расположения в файле
Хорошо, вот проблема, с которой я безуспешно пытался справиться, написав пакетный скрипт. Предположим, у меня есть файл, содержащий, скажем, некоторые адреса YouTube (например, HTML-файл со ссылками на страницы YouTube).
Содержимое файла может выглядеть так:
Blaaaa blaa
blaa blaa blaa <a href=https://www.youtube.com/watch?v=9bZkp7q19f0>Gangnam1</a> blaaa blaa
<a href=https://www.youtube.com/watch?v=kYtGl1dX5qI&list=RD9bZkp7q19f0>Scream and shout</a> blaa blaa
blaaaaa <a href=https://www.youtube.com/watch?v=lWA2pjMjpBs&list=RD9bZkp7q19f0>Diamonds</a> blaa
blaa bla bla
Строки будут найдены с использованием маски символа подстановки, например так:
https://www.youtube.com/watch\?v=*>
(или что-то в этом роде)
И вывод, сохраненный в другом файле, должен выглядеть следующим образом:
https://www.youtube.com/watch?v=9bZkp7q19f0>
https://www.youtube.com/watch?v=kYtGl1dX5qI&list=RD9bZkp7q19f0>
https://www.youtube.com/watch?v=lWA2pjMjpBs&list=RD9bZkp7q19f0>
Поиск может, конечно, касаться и других строк, не только связанных с YouTube.
Простые команды, такие как FIND или FINDSTR, использовать нельзя, так как они возвращают всю строку, содержащую строку. Точно так же, FOR с токенами и разделителями, кажется, здесь не очень полезен, так как искомые строки разбросаны нерегулярно по всему файлу, иногда несколько в одной строке.
Я действительно не знаю, как решить эту проблему. Это может показаться простым, но я никогда не находил сценарий или программу, которая выдала бы такой вывод. Возможно, даже существует готовая, скомпилированная программа для этого. Я буду многим должен за любую помощь.