DOM php usuń wszystkie znaczniki według nazwy znacznika
Mam problem ze skryptem, którego używam od jakiegoś czasu i działał dla mnie, dopóki nie trafiłem na ten problem.
Mam skrypt, z którego chciałbym usunąć wszystkie znaczniki html z kodu źródłowego HTML. Skrypt działa częściowo dlatego, że usuwa tylko niektóre tagi p, ale pozostawia niektóre z nich.
Nie rozumiem, dlaczego to robi.
$doc = new DOMDocument();
$a = <<<FAIL
<html><body>
<div style="clear:both"></div>
<p class="articletitle">hoo</p>
<p class="articletext">hmmm</p>
<p class="articletext">hmmmm</p>
<p align="center"></p>
</body></html>
FAIL;
$doc->loadHTML($a);
$list = $doc->getElementsByTagName("p");
foreach ($list as $l) {
$l->parentNode->removeChild($l);
$c++;
}
echo $doc->saveHTML() . $c;
skrypt powraca
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html><body>
<div style="clear:both"></div>
<p class="articletext">hmmm</p>
<p align="center"></p>
pomijając dwa tagi p ...
Czy możesz mi pomóc dowiedzieć się, dlaczego pomija niektóre tagi