Jak użyć lxml, aby znaleźć element według tekstu?
Załóżmy, że mamy następujący html:
<html>
<body>
<a href="/1234.html">TEXT A</a>
<a href="/3243.html">TEXT B</a>
<a href="/7445.html">TEXT C</a>
<body>
</html>
Jak sprawić, by znalazł element „a”, który zawiera „TEKST A”?
Do tej pory mam:
root = lxml.hmtl.document_fromstring(the_html_above)
e = root.find('.//a')
Próbowałem:
e = root.find('.//a[@text="TEXT A"]')
ale to nie zadziałało, ponieważ tagi „a” nie mają atrybutu „tekst”.
Czy jest jakiś sposób, aby rozwiązać ten problem w sposób podobny do tego, co próbowałem?