Selen - Holen Sie sich Elemente HTML statt Text Value
Über diesen Code habe ich den gewünschten Text aus einem HTML-Dokument extrahiert
private void RunThroughSearch(string url)
{
private IWebDriver driver;
driver = new FirefoxDriver();
INavigation nav = driver.Navigate();
nav.GoToUrl(url);
var div = driver.FindElement(By.Id("results"));
var element = driver.FindElements(By.ClassName("sa_wr"));
}
Allerdings muss ich die Ergebnisse des extrahierten Dokuments verfeinern
Container
HEADER -> Title of a given block
Url -> Link to the relevant block
text -> body of a given block
/Container
Wie Sie in meinem Code sehen können, bin ich in der Lage, den Wert des Textteils als Textwert zu erhalten, das war in Ordnung, aber was ist, wenn ich den Wert des Containers als haben möchteHTML und nicht der extrahierte text?
<div class="container">
<div class="Header"> Title...</div>
<div class="Url"> www.example.co.il</div>
<div class="ResConent"> bla.. </div>
</div>
Also ist der Container ungefähr 10 Mal in einer Seite, die ich brauche, um es innerHtml zu extrahieren.
irgendwelche Ideen ? (mit Selen)