Resultados de la búsqueda a petición "html-parsing"

1 la respuesta

No es posible raspar datos

Acabo de comenzar en Google Apps Script. Dado que las mejores prácticas de codificación recomiendan utilizar la menor cantidad posible de fórmulas de hoja, estoy tratando de hacer mi raspado web con GAS Parser y luego enviar los datos a mi hoja ...

1 la respuesta

Error en la línea 1: el contenido no está permitido en prolog

stoy tratando de extraer una tabla de datos de precios de estasitio we [https://stooq.com/q/d/?s=barc.uk&i=d] utilizando el siguiente código; function scrapeData() { // Retrieve table as a string using Parser. var url ...

3 la respuesta

Lectura desde una conexión URL Java

Estoy tratando de leer el código html de una conexión URL. En un caso, el archivo html que intento leer incluye 5 saltos de línea antes de la declaración de tipo de documento real. En este caso, el lector de entrada lanza una excepción para ...

1 la respuesta

xpath find node que no contiene child

Estoy tratando de crear un xpath que encuentre todoa etiquetas que no contienenimg etiquetas, de modo que algo como <a href="http://aol.com">link</a> coincidencias, pero <a href="http://yahoo.com"><img src="http://yahoo.com/logo.png"></a>no ...

5 la respuesta

¿Cómo leer HTML como XML?

Quiero extraer un par de enlaces de una página html descargada de Internet, creo que usar linq to XML sería una buena solución para mi caso. Mi problema es que no puedo crear un XmlDocument a partir del HTML, usar Load (string url) no funcionó, ...

4 la respuesta

¿Eliminar todas las etiquetas HTML vacías?

Estoy imaginando una función que imagino usaría Regex, y sería recursiva para instancias como<p><strong></strong></p> para eliminar todas las etiquetas HTML vacías dentro de una cadena. Esto tendría que tener en cuenta los espacios en blanco si ...

2 la respuesta

Parsing HTML: ¿cómo obtener un número de una etiqueta?

Estoy desarrollando una aplicación de Windows Forms que está interactuando con un sitio web. Usando unWebBrowser control Estoy controlando el sitio web y puedo recorrer las etiquetas usando: HtmlDocument webDoc1 = this.webBrowser1.Document; ...

1 la respuesta

HTML Agility Pack Parsing con mayúsculas y minúsculas?

Estoy usando el paquete de agilidad HTML con gran efecto, y estoy realmente impresionado con él. Sin embargo, estoy seleccionando el contenido de esta manera doc.DocumentNode.SelectSingleNode("//body").InnerHtml ¿Cómo lidiar con la siguiente ...

5 la respuesta

¿Cómo minimizar el código HTML?

Mi idea esde alguna maner minifique el código HTML en el lado del servidor, para que el cliente reciba menos bytes. ¿A qué me refiero con "minify"? Sin cremallera. Más como, por ejemplo, los creadores de jQuery hacen con .min .js versiones. ...

2 la respuesta

Raspado web (en R?)

Quiero obtener los nombres de las empresas en la columna central deest [http://www.consumercomplaints.in/bysubcategory/mobile-service-providers/page/1.html] página (escrita en negrita en azul), así como el indicador de ubicación de la persona ...