Resultados de la búsqueda a petición "html-parsing"

2 la respuesta

Parse tabla html usando file_get_contents para php array

Estoy intentando analizar la tabla que se muestraaqu [http://flow935.com/playlist/flowhis.HTM] en una matriz php multidimensional. Estoy usando el siguiente código, pero por alguna razón está devolviendo una matriz vacía. Después de buscar en la ...

1 la respuesta

BeautifulSoup - extraer json de JS

Estoy jugando con BeautilfulSoup y estoy buscando una manera de obtener una cadena json específica dentro de un elemento JS. Aquí está el JS: <script>window.pinball = window.pinball || []; ...

5 la respuesta

Ventajas de XSLT o Linq a XML

¿Qué ventajas hay para usar XSLT o Linq a XML para el análisis de HTML en C #? Esto es bajo el supuesto de que el html se ha limpiado por lo que es un xhtml ...

4 la respuesta

¿Cómo puedo usar la biblioteca HTMLParser de python para extraer datos de una etiqueta div específica?

Estoy tratando de obtener un valor de una página HTML usando la biblioteca python HTMLParser. El valor que quiero obtener está dentro de este elemento html: ... <div id="remository">20</div> ...Esta es mi clase HTMLParser hasta ahora: class ...

1 la respuesta

Web scraping un sitio web con contenido dinámico de JavaScript

Así que estoy usando python y beautifulsoup4 (al que no estoy vinculado) para raspar un sitio web. El problema es que cuando uso urlib para tomar el html de una página, no es toda la página porque parte se genera a través de JavaScript. ¿Hay ...

4 la respuesta

Simple html dom file_get_html no funciona, ¿hay alguna solución?

2 la respuesta

Obtenga todos los elementos por nombre de clase usando DOMDocument

Esta pregunta parece haber sido respondida varias veces, pero todavía no puedo juntar las piezas.Me gustaría obtener el valor de nodo de cada clase por nombr...

6 la respuesta

Parsing HTML en Python [cerrado]

¿Cuál es mi mejor opción para analizar HTML si no puedo usar BeautifulSoup o lxml? Tengo un código que usa SGMLlib pero es un poco bajo y ahora está en desuso. Preferiría que sufriera un poco de HTML con formato incorrecto, aunque ...

2 la respuesta

La mejor manera de guardar mediante programación una página web en un archivo HTML estático

Mientras más investigación hago, más sombría es la perspectiva.Estoy intentando hacer Flat Save, o Static Save una página web con Python. Esto significa fusi...

7 la respuesta

Sintaxis de expresiones regulares de orden variable

¿Hay alguna forma de indicar que dos o más frases de expresión regular pueden aparecer en cualquier orden? Por ejemplo, los atributos XML se pueden escribir en cualquier orden. Digamos que tengo el siguiente XML: <a href="home.php" class="link" ...