XML a pandas dataframe
Tengo un archivo XML con miles de líneas como:
<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word>
Quiero convertirlo (todos sus atributos) apandas
dataframe
. Para hacer eso, pude recorrer el archivo usando una hermosa sopa e insertar los valores fila por fila o crear listas para insertarlas como columnas. Sin embargo, me gustaría saber si hay una forma más pitónica de lograr lo que describí. Gracias de antemano.
Ejemplo de código:
x1list=[]
x2list=[]
for word in soup.page.findAll('word'):
x1list.append(int(word['x1']))
x2list.append(int(word['x2']))
df=DataFrame({'x1':x1list,'x2':x2list})