Como abrir o arquivo XML para criar dataframe em Python?
Alguém tem uma sugestão para a melhor maneira de abrir os dados xml no site abaixo para colocá-los em um dataframe (eu prefiro trabalhar com pandas) em python? O arquivo está no link "Dados - XML (sdmx / zip)" neste site:
http://www.federalreserve.gov/pubs/feds/2006/200628/200628abs.html
Tentei usar o seguinte, copiando dehttp://timhomelab.blogspot.com/2014/01/how-to-read-xml-file-into-dataframe.html, e parece que estou chegando perto:
from lxml import objectify
import pandas as pd
path = 'feds200628.xml'
xml = objectify.parse(open(path))
root = xml.getroot()
root.getchildren()[0].getchildren()
df = pd.DataFrame(columns=('id', 'name'))
for i in range(0,4):
obj = root.getchildren()[i].getchildren()
row = dict(zip(['id', 'name'], [obj[0].text, obj[1].text]))
row_s = pd.Series(row)
row_s.name = i
df = df.append(row_s)
Ainda assim, eu não sei o suficiente sobre xml para me levar pelo resto do caminho.
Qualquer ajuda seria incrível - eu nemnecessidade para estar em um dataframe, eu só preciso descobrir como analisar esse conteúdo em python de alguma forma.