BeautifulSoup, словарь из таблицы HTML

Question

Aug 14, 2014, 12:45 PM

BeautifulSoup, словарь из таблицы HTML

Я пытаюсь очистить таблицу данных с веб-сайта.

Вот простой пример таблицы:

t = '<html><table>' +\
    '<tr><td class="label"> a </td> <td> 1 </td></tr>' +\
    '<tr><td class="label"> b </td> <td> 2 </td></tr>' +\
    '<tr><td class="label"> c </td> <td> 3 </td></tr>' +\
    '<tr><td class="label"> d </td> <td> 4 </td></tr>' +\
    '</table></html>'

Желаемый результат разбора{' a ': ' 1 ', ' b ': ' 2 ', ' c ': ' 3 ', ' d ' : ' 4' }

Это моя ближайшая попытка:

for tr in s.findAll('tr'):
  k, v = BeautifulSoup(str(tr)).findAll('td')
  d[str(k)] = str(v)

Результат:

{'<td class="label"> a </td>': '<td> 1 </td>', '<td class="label"> d </td>': '<td> 4 </td>', '<td class="label"> b </td>': '<td> 2 </td>', '<td class="label"> c </td>': '<td> 3 </td>'}

Я знаю оtext=True параметрfindAll() но я не получаю ожидаемых результатов, когда использую его.

Я использую Python 2.6 и BeautifulSoup3.

BeautifulSoup, словарь из таблицы HTML

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

BeautifulSoup, словарь из таблицы HTML

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы