script uCurl dados da tabela usando expressão regular para enviar para um banco de dados
Eu tenho um dispositivo na minha rede que está postando dados em uma página html. Eu preciso ser capaz de coletar os dados da página e inseri-los no meu banco de dados para que eu possa ter referência histórica aos dados.
Abaixo está um exemplo do html que o dispositivo apresenta. Os números que eu preciso extrair estão nos campos que atualmente possuem os valores 290, 1868 e 187. Eles estão em uma tabela ... as linhas são identificadas por 5: 1, 5: 5 e 5:13 (se isso ajudar em absoluto).
Eu gostaria de executar isso como um trabalho cron do linux, portanto, gostaria de usar um script linux para: 1. extrair as informações do site (assumindo o uso do comando cUrl) 2. analisar os dados (assumindo o uso de algum tipo de comando de expressão regular) 3. salve os dados nas variáveis 4. conecte-se ao meu banco de dados e insira os dados em uma tabela
Eu tentei várias coisas diferentes: curl + grep (também não sei se entendi completamente sed ou regex.
Qualquer ajuda seria muito apreciada. Obrigado.
******start of html source
<html><head><title>Data Table Monitor</title></head>
<body bgcolor="#ffffff"><center>
<h2><font face="helvetica">Ethernet Processor</font></h2>
<h2><i>Data Table Monitor</i></h2>
<hr width=25% align=center>
<meta HTTP-EQUIV="refresh" CONTENT="15"><body bgcolor="#ffffff"><center><table border=1><tr><th>Address</th><th>CU</th><th>CD</th><th>DN</th><th>OV</th><th>UN</th><th>UA</th><th>PRE</th><th>ACC</th><th>Address</th><th>CU</th><th>CD</th><th>DN</th><th>OV</th><th>UN</th><th>PRE</th><th>ACC</th></tr><tr><td>C5:0</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>10</td><td align=right>0</td><td>C5:1</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>290</td></tr><tr><td>C5:2</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>2</td><td>C5:3</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>0</td><td align=right>0</td></tr><tr><td>C5:4</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>0</td><td align=right>0</td><td>C5:5</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>1868</td></tr><tr><td>C5:6</td>
<td align=center>1</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>0</td><td>C5:7</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>0</td><td align=right>0</td></tr><tr><td>C5:8</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>0</td><td align=right>0</td><td>C5:9</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>0</td><td align=right>0</td></tr><tr><td>C5:10</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>717</td><td>C5:11</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>70</td></tr><tr><td>C5:12</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>187</td><td>C5:13</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>4384</td></tr><tr><td>C5:14</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>0</td><td>C5:15</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>0</td></tr><tr><td>C5:16</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>0</td><td>C5:17</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>32000</td><td align=right>1868</td></tr><tr><td>C5:18</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>0</td><td align=right>0</td><td>C5:19</td>
<td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=center>0</td><td align=right>0</td><td align=right>0</td></tr></table></center><hr width=25% align=center>
******end of html source