Como lidar com dados do arquivo arff com python?
Eu sou muito novo para python. Estou usando python para ler o arquivo arff agora:
import arff
for row in arff.load('cpu.arff'):
x = row
print(x)
A parte da saída de amostra é assim:
<Row(125.0,256.0,6000.0,256.0,16.0,128.0,198.0)>
<Row(29.0,8000.0,32000.0,32.0,8.0,32.0,269.0)>
<Row(29.0,8000.0,32000.0,32.0,8.0,32.0,220.0)>
<Row(29.0,8000.0,32000.0,32.0,8.0,32.0,172.0)>
<Row(29.0,8000.0,16000.0,32.0,8.0,16.0,132.0)>
<Row(26.0,8000.0,32000.0,64.0,8.0,32.0,318.0)>
<Row(23.0,16000.0,32000.0,64.0,16.0,32.0,367.0)>
Na verdade, apenas a última coluna de dados é o rótulo e o restante dos dados são os atributos. Gostaria de saber como posso salvá-los usando matriz? Como eu quero atribuir os dados da última coluna como y, e os seis primeiros dados da coluna como meu x, então farei a validação cruzada para os dados do arquivo arff.
Ou existe alguma abordagem para separar dados por atributos e rótulo do arquivo arff automaticamente?