¿Cómo lidiar con los datos del archivo arff con python?

Question

Nov 08, 2015, 11:59 PM

¿Cómo lidiar con los datos del archivo arff con python?

Soy bastante nuevo para Python. Estoy usando python para leer el archivo arff ahora:

import arff

for row in arff.load('cpu.arff'):   
    x = row
    print(x)

La parte de la salida de muestra es como este formato:

<Row(125.0,256.0,6000.0,256.0,16.0,128.0,198.0)>
<Row(29.0,8000.0,32000.0,32.0,8.0,32.0,269.0)>
<Row(29.0,8000.0,32000.0,32.0,8.0,32.0,220.0)>
<Row(29.0,8000.0,32000.0,32.0,8.0,32.0,172.0)>
<Row(29.0,8000.0,16000.0,32.0,8.0,16.0,132.0)>
<Row(26.0,8000.0,32000.0,64.0,8.0,32.0,318.0)>
<Row(23.0,16000.0,32000.0,64.0,16.0,32.0,367.0)>

En realidad, solo la última columna de datos es la etiqueta, y el resto de los datos son los atributos. Me pregunto cómo puedo guardarlos usando array. Porque quiero asignar los datos de la última columna como y, y los primeros datos de las seis columnas como mi x, y luego haré la validación cruzada de los datos del archivo arff.

¿O hay algún enfoque para separar los datos por atributos y etiquetas del archivo arff automáticamente?

Deja tu comentario