¿Cómo lidiar con los datos del archivo arff con python?
Soy bastante nuevo para Python. Estoy usando python para leer el archivo arff ahora:
import arff
for row in arff.load('cpu.arff'):
x = row
print(x)
La parte de la salida de muestra es como este formato:
<Row(125.0,256.0,6000.0,256.0,16.0,128.0,198.0)>
<Row(29.0,8000.0,32000.0,32.0,8.0,32.0,269.0)>
<Row(29.0,8000.0,32000.0,32.0,8.0,32.0,220.0)>
<Row(29.0,8000.0,32000.0,32.0,8.0,32.0,172.0)>
<Row(29.0,8000.0,16000.0,32.0,8.0,16.0,132.0)>
<Row(26.0,8000.0,32000.0,64.0,8.0,32.0,318.0)>
<Row(23.0,16000.0,32000.0,64.0,16.0,32.0,367.0)>
En realidad, solo la última columna de datos es la etiqueta, y el resto de los datos son los atributos. Me pregunto cómo puedo guardarlos usando array. Porque quiero asignar los datos de la última columna como y, y los primeros datos de las seis columnas como mi x, y luego haré la validación cruzada de los datos del archivo arff.
¿O hay algún enfoque para separar los datos por atributos y etiquetas del archivo arff automáticamente?