Resultados de la búsqueda a petición "dataframe"

4 la respuesta

Spark Dataframe: cómo agregar un índice Columna: Índice de datos distribuidos de Aka

Leí datos de un archivo csv, pero no tengo índice. Quiero agregar una columna del 1 al número de la fila. ¿Qué debo hacer, gracias (scala)

2 la respuesta

Elimine la primera x cantidad de caracteres de cada fila en una columna de un marco de datos de Python

Tengo un marco de datos Python con aproximadamente 1,500 filas y 15 columnas. Con una columna específica, me gustaría eliminar los primeros 3 caracteres de cada fila. Como ejemplo simple, aquí hay un marco de datos: import pandas as pd d = { ...

5 la respuesta

Crear una nueva columna dependiendo de la igualdad de otras dos columnas

Quiero comparar los valores de dos columnas donde creo una nueva columnabin_crnn. Quiero 1 si son iguales o 0 si no. # coding: utf-8 import pandas as pd df = pd.read_csv('file.csv',sep=',') if df['crnn_pred']==df['manual_raw_value']: ...

1 la respuesta

¿Cómo filtrar registros duplicados que tienen múltiples claves en Spark Dataframe?

Tengo dos marcos de datos. Quiero eliminar algunos registros en Data Frame-A en función de algunos valores de columna comunes en Data Frame-B. Por ejemplo: Data Frame-A: A B C D 1 2 3 4 3 4 5 7 4 7 9 6 2 5 7 9 Marco de datos B: A B C D 1 2 3 7 ...

1 la respuesta

Eliminando un número fuera de secuencia de una columna en data.table en R [cerrado]

Tengo una tabla de datos dt, con tres columnas nm, seqn y obj > nm <- letters[1:22] > seqn <- c(32,36, 86,45 , 47, 48, 49, + 52, 54, 59, + 66, 9, 69, 74, 81, 88, 90, 91, 93, 94, 95, 97) > obj <- rep(c('c1', 'c2', 'c3'), c(7, 3, 12)) > dt <- ...

2 la respuesta

Concatenar marcos de datos con índice múltiple en el marco de datos de pandas

Tengo dos marcos de datosdf1 ydf2: In [56]: df1.head() Out[56]: col7 col8 col9 alpha0 D0 alpha0 D0 alpha0 D0 F35_HC_531d.dat 1.103999 1.103999 1.364399 1.358938 3.171808 1.946894 F35_HC_532d.dat 0.000000 0.000000 1.636934 1.635594 4.359431 ...

3 la respuesta

¿Cómo puedo eliminar todos los caracteres no numéricos de todos los valores en una columna particular en el marco de datos de pandas?

Tengo un marco de datos que se ve así: A B C 1 red78 square big235 2 green circle small123 3 blue45 triangle big657 Necesito poder eliminar los caracteres no numéricos de todas las filas de la columna C para que mi marco de datos se vea así: A ...

2 la respuesta

¿Cómo manejar un índice con nombre personalizado al copiar un marco de datos usando pd.read_clipboard?

Dado este marco de datos de alguna otra pregunta: Constraint Name TotalSP Onpeak Offpeak Constraint_ID 77127 aaaaaaaaaaaaaaaaaa -2174.5 -2027.21 -147.29 98333 bbbbbbbbbbbbbbbbbb -1180.62 -1180.62 0 1049 cccccccccccccccccc -1036.53 -886.77 ...

2 la respuesta

El objeto 'DataFrame' no tiene el atributo 'sort'

Me enfrento a un problema aquí, en mi paquete de Python tengo la instalación numpy, pero todavía tengo este errorEl objeto 'DataFrame' no tiene el atributo 'sort' Cualquiera me puede dar una idea ... Este es mi código: final.loc[-1] =['', ...

1 la respuesta

Compare el grupo de dos columnas y el índice de retorno coincide con R

Muchas gracias por leer. Disculpas por lo que estoy seguro es una tarea simple. Tengo un marco de datos: (Editado: columna adicional agregada que no se incluirá en comparación) b = c(5, 6, 7, 8, 10, 11) c = c('david','alan','pete', 'ben', ...