Resultados de la búsqueda a petición "dataframe"

1 la respuesta

Data.frame se convierte en factor / vector después del filtrado / subconjunto

Tengo un data.frame con una columna, así: >d = data.frame(animal=c("horse","dog","cat"))luego lo filtro excluyendo todos los elementos también presentes en un vector. p.ej.: > res = d[!(d$animal %in% c("horse")),] > res [1] dog cat Levels: cat ...

1 la respuesta

¿Qué hace el argumento 'startTime' de la función pyspark.sql.functions.window y window.start?

El ejemplo es el siguiente: df=spark.createDataFrame([ (1,"2017-05-15 23:12:26",2.5), (1,"2017-05-09 15:26:58",3.5), (1,"2017-05-18 15:26:58",3.6), (2,"2017-05-15 15:24:25",4.8), (3,"2017-05-25 ...

2 la respuesta

¿Cómo soltar una columna específica de archivo csv mientras se lee con pandas?

Necesito eliminar uncolumnacon etiquetanombreen el momento de cargar un csv usandopandas. Estoy leyendo csv de la siguiente manera y quiero agregar parámetros dentro de él para hacerlo. Gracias. pd.read_csv("sample.csv") Sé que hacer esto ...

1 la respuesta

¿Cómo eliminar ciertas columnas en múltiples marcos de datos en R?

Digamos que tengo muchos marcos de datos con diferentes nombres de columnas casi similares. ¿Cómo manipulo las columnas de marcos de datos individuales usando bucles (o de cualquier otra manera)? Por ejemplo, quiero eliminar la primera columna de ...

5 la respuesta

Inserte NA aleatoriamente en el marco de datos proporcionalmente

Tengo un marco de datos completo. Quiero que el 20% de los valores en el marco de datos sean reemplazados por NA para simular datos faltantes al azar. A <- c(1:10) B <- c(11:20) C <- c(21:30) df<- data.frame(A,B,C)¿Alguien puede sugerir una ...

5 la respuesta

Pandas groupby - conjunto de valores diferentes

Tengo este marco de datos x = pd.DataFrame.from_dict({'cat1':['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'], 'cat2':['X', 'X', 'Y', 'Y', 'Y', 'Y', 'Z', 'Z']}) cat1 cat2 0 A X 1 A X 2 A Y 3 B Y 4 B Y 5 C Y 6 C Z 7 C ZQuiero agrupar porcat1y luego ...

3 la respuesta

Vectorizando una función en pandas

Tengo un marco de datos que contiene una lista de coordenadas lat / lon: d = {'Provider ID': {0: '10001', 1: '10005', 2: '10006', 3: '10007', 4: '10008', 5: '10011', 6: '10012', 7: '10016', 8: '10018', 9: '10019'}, 'latitude': ...

2 la respuesta

valor de búsqueda del marco de datos en el rango y devolver una columna diferente

Tengo dos marcos de datos y deseo usar el valor en uno (DF1$pos) para buscar a través de dos columnas en DF2 (DF2start, DF2end) y si se encuentra dentro de esos números, devolverDF2$name DF1 ID pos name chr 12 chr 542 chr 674DF2 ID start end ...

2 la respuesta

¿Cómo obtener el número de grupos en un grupo por objeto en pandas?

Esto sería útil para saber cuántos grupos únicos tengo que realizar cálculos. Gracias. Supongamos que se llama groupby objectdfgroup.

3 la respuesta

Orden de columnas de marco de datos inverso

Simplemente quiero invertir el orden de las columnas de un DataFrame dado. Mi marco de datos: data = {'year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012], 'team': ['Bears', 'Bears', 'Bears', 'Packers', 'Packers', 'Lions', 'Lions', ...