Resultados de la búsqueda a petición "dataframe"
Data.frame se convierte en factor / vector después del filtrado / subconjunto
Tengo un data.frame con una columna, así: >d = data.frame(animal=c("horse","dog","cat"))luego lo filtro excluyendo todos los elementos también presentes en un vector. p.ej.: > res = d[!(d$animal %in% c("horse")),] > res [1] dog cat Levels: cat ...
¿Qué hace el argumento 'startTime' de la función pyspark.sql.functions.window y window.start?
El ejemplo es el siguiente: df=spark.createDataFrame([ (1,"2017-05-15 23:12:26",2.5), (1,"2017-05-09 15:26:58",3.5), (1,"2017-05-18 15:26:58",3.6), (2,"2017-05-15 15:24:25",4.8), (3,"2017-05-25 ...
¿Cómo soltar una columna específica de archivo csv mientras se lee con pandas?
Necesito eliminar uncolumnacon etiquetanombreen el momento de cargar un csv usandopandas. Estoy leyendo csv de la siguiente manera y quiero agregar parámetros dentro de él para hacerlo. Gracias. pd.read_csv("sample.csv") Sé que hacer esto ...
¿Cómo eliminar ciertas columnas en múltiples marcos de datos en R?
Digamos que tengo muchos marcos de datos con diferentes nombres de columnas casi similares. ¿Cómo manipulo las columnas de marcos de datos individuales usando bucles (o de cualquier otra manera)? Por ejemplo, quiero eliminar la primera columna de ...
Inserte NA aleatoriamente en el marco de datos proporcionalmente
Tengo un marco de datos completo. Quiero que el 20% de los valores en el marco de datos sean reemplazados por NA para simular datos faltantes al azar. A <- c(1:10) B <- c(11:20) C <- c(21:30) df<- data.frame(A,B,C)¿Alguien puede sugerir una ...
Pandas groupby - conjunto de valores diferentes
Tengo este marco de datos x = pd.DataFrame.from_dict({'cat1':['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'], 'cat2':['X', 'X', 'Y', 'Y', 'Y', 'Y', 'Z', 'Z']}) cat1 cat2 0 A X 1 A X 2 A Y 3 B Y 4 B Y 5 C Y 6 C Z 7 C ZQuiero agrupar porcat1y luego ...
Vectorizando una función en pandas
Tengo un marco de datos que contiene una lista de coordenadas lat / lon: d = {'Provider ID': {0: '10001', 1: '10005', 2: '10006', 3: '10007', 4: '10008', 5: '10011', 6: '10012', 7: '10016', 8: '10018', 9: '10019'}, 'latitude': ...
valor de búsqueda del marco de datos en el rango y devolver una columna diferente
Tengo dos marcos de datos y deseo usar el valor en uno (DF1$pos) para buscar a través de dos columnas en DF2 (DF2start, DF2end) y si se encuentra dentro de esos números, devolverDF2$name DF1 ID pos name chr 12 chr 542 chr 674DF2 ID start end ...
¿Cómo obtener el número de grupos en un grupo por objeto en pandas?
Esto sería útil para saber cuántos grupos únicos tengo que realizar cálculos. Gracias. Supongamos que se llama groupby objectdfgroup.
Orden de columnas de marco de datos inverso
Simplemente quiero invertir el orden de las columnas de un DataFrame dado. Mi marco de datos: data = {'year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012], 'team': ['Bears', 'Bears', 'Bears', 'Packers', 'Packers', 'Lions', 'Lions', ...