Resultados de la búsqueda a petición "dataframe"
Aplicando gsub a varias columnas
¿Cuál es la forma más eficiente de aplicar?gsub a varias columnas? Lo siguiente no funciona x1=c("10%","20%","30%") x2=c("60%","50%","40%") x3 = c(1,2,3) x = data.frame(x1,x2,x3) per_col = c(1,2) x = gsub("%","",x[,per_col])¿Cómo puedo colocar ...
Muestra de n filas aleatorias por grupo en un marco de datos
De estas preguntas:Muestra aleatoria de filas del subconjunto de un marco de datos R [https://stackoverflow.com/questions/9628152/random-sample-of-rows-from-subset-of-an-r-dataframe] & Muestra de filas aleatorias en el marco de ...
Python - pandas - Agregar serie al marco de datos en blanco
Digamos que tengo dos series de pandas en python: import pandas as pd h = pd.Series(['g',4,2,1,1]) g = pd.Series([1,6,5,4,"abc"]) Puedo crear un DataFrame con solo h y luego agregarle g: df = pd.DataFrame([h]) df1 = df.append(g, ...
¿Cómo agregar vectores a las columnas de alguna matriz en Julia?
Lo se, con paqueteDataFrames, es posible haciendo simplemente julia> df = DataFrame(); julia> for i in 1:3 df[i] = [i, i+1, i*2] end julia> df 3x3 DataFrame |-------|----|----|----| | Row # | x1 | x2 | x3 | | 1 | 1 | 2 | 3 | | 2 | 2 | 3 | 4 | | ...
Leer y vincular múltiples archivos csv
Tengo una serie de archivos csv (uno por año) con los mismos encabezados de columna y diferente número de filas. Originalmente los estaba leyendo y fusionándolos así; setwd <- ("N:/Ring data by cruise/Shetland") LengthHeight2013 ...
Determinar el número de valores de NA en una columna
Quiero contar la cantidad deNA valores en una columna de marco de datos. Digamos que mi marco de datos se llamadf, y el nombre de la columna que estoy considerando escol. La forma en que se me ocurrió es la siguiente: sapply(df$col, function(x) ...
Eliminar caracteres no ASCII de columnas de cadena en pandas
Tengo un marco de datos de panda con múltiples columnas que se mezclan con valores y caracteres no deseados. columnA columnB columnC ColumnD \x00A\X00B NULL \x00C\x00D 123 \x00E\X00F NULL NULL 456lo que me gustaría hacer es hacer este marco de ...
función personalizada después de agrupar data.fame
Dado el siguiente data.frame d <- rep(c("a", "b"), each=5) l <- rep(1:5, 2) v <- 1:10 df <- data.frame(d=d, l=l, v=v*v) df d l v 1 a 1 1 2 a 2 4 3 a 3 9 4 a 4 16 5 a 5 25 6 b 1 36 7 b 2 49 8 b 3 64 9 b 4 81 10 b 5 100Ahora quiero agregar otra ...
pandas: ordenar cada columna individualmente
Mi dataframe se ve así, solo que mucho más grande. d = {'Col_1' : pd.Series(['A', 'B']), 'Col_2' : pd.Series(['B', 'A', 'C']), 'Col_3' : pd.Series(['B', 'A']), 'Col_4' : pd.Series(['C', 'A', 'B', 'D']), 'Col_5' : pd.Series(['A', 'C']),} df = ...
Python Pandas: cree una nueva columna para cada valor diferente de una columna fuente (con salida booleana como valores de columna)
Estoy tratando de dividir una columna de origen de un marco de datos en varias columnas en función de su contenido, y luego llenar estas columnas recién generadas con un booleano 1 o 0 de la siguiente manera: Marco de datos original: ID ...