Resultados de la búsqueda a petición "dataframe"
Pandas llenando fechas y valores faltantes dentro del grupo
Tengo un marco de datos que se parece al siguiente x = pd.DataFrame({'user': ['a','a','b','b'], 'dt': ['2016-01-01','2016-01-02', '2016-01-05','2016-01-06'], 'val': [1,33,2,1]})Lo que me gustaría poder hacer es encontrar la fecha mínima y máxima ...
Trazado con pandas y matplotlib
Estoy tratando de crear un diagrama de dispersión en Python. Tengo un marco de datos 'df' con una categoría específica y x e y son números de columna: groups = df.groupby(category) fig, ax = plt.subplots() for name, group in groups: ...
¿Encontrar filas no numéricas en el marco de datos en pandas?
Tengo un gran marco de datos en pandas que, aparte de la columna utilizada como índice, se supone que solo tiene valores numéricos: df = pd.DataFrame({'a': [1, 2, 3, 'bad', 5], 'b': [0.1, 0.2, 0.3, 0.4, 0.5], 'item': ['a', 'b', 'c', 'd', 'e']}) ...
Pandas DataFrame.query expresión que devuelve todas las filas por defecto
He descubierto el método pandas DataFrame.query ycasi hace exactamente lo que necesitaba (e implementé mi propio analizador, ya que no me había dado cuenta de que existía, pero realmente debería estar usando el método estándar). Me gustaría que ...
Combinar múltiples columnas de fecha en una
Tengo un marco de datos que contiene varias columnas con fechas. col1<-seq( as.Date("2011-07-01"), by=20, len=10) col2<-seq( as.Date("2011-09-01"), by=7, len=10) col3<-seq( as.Date("2011-08-01"), by=1, len=10) data.frame(col1,col2,col3)El marco ...
¿Cómo agregar una columna a una estructura explotada en Spark?
Digamos que tengo los siguientes datos: {"id":1, "payload":[{"foo":1, "lol":2},{"foo":2, "lol":2}]}Me gustaría explotar la carga útil y agregarle una columna, como esta: df = df.select('id', F.explode('payload').alias('data')) df ...
Filtrado del marco de datos de pandas con múltiples columnas booleanas
Estoy tratando de filtrar un df usando varias variables booleanas que son parte del df, pero no he podido hacerlo. Data de muestra: A | B | C | D John Doe | 45 | True | False Jane Smith | 32 | False | False Alan Holmes | 55 | False | True Eric ...
Eliminar todas las filas únicas
Estoy tratando de descubrir cómo eliminar todas las filas únicas, de un marco de datos, pero si tiene un duplicado, quiero que permanezca allí. Por ejemplo, quiero que todas las columnas de esto con col1 sean ...
Misma función sobre múltiples marcos de datos en R
Soy nuevo en R, y esta es una pregunta muy simple. He encontrado muchas cosas similares a lo que quiero pero no exactamente. Básicamente tengo múltiples marcos de datos y simplemente quiero ejecutar la misma función en todos ellos. Un bucle for ...
Seleccione filas en un marco de datos en r según los valores en una fila
Tengo un marco de datos de juguete. a = rep(1:5, each=3) b = rep(c("a","b","c"), each = 5) df = data.frame(a,b) a b 1 1 a 2 1 a 3 1 a 4 2 a 5 2 a 6 2 b 7 3 b 8 3 b 9 3 b 10 4 b 11 4 c 12 4 c 13 5 c 14 5 c 15 5 cTambién tengo un índice. idx = ...