Resultados de la búsqueda a petición "dataframe"

2 la respuesta

Pandas llenando fechas y valores faltantes dentro del grupo

Tengo un marco de datos que se parece al siguiente x = pd.DataFrame({'user': ['a','a','b','b'], 'dt': ['2016-01-01','2016-01-02', '2016-01-05','2016-01-06'], 'val': [1,33,2,1]})Lo que me gustaría poder hacer es encontrar la fecha mínima y máxima ...

1 la respuesta

Trazado con pandas y matplotlib

Estoy tratando de crear un diagrama de dispersión en Python. Tengo un marco de datos 'df' con una categoría específica y x e y son números de columna: groups = df.groupby(category) fig, ax = plt.subplots() for name, group in groups: ...

6 la respuesta

¿Encontrar filas no numéricas en el marco de datos en pandas?

Tengo un gran marco de datos en pandas que, aparte de la columna utilizada como índice, se supone que solo tiene valores numéricos: df = pd.DataFrame({'a': [1, 2, 3, 'bad', 5], 'b': [0.1, 0.2, 0.3, 0.4, 0.5], 'item': ['a', 'b', 'c', 'd', 'e']}) ...

2 la respuesta

Pandas DataFrame.query expresión que devuelve todas las filas por defecto

He descubierto el método pandas DataFrame.query ycasi hace exactamente lo que necesitaba (e implementé mi propio analizador, ya que no me había dado cuenta de que existía, pero realmente debería estar usando el método estándar). Me gustaría que ...

2 la respuesta

Combinar múltiples columnas de fecha en una

Tengo un marco de datos que contiene varias columnas con fechas. col1<-seq( as.Date("2011-07-01"), by=20, len=10) col2<-seq( as.Date("2011-09-01"), by=7, len=10) col3<-seq( as.Date("2011-08-01"), by=1, len=10) data.frame(col1,col2,col3)El marco ...

1 la respuesta

¿Cómo agregar una columna a una estructura explotada en Spark?

Digamos que tengo los siguientes datos: {"id":1, "payload":[{"foo":1, "lol":2},{"foo":2, "lol":2}]}Me gustaría explotar la carga útil y agregarle una columna, como esta: df = df.select('id', F.explode('payload').alias('data')) df ...

4 la respuesta

Filtrado del marco de datos de pandas con múltiples columnas booleanas

Estoy tratando de filtrar un df usando varias variables booleanas que son parte del df, pero no he podido hacerlo. Data de muestra: A | B | C | D John Doe | 45 | True | False Jane Smith | 32 | False | False Alan Holmes | 55 | False | True Eric ...

3 la respuesta

Eliminar todas las filas únicas

Estoy tratando de descubrir cómo eliminar todas las filas únicas, de un marco de datos, pero si tiene un duplicado, quiero que permanezca allí. Por ejemplo, quiero que todas las columnas de esto con col1 sean ...

3 la respuesta

Misma función sobre múltiples marcos de datos en R

Soy nuevo en R, y esta es una pregunta muy simple. He encontrado muchas cosas similares a lo que quiero pero no exactamente. Básicamente tengo múltiples marcos de datos y simplemente quiero ejecutar la misma función en todos ellos. Un bucle for ...

1 la respuesta

Seleccione filas en un marco de datos en r según los valores en una fila

Tengo un marco de datos de juguete. a = rep(1:5, each=3) b = rep(c("a","b","c"), each = 5) df = data.frame(a,b) a b 1 1 a 2 1 a 3 1 a 4 2 a 5 2 a 6 2 b 7 3 b 8 3 b 9 3 b 10 4 b 11 4 c 12 4 c 13 5 c 14 5 c 15 5 cTambién tengo un índice. idx = ...