Resultados de la búsqueda a petición "pandas"
Reconstruir una variable categórica a partir de dummies en pandas
pd.get_dummies permite convertir una variable categórica en variables ficticias. Además del hecho de que es trivial reconstruir la variable categórica, ¿hay una forma preferida / rápida de hacerlo?
Filtrado de pandas para múltiples subcadenas en serie
Necesito filtrar filas en unpandas marco de datos para que una columna de cadena específica contenga al menos una de una lista de subcadenas proporcionadas. Las subcadenas pueden tener caracteres inusuales / expresiones regulares. La comparación ...
Pandas Reemplazar NaN con una cadena en blanco / vacía
Tengo un marco de datos de Pandas como se muestra a continuación: 1 2 3 0 a NaN read 1 b l unread 2 c NaN readQuiero eliminar los valores de NaN con una cadena vacía para que se vea así: 1 2 3 0 a "" read 1 b l unread 2 c "" read
S, cómo DataFrame como tabla en iPython Notebook
Estoy usando el portátil iPython. Cuando hago esto: dfTengo una hermosa mesa con celdas. Sin embargo, si hago esto: df1 df2no imprime la primera hermosa mesa. Si intento esto: print df1 print df2Imprime la tabla en un formato diferente que ...
Restablecer parte del tiempo de una marca de tiempo de pandas
¿Cómo puedo restablecer la parte de tiempo de una marca de tiempo de pandas? Quiero restablecer parte del tiempo en el valor de pandas.Timestamp. Supongo que puedo hacerlo usando el siguiente procedimiento. paso 1) Marca de tiempo al tipo de ...
¿Cómo cambio varias columnas? Pandas, Python
Por simplicidad, digamos que tengo este marco de datos. Date Open Close 2016-01-01 100 129 2016-01-02 198 193 2016-01-03 103 102 2016-01-04 102 109No puedo indicar todos los nombres de columna porque hay demasiados. Entonces, ¿cómo puedo cambiar ...
Cómo eliminar la última fila de datos de un marco de datos de pandas
Creo que esto debería ser simple, pero probé algunas ideas y ninguna funcionó: last_row = len(DF) DF = DF.drop(DF.index[last_row]) #<-- fail!Intenté usar índices negativos pero eso también condujo a errores. Todavía debo estar malentendiendo ...
Pandas: intersección de dos marcos de datos basados en entradas de columna
Supongamos que tengo dos DataFrames así: >>dfA S T prob 0 ! ! ! ! ! ! ! 8.1623999e-05 1 ! ! ! ! ! ! " 0.00354090007 2 ! ! ! ! ! ! . 0.00210241997 3 ! ! ! ! ! ! ? 6.55684998e-05 4 ! ! ! ! ! ! 0.203119993 5 ! ! ! ! ! ! ” 6.62070015e-05 6 ! ! ! ! ! ...
Orden de columnas en Pandas Groupby Agg Function
¿Existe una forma automatizada de mantener el orden de las columnas ('C', 'B', 'A') para el marco de datos que se devuelve? g = df.groupby(['people']) g['people'].agg({'C' : len, 'B' : len, 'A' : len, }) Esto devolverá las columnas como A, B, C ...
pandas valores únicos columnas múltiples
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)})¿Cuál es la mejor manera de devolver los valores únicos de 'Col1' y 'Col2'? La salida deseada ...