Resultados de la búsqueda a petición "pandas"

1 la respuesta

¿Cómo crear un marco de datos grande pero disperso a partir de un dict eficientemente?

Tengo una matriz grande pero muy escasa (50,000 filas * 100,000 columnas, solo se conoce el 10% de los valores). Cada elemento conocido de esta matriz es un número flotante de 0.00 a 1.00 y estos valores conocidos se almacenan en un dict python ...

4 la respuesta

Contando valor positivo consecutivo en la matriz de Python

Estoy tratando de contar los días consecutivos en los datos de rendimiento de renta variable, por lo que si un día positivo es 1 y uno negativo es 0, una listay=[0,0,1,1,1,0,0,1,0,1,1] debería volverz=[0,0,1,2,3,0,0,1,0,1,2]. He llegado a una ...

1 la respuesta

Rellenar Multi-index Pandas DataFrame con interpolación

me gustaríabfill yffill un índice múltipleDataFrame que contieneNaNs (en este caso elImpVol campo) usando elinterpolate método. Una sección de laDataFrame podría verse así: Expiration OptionType Strike ImpVol 2014-12-26 call 140.0 NaN 145.0 NaN ...

2 la respuesta

¿Por qué DataFrame.loc [[1]] es 1.800x más lento que df.ix [[1]] y 3.500x que df.loc [1]?

Prueba esto por ti mismo: import pandas as pd s=pd.Series(xrange(5000000)) %timeit s.loc[[0]] # You need pandas 0.15.1 or newer for it to be that slow 1 loops, best of 3: 445 ms per loopActualizar: es decirun error legítimo en los ...

4 la respuesta

¿Piso o techo de una serie de pandas en pitón?

Tengo una serie de pandasseries. Si quiero obtener el piso o techo en cuanto a elementos, ¿hay un método incorporado o tengo que escribir la función y usar apply? Pregunto porque los datos son grandes, así que aprecio la eficiencia. Tampoco se ha ...

3 la respuesta

Vectorizando una función en pandas

Tengo un marco de datos que contiene una lista de coordenadas lat / lon: d = {'Provider ID': {0: '10001', 1: '10005', 2: '10006', 3: '10007', 4: '10008', 5: '10011', 6: '10012', 7: '10016', 8: '10018', 9: '10019'}, 'latitude': ...

5 la respuesta

¿Por qué debería hacer una copia de un marco de datos en pandas?

Al seleccionar un subtrama de datos de un marco de datos principal, noté que algunos programadores hacen una copia del marco de datos utilizando.copy() método. ¿Por qué están haciendo una copia del marco de datos? ¿Qué pasará si no hago una copia?

4 la respuesta

¿El índice de reinicio de Pandas no parece funcionar?

No estoy seguro de dónde me extravío, pero parece que no puedo restablecer el índice en un marco de datos. Cuando corrotest.head(), Obtengo la salida a continuación: Como puede ver, el marco de datos es un segmento, por lo que el índice ...

1 la respuesta

Diagramas de dispersión en Pandas / Pyplot: cómo trazar por categoría con diferentes marcadores

Sobre la base de esta pregunta anterior:Diagramas de dispersión en Pandas / Pyplot: Cómo trazar por categoría [https://stackoverflow.com/questions/21654635/scatter-plots-in-pandas-pyplot-how-to-plot-by-category] . El siguiente código es la ...

3 la respuesta

Python: valor NaN en Pandas solo para un valor único

Solo quiero verificar si una sola celda en la serie Pandas es nula o no. es decir, me gustaría comprobar si un valor esNaN. Todas las demás respuestas son para series y matrices, pero no para valores únicos. Yo he tratadopandas.notnull, ...