Resultados de la búsqueda a petición "dataframe"

1 la respuesta

Establecer valores en el subconjunto Pandas DataFrame (copia) es lento

import timeit import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 10)) dft = df[[True, False] * 5] # df = dft dft2 = dft.copy() new_data = np.random.rand(5, 10) print(timeit.timeit('dft.loc[:, :] = new_data', setup='from ...

4 la respuesta

Reemplazar los valores duplicados, excepto 1 fila en el marco de datos R

¿Cómo puedo reemplazar los valores duplicados de una columna específica del marco de datos R a NA (excepto la primera fila) según la ID? Para dar un ejemplo: x <- data.frame(id=c("p1","p1","p1","p2","p2"),date=c("d1","d1","d1","d2","d2")) y ...

3 la respuesta

Pandas: diferencia de dos marcos de datos

Necesito comparar dos marcos de datos de diferentes tamaños en fila e imprimir filas no coincidentes. Tomemos los dos siguientes: df1 = DataFrame({ 'Buyer': ['Carl', 'Carl', 'Carl'], 'Quantity': [18, 3, 5, ]}) df2 = DataFrame({ 'Buyer': ['Carl', ...

3 la respuesta

¿Cómo reemplazo un valor de cadena con un NULL en PySpark?

Quiero hacer algo como esto: df.replace('empty-value', None, 'NAME')Básicamente, quiero reemplazar algún valor con NULL. pero no acepta ninguno en esta función. ¿Cómo puedo hacer esto?

1 la respuesta

Python: agregando horas a la marca de tiempo de los pandas

Leí un archivo csv en el marco de datos de pandasdf y me sale lo siguiente: df.columns Index([u'TDate', u'Hour', u'SPP'], dtype='object') >>> type(df['TDate'][0]) <class 'pandas.tslib.Timestamp'> type(df['Hour'][0]) <type 'numpy.int64'> >>> ...

2 la respuesta

Encontrar filas en el marco de datos R donde el valor de una columna sigue una secuencia

Tengo un marco de datos como el siguiente, que es una salida de un clasificador. col1, class 123, 2 122, 5 124, 7 125, 9 126, 15 127, 2 128, 19 129, 5 130, 7 179, 9 180, 3Quiero encontrar las filas que tienen un cierto patrón de clase, como ...

2 la respuesta

convierte la columna del marco de datos de pandas de una cadena hexadecimal a int

Tengo un marco de datos muy grande que me gustaría evitar iterar en cada fila y quiero convertir la columna completa de una cadena hexadecimal a int. No procesa la cadena correctamente con un tipo, pero no tiene problemas con una sola entrada. ...

2 la respuesta

Reordenar el marco de datos según el vector de caracteres

Creo que esto debería ser realmente simple, pero no puedo encontrar una manera de hacerlo. Quiero reordenar un marco de datos basado en un factor. Todas las respuestas que puedo encontrar hasta ahora proporcionan una clasificación lógica, pero ...

2 la respuesta

mapear columnas de marco de datos de pandas a valores de diccionario

Tengo uno: muchos diccionarios. Me gustaría asignar los valores de una columna de marco de datos de pandas a las claves (NO valores) del diccionario. aquí está mi ...

1 la respuesta

Python divide las columnas del marco de datos en varias filas

Tengo un marco de datos como este: -------------------------------------------------------------------- Product ProductType SKU Size -------------------------------------------------------------------- T-shirt Top [111,222,333,444] ...