Resultados de la búsqueda a petición "dataframe"
Establecer valores en el subconjunto Pandas DataFrame (copia) es lento
import timeit import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 10)) dft = df[[True, False] * 5] # df = dft dft2 = dft.copy() new_data = np.random.rand(5, 10) print(timeit.timeit('dft.loc[:, :] = new_data', setup='from ...
Reemplazar los valores duplicados, excepto 1 fila en el marco de datos R
¿Cómo puedo reemplazar los valores duplicados de una columna específica del marco de datos R a NA (excepto la primera fila) según la ID? Para dar un ejemplo: x <- data.frame(id=c("p1","p1","p1","p2","p2"),date=c("d1","d1","d1","d2","d2")) y ...
Pandas: diferencia de dos marcos de datos
Necesito comparar dos marcos de datos de diferentes tamaños en fila e imprimir filas no coincidentes. Tomemos los dos siguientes: df1 = DataFrame({ 'Buyer': ['Carl', 'Carl', 'Carl'], 'Quantity': [18, 3, 5, ]}) df2 = DataFrame({ 'Buyer': ['Carl', ...
¿Cómo reemplazo un valor de cadena con un NULL en PySpark?
Quiero hacer algo como esto: df.replace('empty-value', None, 'NAME')Básicamente, quiero reemplazar algún valor con NULL. pero no acepta ninguno en esta función. ¿Cómo puedo hacer esto?
Python: agregando horas a la marca de tiempo de los pandas
Leí un archivo csv en el marco de datos de pandasdf y me sale lo siguiente: df.columns Index([u'TDate', u'Hour', u'SPP'], dtype='object') >>> type(df['TDate'][0]) <class 'pandas.tslib.Timestamp'> type(df['Hour'][0]) <type 'numpy.int64'> >>> ...
Encontrar filas en el marco de datos R donde el valor de una columna sigue una secuencia
Tengo un marco de datos como el siguiente, que es una salida de un clasificador. col1, class 123, 2 122, 5 124, 7 125, 9 126, 15 127, 2 128, 19 129, 5 130, 7 179, 9 180, 3Quiero encontrar las filas que tienen un cierto patrón de clase, como ...
convierte la columna del marco de datos de pandas de una cadena hexadecimal a int
Tengo un marco de datos muy grande que me gustaría evitar iterar en cada fila y quiero convertir la columna completa de una cadena hexadecimal a int. No procesa la cadena correctamente con un tipo, pero no tiene problemas con una sola entrada. ...
Reordenar el marco de datos según el vector de caracteres
Creo que esto debería ser realmente simple, pero no puedo encontrar una manera de hacerlo. Quiero reordenar un marco de datos basado en un factor. Todas las respuestas que puedo encontrar hasta ahora proporcionan una clasificación lógica, pero ...
mapear columnas de marco de datos de pandas a valores de diccionario
Tengo uno: muchos diccionarios. Me gustaría asignar los valores de una columna de marco de datos de pandas a las claves (NO valores) del diccionario. aquí está mi ...
Python divide las columnas del marco de datos en varias filas
Tengo un marco de datos como este: -------------------------------------------------------------------- Product ProductType SKU Size -------------------------------------------------------------------- T-shirt Top [111,222,333,444] ...