Resultados de la búsqueda a petición "dataframe"
Reemplazar valores en un marco de datos basado en la tabla de búsqueda
Tengo problemas para reemplazar los valores en un marco de datos. Me gustaría reemplazar los valores basados en una tabla separada. A continuación se muestra un ejemplo de lo que estoy tratando de hacer. Tengo una mesa donde cada fila es un ...
¿Cómo agrego una columna persistente de identificadores de fila a Spark DataFrame?
Esta pregunta no es nueva, sin embargo, encuentro un comportamiento sorprendente en Spark. Necesito agregar una columna de ID de fila a un DataFrame. Utilicé el método DataFrame monotonically_increasing_id () y me da una columna adicional de ID ...
marco de datos de resumen de varias salidas de regresión múltiple
Estoy haciendo múltiples regresiones OLS. He usado la siguiente función lm: GroupNetReturnsStockPickers <- read.csv("GroupNetReturnsStockPickers.csv", header=TRUE, sep=",", dec=".") ModelGroupNetReturnsStockPickers <- lm(StockPickersNet ~ ...
R cómo eliminar filas en un marco de datos basado en el primer carácter de una columna
Tengo un gran marco de datos y quiero eliminar ciertas filas de él en función de que el primer carácter de una columna sea una letra o un número. La muestra de mi marco de datos se ve a ...
Cómo reorganizar un orden de coincidencias entre dos marcos de datos
He estado ocupado con esta pregunta desde anoche y no pude encontrar la manera de hacerlo. Lo que quiero hacer es hacer coincidir las cadenas df1 con las cadenas df2 y obtener las similares. lo que hago es así # a function to arrange the data ...
La forma más eficiente de convertir valores de columna en Pandas DataFrame
Tengo un pd.DataFrame que se parece a: [/imgs/17YRS.png] Quiero crear un límite en los valores para insertarlos en dígitos binarios, mi límite en este caso es0.85. Quiero que el marco de datos resultante se vea así: [/imgs/JKR8o.png] El ...
Cómo excluir varias columnas en el marco de datos de Spark en Python
Encontré que PySpark tiene un método llamadodrop pero parece que solo puede soltar una columna a la vez. ¿Alguna idea sobre cómo soltar varias columnas al mismo tiempo? df.drop(['col1','col2']) TypeError Traceback (most recent call ...
Filtro de chispa DataFrame en cadena contiene
estoy usandoSpark 1.3.0 [http://spark.apache.org/releases/spark-release-1-3-0.html]ySpark Avro 1.0.0 [https://github.com/databricks/spark-avro/tree/c5612df9b1a9768689fec91655faa2a7073fd9fc#spark-sql-avro-library] . Estoy trabajando desdeel ...
valores de suma de columnas que comienzan con la misma cadena en el marco de datos de pandas
Tengo un marco de datos con aproximadamente 100 columnas que se parece a Id Economics-1 English-107 English-2 History-3 Economics-zz Economics-2 \ 0 56 1 1 0 1 0 0 1 11 0 0 0 0 1 0 2 6 0 0 1 0 0 1 3 43 0 0 0 1 0 1 4 14 0 1 0 0 1 0 Histo ...
Subconjunto de un marco de datos a las filas que no aparecen en otro marco de datos
Tengo un marco de datos A con observaciones Var1 Var2 Var3 1 3 4 2 5 6 4 5 7 4 5 8 6 7 9y marco de datos B con observaciones Var1 Var2 Var3 1 3 4 2 5 6que es básicamente un subconjunto de A. Ahora quiero seleccionar observaciones en A NO en B, ...