Resultados de la búsqueda a petición "dataframe"

5 la respuesta

Reemplazar valores en un marco de datos basado en la tabla de búsqueda

Tengo problemas para reemplazar los valores en un marco de datos. Me gustaría reemplazar los valores basados en una tabla separada. A continuación se muestra un ejemplo de lo que estoy tratando de hacer. Tengo una mesa donde cada fila es un ...

6 la respuesta

¿Cómo agrego una columna persistente de identificadores de fila a Spark DataFrame?

Esta pregunta no es nueva, sin embargo, encuentro un comportamiento sorprendente en Spark. Necesito agregar una columna de ID de fila a un DataFrame. Utilicé el método DataFrame monotonically_increasing_id () y me da una columna adicional de ID ...

2 la respuesta

marco de datos de resumen de varias salidas de regresión múltiple

Estoy haciendo múltiples regresiones OLS. He usado la siguiente función lm: GroupNetReturnsStockPickers <- read.csv("GroupNetReturnsStockPickers.csv", header=TRUE, sep=",", dec=".") ModelGroupNetReturnsStockPickers <- lm(StockPickersNet ~ ...

1 la respuesta

R cómo eliminar filas en un marco de datos basado en el primer carácter de una columna

Tengo un gran marco de datos y quiero eliminar ciertas filas de él en función de que el primer carácter de una columna sea una letra o un número. La muestra de mi marco de datos se ve a ...

2 la respuesta

Cómo reorganizar un orden de coincidencias entre dos marcos de datos

He estado ocupado con esta pregunta desde anoche y no pude encontrar la manera de hacerlo. Lo que quiero hacer es hacer coincidir las cadenas df1 con las cadenas df2 y obtener las similares. lo que hago es así # a function to arrange the data ...

2 la respuesta

La forma más eficiente de convertir valores de columna en Pandas DataFrame

Tengo un pd.DataFrame que se parece a: [/imgs/17YRS.png] Quiero crear un límite en los valores para insertarlos en dígitos binarios, mi límite en este caso es0.85. Quiero que el marco de datos resultante se vea así: [/imgs/JKR8o.png] El ...

2 la respuesta

Cómo excluir varias columnas en el marco de datos de Spark en Python

Encontré que PySpark tiene un método llamadodrop pero parece que solo puede soltar una columna a la vez. ¿Alguna idea sobre cómo soltar varias columnas al mismo tiempo? df.drop(['col1','col2']) TypeError Traceback (most recent call ...

1 la respuesta

Filtro de chispa DataFrame en cadena contiene

estoy usandoSpark 1.3.0 [http://spark.apache.org/releases/spark-release-1-3-0.html]ySpark Avro 1.0.0 [https://github.com/databricks/spark-avro/tree/c5612df9b1a9768689fec91655faa2a7073fd9fc#spark-sql-avro-library] . Estoy trabajando desdeel ...

2 la respuesta

valores de suma de columnas que comienzan con la misma cadena en el marco de datos de pandas

Tengo un marco de datos con aproximadamente 100 columnas que se parece a Id Economics-1 English-107 English-2 History-3 Economics-zz Economics-2 \ 0 56 1 1 0 1 0 0 1 11 0 0 0 0 1 0 2 6 0 0 1 0 0 1 3 43 0 0 0 1 0 1 4 14 0 1 0 0 1 0 Histo ...

5 la respuesta

Subconjunto de un marco de datos a las filas que no aparecen en otro marco de datos

Tengo un marco de datos A con observaciones Var1 Var2 Var3 1 3 4 2 5 6 4 5 7 4 5 8 6 7 9y marco de datos B con observaciones Var1 Var2 Var3 1 3 4 2 5 6que es básicamente un subconjunto de A. Ahora quiero seleccionar observaciones en A NO en B, ...