Resultados de la búsqueda a petición "dataframe"

1 la respuesta

Cómo usar una variable de cadena para seleccionar una columna de marco de datos usando la notación $ [duplicado]

Esta pregunta ya tiene una respuesta aquí: Seleccione dinámicamente las columnas del marco de datos usando $ y un vector de nombres de columna [/questions/18222286/dynamically-select-data-frame-columns-using-and-a-vector-of-column-names] 8 ...

1 la respuesta

Combinar múltiples registros en un marco de datos basado en una clave en scala spark

Tengo un marco de datos que contiene registros identificados por una clave. Pero puede haber un caso en el que una clave puede volverse repetitiva. Mi objetivo es fusionar todos los registros basados en esa clave de la siguiente manera ...

1 la respuesta

Extraer cadena de columna siguiendo un patrón específico

Por favor, perdone mi pregunta de novato de panda, pero tengo una columna de ciudades y estados de EE. UU., Como la versión truncada que se muestra a continuación (Por alguna extraña razón, el nombre de la columna se llama 'Alabama [editar]', ...

1 la respuesta

¿Por qué no se utiliza el pushdown de predicados en la API de conjunto de datos con tipo (frente a la API de marco de datos sin tipo)?

Siempre pensé que las API de dataset / dataframe son las mismas ... y la única diferencia es que la API de dataset le dará seguridad en el tiempo de compilación. Correcto Entonces, tengo un caso muy simple: case class Player (playerID: ...

1 la respuesta

Seleccione filas de un DataFrame basado en valores de lista en una columna en pandas

Soy nuevo en pandas y tengo un marco de datos simple y quiero extraer ciertas filas basadas en una columna. Sin embargo,el tipo en esta columna es una lista. Ejemplo df = pd.DataFrame([['text1', [1,2,3]], ['text2', ...

1 la respuesta

¿Por qué la identificación de una celda de marco de datos de pandas cambia con cada ejecución?

e encontré con este problema cuando intentaba asegurarme de algunas propiedades de la vista del marco de datos. Supongamos que tengo un marco de datos definido como:df = pd.DataFrame(columns=list('abc'), data=np.arange(18).reshape(6, 3)) y una ...

1 la respuesta

Manipulación de fila para Dataframe en chispa [duplicado]

Esta pregunta ya tiene una respuesta aquí: Cómo mapear un Dataframe anidado en Spark [/questions/36784735/how-to-flatmap-a-nested-dataframe-in-spark] 1 respuesta Tengo un marco de datos en chispa que es como: column_A | column_B --------- ...

2 la respuesta

Python de bucle lento para buscar datos en un marco de datos adicional en python

Tengo dos marcos de datos: uno con todos mis datos (llamados 'datos') y otro con latitudes y longitudes de diferentes estaciones donde cada observación comienza y termina (llamada 'información'), estoy tratando de obtener un marco de datos donde ...

2 la respuesta

pasando el valor de RDD a otro RDD como variable - Spark #Pyspark [duplicado]

Esta pregunta ya tiene una respuesta aquí: ¿Cómo obtener un valor del objeto Row en Spark Dataframe? [/questions/37999657/how-to-get-a-value-from-the-row-object-in-spark-dataframe] 3 respuestas Actualmente estoy explorando cómo llamar a grandes ...

3 la respuesta

Lengthening un DataFrame basado en columnas de apilamiento dentro de él en Pandas

Estoy buscando una función que logre lo siguiente. Se muestra mejor en un ejemplo. Considerar pd.DataFrame([ [1, 2, 3 ], [4, 5, np.nan ]], columns=['x', 'y1', 'y2'])que se parece a: x y1 y2 0 1 2 3 1 4 5 NaN Me gustaría colapsar ely1 yy2 ...