Resultados de la búsqueda a petición "dataframe"

2 la respuesta

Eliminar columnas de trama de datos según las condiciones en R

Tengo que eliminar columnas en mi marco de datos que tiene más de 4000 columnas y 180 filas. Las condiciones que quiero establecer para eliminar la columna en el marco de datos son: (i) Eliminar la columna si hay menos de dos valores / entradas ...

2 la respuesta

Cómo crear un bucle for en R para este cálculo peculiar

No puedo entender con este (aparentemente) simplemente tipo de operación: Dados estos dos marcos de datos diferentesdf(A) (nrow = 10, ncol = 3) ydf(B) (nrow = 3, ncol = 3) df(A) df(B) col1 col2 col3 col1 col2 col3 1 2 4 1 4 5 3 5 7 2 7 7 5 7 6 ...

11 la respuesta

data.frame filas a una lista

Tengo un data.frame que me gustaría convertir en una lista por filas, lo que significa que cada fila correspondería a sus propios elementos de lista. En otras palabras, me gustaría una lista que sea tan larga como data.frame tenga filas. Hasta ...

1 la respuesta

Grupo Pandas DataFrame mediante intervalos superpuestos de longitud variable

Estoy tratando de agrupar un DataFrame por 2 columnas (ver ejemplo a continuación). Para la primera columna, quiero que cada valor pertenezca a un grupo. Para la segunda columna, quiero agrupar superponiendo intervalos de tamaño desigual. Tengo ...

1 la respuesta

Función Strip o Regex en Spark 1.3 Dataframe

Tengo un código de PySpark 1.5 que desafortunadamente tengo que portar hacia atrás a Spark 1.3. Tengo una columna con elementos que son alfanuméricos pero solo quiero los dígitos. Un ejemplo de los elementos en 'old_col' de 'df' son: '125 ...

2 la respuesta

Múltiples operaciones agregadas en la misma columna de un marco de datos de chispa

Tengo tres matrices de tipo de cadena que contienen la siguiente información: matriz groupBy: contiene los nombres de las columnas por las que quiero agrupar mis datos.matriz agregada: contiene nombres de columnas que quiero agregar.matriz de ...

1 la respuesta

Manipule un marco de datos donde haya múltiples columnas para cada experimento.

Tengo muchos experimentos de secuenciación, cada uno con múltiples resultados para cada uno de unos pocos cientos de genes, cuando los datos salen de otro programa, no están en un formato útil para mí, ya que todos los Experimentos y cada ...

2 la respuesta

¿Cómo calcular el cambio porcentual en comparación con el valor inicial usando pandas?

tengo unDataFrame y necesitan calcular el cambio porcentual en comparación con el comienzo del año por parte de las compañías. ¿Hay alguna forma de usarpct_change() u otro método para realizar esta tarea? ¡Gracias! df parece security date price ...

2 la respuesta

spark.ml StringIndexer arroja 'Etiqueta invisible' en fit ()

Estoy preparando un juguetespark.ml ejemplo.Spark version 1.6.0, corriendo encima deOracle JDK version 1.8.0_65, pyspark, cuaderno de ipython. Primero, casi no tiene nada que ver conSpark, ML, StringIndexer: manejo de etiquetas ...

4 la respuesta

R data.frame obtiene el valor de la variable que es seleccionada por otra variable, vectorizada

Tengo datos que me llegan con muchas variables similares, con una variable adicional que indica quéuno de esas variables similares que realmente quiero. Utilizando un bucle, puedo buscar el valor correcto, pero los datos son grandes, el bucle es ...