Resultados de la búsqueda a petición "dataframe"
Eliminar columnas de trama de datos según las condiciones en R
Tengo que eliminar columnas en mi marco de datos que tiene más de 4000 columnas y 180 filas. Las condiciones que quiero establecer para eliminar la columna en el marco de datos son: (i) Eliminar la columna si hay menos de dos valores / entradas ...
Cómo crear un bucle for en R para este cálculo peculiar
No puedo entender con este (aparentemente) simplemente tipo de operación: Dados estos dos marcos de datos diferentesdf(A) (nrow = 10, ncol = 3) ydf(B) (nrow = 3, ncol = 3) df(A) df(B) col1 col2 col3 col1 col2 col3 1 2 4 1 4 5 3 5 7 2 7 7 5 7 6 ...
data.frame filas a una lista
Tengo un data.frame que me gustaría convertir en una lista por filas, lo que significa que cada fila correspondería a sus propios elementos de lista. En otras palabras, me gustaría una lista que sea tan larga como data.frame tenga filas. Hasta ...
Grupo Pandas DataFrame mediante intervalos superpuestos de longitud variable
Estoy tratando de agrupar un DataFrame por 2 columnas (ver ejemplo a continuación). Para la primera columna, quiero que cada valor pertenezca a un grupo. Para la segunda columna, quiero agrupar superponiendo intervalos de tamaño desigual. Tengo ...
Función Strip o Regex en Spark 1.3 Dataframe
Tengo un código de PySpark 1.5 que desafortunadamente tengo que portar hacia atrás a Spark 1.3. Tengo una columna con elementos que son alfanuméricos pero solo quiero los dígitos. Un ejemplo de los elementos en 'old_col' de 'df' son: '125 ...
Múltiples operaciones agregadas en la misma columna de un marco de datos de chispa
Tengo tres matrices de tipo de cadena que contienen la siguiente información: matriz groupBy: contiene los nombres de las columnas por las que quiero agrupar mis datos.matriz agregada: contiene nombres de columnas que quiero agregar.matriz de ...
Manipule un marco de datos donde haya múltiples columnas para cada experimento.
Tengo muchos experimentos de secuenciación, cada uno con múltiples resultados para cada uno de unos pocos cientos de genes, cuando los datos salen de otro programa, no están en un formato útil para mí, ya que todos los Experimentos y cada ...
¿Cómo calcular el cambio porcentual en comparación con el valor inicial usando pandas?
tengo unDataFrame y necesitan calcular el cambio porcentual en comparación con el comienzo del año por parte de las compañías. ¿Hay alguna forma de usarpct_change() u otro método para realizar esta tarea? ¡Gracias! df parece security date price ...
spark.ml StringIndexer arroja 'Etiqueta invisible' en fit ()
Estoy preparando un juguetespark.ml ejemplo.Spark version 1.6.0, corriendo encima deOracle JDK version 1.8.0_65, pyspark, cuaderno de ipython. Primero, casi no tiene nada que ver conSpark, ML, StringIndexer: manejo de etiquetas ...
R data.frame obtiene el valor de la variable que es seleccionada por otra variable, vectorizada
Tengo datos que me llegan con muchas variables similares, con una variable adicional que indica quéuno de esas variables similares que realmente quiero. Utilizando un bucle, puedo buscar el valor correcto, pero los datos son grandes, el bucle es ...