Resultados de la búsqueda a petición "dataframe"

1 la respuesta

Problemas al agregar una nueva columna a un marco de datos - spark / scala

Soy nuevo en spark / scala. Estoy tratando de leer algunos datos de una tabla de colmena en un marco de datos de chispa y luego agregar una columna basada en alguna condición. Aquí está mi código: val DF = hiveContext.sql("select * from (select ...

5 la respuesta

Filtrar filas en un conjunto de datos por columnas

Tengo la siguiente tabla: FN LN LN1 LN2 LN3 LN4 LN5 a b b x x x x a c b d e NA NA a d c a b x x a e b c d x eEstoy filtrando registros para los que LN está presente en LN1 a LN5. El código que usé: testFilter = filter(test, LN %in% c(LN1, LN2, ...

8 la respuesta

pandas valores únicos columnas múltiples

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)})¿Cuál es la mejor manera de devolver los valores únicos de 'Col1' y 'Col2'? La salida deseada ...

2 la respuesta

mutate_each / summaryise_each en dplyr: ¿cómo selecciono ciertas columnas y les doy nuevos nombres a las columnas mutadas?

Estoy un poco confundido sobre eldplyr verbomutate_each. Es bastante sencillo usar el básicomutate para transformar una columna de datos en, digamos, puntajes z, y crear una nueva columna en su data.frame (aquí con el nombrez_score_data): newDF ...

6 la respuesta

Reemplazar algunos valores en una columna de marco de datos de pandas con otro valor

Tengo un marco de datos de pandas df como se ilustra a continuación: BrandName Specialty A H B I ABC J D K AB LQuiero reemplazar 'ABC' y 'AB' en la columna BrandName por A. ¿Alguien puede ayudarme con esto?

4 la respuesta

calcular suma de filas y producto en data.frame

Me gustaría agregar una columna a mi data.frame en R que contenga sumas de fila y productos Considere seguir el siguiente marco de datos x y z 1 2 3 2 3 4 5 1 2Quiero obtener lo siguiente x y z sum prod 1 2 3 6 6 2 3 4 9 24 5 1 2 8 10Yo he ...

3 la respuesta

Encuentra una entrada vacía o NaN en el marco de datos de Pandas

Estoy tratando de buscar a través de un marco de datos de Pandas para encontrar dónde falta una entrada o una entrada NaN. Aquí hay un marco de datos con el que estoy trabajando: cl_id a c d e A1 A2 A3 0 1 -0.419279 0.843832 -0.530827 text76 ...

2 la respuesta

Reformar múltiples valores a la vez

Tengo un conjunto de datos largo que me gustaría ampliar y tengo curiosidad por saber si hay una manera de hacerlo todo en un solo paso utilizando los paquetes reshape2 o tidyr en R. El marco de datosdf Se ve como esto: id type transactions ...

4 la respuesta

pandas: la mejor manera de seleccionar todas las columnas cuyos nombres comienzan con X

Tengo un DataFrame: import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], 'foo.fighters': [0, 1, np.nan, 0, 0, 0], 'foo.bars': [0, 0, 0, 0, 0, 1], 'bar.baz': [5, 5, 6, 5, 5.6, 6.8], 'foo.fox': [2, ...

2 la respuesta

Python cuenta cuántas veces una cadena está presente en toda la fila de un marco de datos de pandas

Tengo una pregunta basada en mi anteriorpregunta [https://stackoverflow.com/questions/48330608/pandas-dataframe-search-sting-in-the-entire-row] . El siguiente código funciona bien y me dice si elsearch_string está presente en toda la fila o no. ...