Resultados da pesquisa a pedido "dataframe"
Remover linhas com Inf e NaN em R
Eu tenho os seguintes dados: > dat ID Gene Value1 Value2 1 NM_013468 Ankrd1 Inf Inf 2 NM_023785 Ppbp Inf Inf 3 NM_178666 Themis NaN Inf 4 NM_001161790 Mefv Inf Inf 5 NM_001161791 Mefv Inf Inf 6 NM_019453 Mefv Inf Inf 7 NM_008337 Ifng Inf Inf 8 ...
dplyr: selecione nomes de colunas que contenham espaço em branco
df <- structure(list(`a a` = 1:3, `a b` = 2:4), .Names = c("a a", "a b" ), row.names = c(NA, -3L), class = "data.frame")e os dados parecem a a a b 1 1 2 2 2 3 3 3 4Após a chamada para selecionar select(df, 'a a')dá Error in abs(ind[ind < 0]) : ...
Acrescentar linha ao Pandas DataFrame adiciona coluna 0
Estou criando um DataFrame do Pandas para armazenar dados. Infelizmente, não sei o número de linhas de dados que terei com antecedência. Então, minha abordagem foi a seguinte. Primeiro, declaro um DataFrame vazio. df = ...
Criando um quadro de dados de pandas com preenchimento zero
Qual é a melhor maneira de criar um quadro de dados de pandas preenchidos com zero de um determinado tamanho? Eu tenho usado: zero_data = np.zeros(shape=(len(data),len(feature_list))) d = pd.DataFrame(zero_data, columns=feature_list)Há uma ...
Agregação personalizada do Spark: collect_list + UDF vs UDAF
Geralmente, tenho a necessidade de realizar agregações personalizadas em quadros de dados no spark 2.1 e usei essas duas abordagens: usando groupby / collect_list para obter todos os valores em uma única linha e aplique um UDF para agregar os ...
Selecione as linhas de um data.frame que contêm apenas números em uma determinada coluna
Como selecionar apenas as linhas que contêm um número na colunab. a <- c(1,5,3,1,-8,6,-1) b <- c(4,-2,1,0,"c",2,"DX") df <- data.frame(a,b) df # a b # 1 1 4 # 2 5 -2 # 3 3 1 # 4 1 0 # 5 -8 c # 6 6 2 # 7 -1 DXA saída deve ficar assim: # a b # 1 ...
Como posso encontrar o índice de todos os NA em uma coluna de quadro de dados?
Eu tenho um quadro de dados e em uma coluna específica quero encontrar o índice de todosN / Dvalores. Como eu posso fazer isso?
R: Classifica colunas de um quadro de dados por um vetor de nomes de colunas
Eu tenho um data.frame que se parece com isso: que possui mais de 1000 colunas com nomes semelhantes. E eu tenho um vetor desses nomes de colunas que se parece com isso: O vetor é classificado pelo cluster_id (que vai até 11). Eu quero ...
adicionando colunas fictícias ao quadro de dados original
Eu tenho um quadro de dados assim: JOINED_CO GENDER EXEC_FULLNAME GVKEY YEAR CONAME BECAMECEO REJOIN LEFTOFC LEFTCO RELEFT REASON PAGE CO_PER_ROL 5622 NaN MALE Ira A. Eichner 1004 1992 AAR CORP 19550101 NaN 19961001 19990531 NaN RESIGNED 79 ...
A melhor maneira de armazenar dados de comprimento variável em um data.frame do R?
Eu tenho alguns dados de tipo misto que gostaria de armazenar em uma estrutura de dados R de algum tipo. Cada ponto de dados possui um conjunto de atributos fixos que podem ser numéricos, fatores ou caracteres 1-d e também um conjunto de dados de ...