Resultados da pesquisa a pedido "dataframe"
contando o número de valores maiores que 0 em R em várias colunas
Eu tenho um conjunto de dados myDF em R com as variáveis L1, L2, L3, L4. Como posso obter o número de observações em L2, L3 e L4 nessa área maior que 0? Eu gostaria de usar a função de subconjunto, só não sei como. Obrigado! L1 L2 L3 L4 1 1 0 2 ...
Comparando dois quadros de dados semelhantes e encontrando valores diferentes entre eles
Esta é uma pergunta aparentemente básica, peço desculpas antecipadamente se for uma pergunta duplicada. Olhei em volta e não vi nada. Eu tenho dois quadros de dados cheios de strings. Gostaria de ver se são duplicatas EXATAS uma da outra. Se ...
Maneira rápida (vetorizada) de encontrar pontos em um DF pertencentes a retângulos de tamanhos iguais (dados por dois pontos) do segundo DF
Eu tenho o quadro de dados "A" que se parece com isso: type latw lngs late lngn 0 1000 45.457966 9.174864 45.458030 9.174907 1 1000 45.457966 9.174864 45.458030 9.174907 2 1000 45.458030 9.174864 45.458094 9.174907 3 1000 45.458094 9.174864 ...
Arrume data.frame com nomes de coluna repetidos
Eu tenho um programa que me fornece dados neste formato toy file_path Condition Trial.Num A B C ID A B C ID A B C ID 1 root/some.extension Baseline 1 2 3 5 car 2 1 7 bike 4 9 0 plane 2 root/thing.extension Baseline 2 3 6 45 car 5 4 4 bike 9 5 4 ...
Mantenha apenas o valor mínimo para cada nível de fator
Eu tenho um problema que me incomoda há algum tempo ... espero que alguém aqui possa me ajudar. Eu tenho o seguinte quadro de dados f <- c('a','a','b','b','b','c','d','d','d','d') v1 <- c(1.3,10,2,10,10,1.1,10,3.1,10,10) v2 <- c(1:10) df <- ...
quadro de dados do tfidf com python
Eu tenho que classificar alguns sentimentos meu quadro de dados é assim Phrase Sentiment is it good movie positive wooow is it very goode positive bad movie negativeEu fiz algum pré-processamento como tokenização parar palavras decorrentes etc ...
Função len lenta no quadro de dados distribuído dask
Eu tenho testado como usar o dask (cluster com 20 núcleos) e estou surpreso com a velocidade que recebo ao chamar uma função len vs cortar através de loc. import dask.dataframe as dd from dask.distributed import Client client ...
“TypeError: os objetos 'DataFrame' são mutáveis e, portanto, não podem ser hashizados” ao classificar o índice de dataframe do pandas
Eu tenho um seguinte quadro de dadosh: In [24]: h.head() Out[24]: alpha1 alpha2 gamma1 gamma2 chi2min gender age filename F35_HC_532d.dat 0.0000 0.000 NaN 0.00 1.000000e+25 F 35 M48_HC_551d.dat 0.7353 3.943 0.425922 0.15 2.072617e+01 M 48 ...
coluna python pandas condicional em outros dois valores de coluna
Existe uma maneira nos pandas python de aplicar uma condicional se uma ou outra coluna tiver um valor? Para uma coluna, sei que posso usar o código a seguir, para aplicar um sinalizador de teste se o título da coluna incluir a palavra ...
Como extraio a data / ano / mês do dataframe do pandas?
Estou tentando extrair informações de ano / data / mês da coluna 'data' no dataframe do pandas. Aqui está o meu código de exemplo: from datetime import datetime def date_split(calendar): for row in calendar: new_calendar={} ...