Resultados da pesquisa a pedido "dataframe"

2 a resposta

contando o número de valores maiores que 0 em R em várias colunas

Eu tenho um conjunto de dados myDF em R com as variáveis L1, L2, L3, L4. Como posso obter o número de observações em L2, L3 e L4 nessa área maior que 0? Eu gostaria de usar a função de subconjunto, só não sei como. Obrigado! L1 L2 L3 L4 1 1 0 2 ...

1 a resposta

Comparando dois quadros de dados semelhantes e encontrando valores diferentes entre eles

Esta é uma pergunta aparentemente básica, peço desculpas antecipadamente se for uma pergunta duplicada. Olhei em volta e não vi nada. Eu tenho dois quadros de dados cheios de strings. Gostaria de ver se são duplicatas EXATAS uma da outra. Se ...

3 a resposta

Maneira rápida (vetorizada) de encontrar pontos em um DF pertencentes a retângulos de tamanhos iguais (dados por dois pontos) do segundo DF

Eu tenho o quadro de dados "A" que se parece com isso: type latw lngs late lngn 0 1000 45.457966 9.174864 45.458030 9.174907 1 1000 45.457966 9.174864 45.458030 9.174907 2 1000 45.458030 9.174864 45.458094 9.174907 3 1000 45.458094 9.174864 ...

1 a resposta

Arrume data.frame com nomes de coluna repetidos

Eu tenho um programa que me fornece dados neste formato toy file_path Condition Trial.Num A B C ID A B C ID A B C ID 1 root/some.extension Baseline 1 2 3 5 car 2 1 7 bike 4 9 0 plane 2 root/thing.extension Baseline 2 3 6 45 car 5 4 4 bike 9 5 4 ...

9 a resposta

Mantenha apenas o valor mínimo para cada nível de fator

Eu tenho um problema que me incomoda há algum tempo ... espero que alguém aqui possa me ajudar. Eu tenho o seguinte quadro de dados f <- c('a','a','b','b','b','c','d','d','d','d') v1 <- c(1.3,10,2,10,10,1.1,10,3.1,10,10) v2 <- c(1:10) df <- ...

2 a resposta

quadro de dados do tfidf com python

Eu tenho que classificar alguns sentimentos meu quadro de dados é assim Phrase Sentiment is it good movie positive wooow is it very goode positive bad movie negativeEu fiz algum pré-processamento como tokenização parar palavras decorrentes etc ...

1 a resposta

Função len lenta no quadro de dados distribuído dask

Eu tenho testado como usar o dask (cluster com 20 núcleos) e estou surpreso com a velocidade que recebo ao chamar uma função len vs cortar através de loc. import dask.dataframe as dd from dask.distributed import Client client ...

2 a resposta

“TypeError: os objetos 'DataFrame' são mutáveis e, portanto, não podem ser hashizados” ao classificar o índice de dataframe do pandas

Eu tenho um seguinte quadro de dadosh: In [24]: h.head() Out[24]: alpha1 alpha2 gamma1 gamma2 chi2min gender age filename F35_HC_532d.dat 0.0000 0.000 NaN 0.00 1.000000e+25 F 35 M48_HC_551d.dat 0.7353 3.943 0.425922 0.15 2.072617e+01 M 48 ...

3 a resposta

coluna python pandas condicional em outros dois valores de coluna

Existe uma maneira nos pandas python de aplicar uma condicional se uma ou outra coluna tiver um valor? Para uma coluna, sei que posso usar o código a seguir, para aplicar um sinalizador de teste se o título da coluna incluir a palavra ...

1 a resposta

Como extraio a data / ano / mês do dataframe do pandas?

Estou tentando extrair informações de ano / data / mês da coluna 'data' no dataframe do pandas. Aqui está o meu código de exemplo: from datetime import datetime def date_split(calendar): for row in calendar: new_calendar={} ...