Resultados da pesquisa a pedido "dataframe"

1 a resposta

Python - TypeError: esperando um objeto string ou bytes

Após muita pesquisa, não consigo descobrir por que recebo esse erro no meu código. Estou tentando exportar um Dataframe do Pandas para minha tabela Oracle. Fiz isso com êxito centenas de vezes em outras tabelas de dados, mas esta ...

1 a resposta

Remover cifrão de todo o dataframe do Python Pandas

Eu estou olhando para remover cifrões de um dataframe de pandas python inteiro. É semelhante a este post: Remover personagem inteiro [https://stackoverflow.com/questions/42135409/removing-a-character-from-entire-data-frame] No entanto, estou ...

1 a resposta

Encontre todas as linhas duplicadas em um dataframe do pandas

Eu gostaria de obter os índices de todas as instâncias de uma linha duplicada em um conjunto de dados sem saber o nome e o número de colunas com antecedência. Então, suponha que eu tenho o seguinte: col 1 | 1 2 | 2 3 | 1 4 | 1 5 | 2Eu gostaria ...

3 a resposta

Definindo o esquema do DataFrame para uma tabela com 1500 colunas no Spark

Eu tenho uma tabela com cerca de 1500 colunas no SQL Server. Preciso ler os dados desta tabela, convertê-los no formato de tipo de dados adequado e inserir os registros no banco de dados Oracle. Qual é a melhor maneira de definir o esquema para ...

2 a resposta

Agregando com base em valores de linha "próximos"

Eu tenho um quadro de dados muito confuso (webscraped) que infelizmente tem muitas entradas duplas e até triplas. A maior parte do quadro de dados ...

4 a resposta

Obter o número atual de partições de um DataFrame

Existe alguma maneira de obter o número atual de partições de um DataFrame? Verifiquei o javadoc do DataFrame (spark 1.6) e não encontrei um método para isso, ou estou com saudades? (No caso de JavaRDD, existe um método getNumPartitions ().)

3 a resposta

Mesclar dois quadros de dados com base em valores de coluna comuns no Pandas

Como obter o quadro de dados mesclado de dois quadros de dados com valor de coluna comum, de modo que apenas essas linhas tornem o quadro de dados mesclado com valor comum em uma coluna específica. Eu tenho 5000 linhas dedf1 como formato: ...

1 a resposta

Por que quadros de dados idênticos se tornam diferentes ao alterar nomes de nomes para os mesmos

Eu me deparei com um comportamento estranho ao brincar com alguns quadros de dados: quando crio dois quadros de dados idênticosa,b, depois trocam seus nomes de domínio, eles não são idênticos: rm(list=ls()) a <- data.frame(a=c(1,2,3),b=c(2,3,4)) ...

3 a resposta

Como classificar o quadro de dados em R com preservação de ordem de coluna especificada?

Digamos que eu tenho um data.frame x <- data.frame(a = c('A','A','A','A','A', 'C','C','C','C', 'B','B','B'), b = c('a','c','a','a','c', 'd', 'e','e','d', 'b','b','b'), c = c( 7, 3, 2, 4, 5, 3, 1, 1, 5, 5, 2, 3), stringsAsFactors = FALSE) > x a b ...

1 a resposta

Como filtrar registros duplicados com várias chaves no Spark Dataframe?

Eu tenho dois quadros de dados. Desejo excluir alguns registros no Data Frame-A com base em alguns valores de coluna comuns no Data Frame-B. Por exemplo: Quadro de dados A: A B C D 1 2 3 4 3 4 5 7 4 7 9 6 2 5 7 9 Quadro de Dados-B: A B C D 1 2 ...