Resultados da pesquisa a pedido "dataframe"
Python - TypeError: esperando um objeto string ou bytes
Após muita pesquisa, não consigo descobrir por que recebo esse erro no meu código. Estou tentando exportar um Dataframe do Pandas para minha tabela Oracle. Fiz isso com êxito centenas de vezes em outras tabelas de dados, mas esta ...
Remover cifrão de todo o dataframe do Python Pandas
Eu estou olhando para remover cifrões de um dataframe de pandas python inteiro. É semelhante a este post: Remover personagem inteiro [https://stackoverflow.com/questions/42135409/removing-a-character-from-entire-data-frame] No entanto, estou ...
Encontre todas as linhas duplicadas em um dataframe do pandas
Eu gostaria de obter os índices de todas as instâncias de uma linha duplicada em um conjunto de dados sem saber o nome e o número de colunas com antecedência. Então, suponha que eu tenho o seguinte: col 1 | 1 2 | 2 3 | 1 4 | 1 5 | 2Eu gostaria ...
Definindo o esquema do DataFrame para uma tabela com 1500 colunas no Spark
Eu tenho uma tabela com cerca de 1500 colunas no SQL Server. Preciso ler os dados desta tabela, convertê-los no formato de tipo de dados adequado e inserir os registros no banco de dados Oracle. Qual é a melhor maneira de definir o esquema para ...
Agregando com base em valores de linha "próximos"
Eu tenho um quadro de dados muito confuso (webscraped) que infelizmente tem muitas entradas duplas e até triplas. A maior parte do quadro de dados ...
Obter o número atual de partições de um DataFrame
Existe alguma maneira de obter o número atual de partições de um DataFrame? Verifiquei o javadoc do DataFrame (spark 1.6) e não encontrei um método para isso, ou estou com saudades? (No caso de JavaRDD, existe um método getNumPartitions ().)
Mesclar dois quadros de dados com base em valores de coluna comuns no Pandas
Como obter o quadro de dados mesclado de dois quadros de dados com valor de coluna comum, de modo que apenas essas linhas tornem o quadro de dados mesclado com valor comum em uma coluna específica. Eu tenho 5000 linhas dedf1 como formato: ...
Por que quadros de dados idênticos se tornam diferentes ao alterar nomes de nomes para os mesmos
Eu me deparei com um comportamento estranho ao brincar com alguns quadros de dados: quando crio dois quadros de dados idênticosa,b, depois trocam seus nomes de domínio, eles não são idênticos: rm(list=ls()) a <- data.frame(a=c(1,2,3),b=c(2,3,4)) ...
Como classificar o quadro de dados em R com preservação de ordem de coluna especificada?
Digamos que eu tenho um data.frame x <- data.frame(a = c('A','A','A','A','A', 'C','C','C','C', 'B','B','B'), b = c('a','c','a','a','c', 'd', 'e','e','d', 'b','b','b'), c = c( 7, 3, 2, 4, 5, 3, 1, 1, 5, 5, 2, 3), stringsAsFactors = FALSE) > x a b ...
Como filtrar registros duplicados com várias chaves no Spark Dataframe?
Eu tenho dois quadros de dados. Desejo excluir alguns registros no Data Frame-A com base em alguns valores de coluna comuns no Data Frame-B. Por exemplo: Quadro de dados A: A B C D 1 2 3 4 3 4 5 7 4 7 9 6 2 5 7 9 Quadro de Dados-B: A B C D 1 2 ...