Resultados da pesquisa a pedido "dataframe"
Scala: Como obter um intervalo de linhas em um dataframe
eu tenho umDataFrame criado executandosqlContext.read de um arquivo de parquet. oDataFrame consiste em 300 M. linhas. Preciso usar essas linhas como entrada para outra função, mas quero fazê-lo em lotes menores para evitar erros de ...
Mesclar dados com a mesma chave em uma linha [duplicado]
Esta pergunta já tem uma resposta aqui: Como remodelar dados de formato longo para amplo? [/questions/5890584/how-to-reshape-data-from-long-to-wide-format] 9 respostasEu tenho um quadro de dados com vários dados como este Key A B C 1 1 2 3 1 4 ...
Como concatenar vários valores de coluna em uma única coluna no dataframe do Panda
Esta pergunta é igual apublicado [https://stackoverflow.com/questions/11858472/pandas-combine-string-and-int-columns] mais cedo. Quero concatenar três colunas em vez de concatenar duas colunas: Aqui está a combinação de duas colunas: df = ...
Pandas: remova duplicatas reversas do dataframe
Eu tenho um quadro de dados com duas colunas,A eB. A ordem deA eB não é importante neste contexto; por exemplo, eu consideraria(0,50) e(50,0) para ser duplicado. Nos pandas, qual é uma maneira eficiente de remover essas duplicatas de um ...
Salve a coluna pandas (string / objeto) como VARCHAR no Oracle DB em vez de CLOB (comportamento padrão)
Estou tentando transferir um dataframe para o banco de dados oracle, mas a transferência está demorando muito, porque o tipo de dados da variável está mostrando comoclobno oráculo. No entanto, acredito que se eu converter o tipo de dados decloba ...
Qual é o tamanho máximo para um objeto de transmissão no Spark?
Ao usar o Dataframetransmissão [http://spark.apache.org/docs/2.0.0/api/java/org/apache/spark/sql/functions.html#broadcast(org.apache.spark.sql.Dataset)] função ou o ...
Agrupamento de dataframe R por valores conectados
Não encontrei uma solução para esse problema comum de agrupamento no R: Este é o meu conjunto de dados original ID State 1 A 2 A 3 B 4 B 5 B 6 A 7 A 8 A 9 C 10 CEsse deve ser meu conjunto de dados resultante agrupado State min(ID) max(ID) A 1 ...
Quando aplicar (pd.to_numeric) e quando astype (np.float64) em python?
Eu tenho um objeto DataFrame do pandas chamadoxiv que tem uma coluna deint64 Medições de volume. In[]: xiv['Volume'].head(5) Out[]: 0 252000 1 484000 2 62000 3 168000 4 232000 Name: Volume, dtype: int64Eu li outras postagens ...
como converter dados mensais para trimestrais em pandas
Eu tenho dados mensais. Quero convertê-lo para "períodos" de 3 meses, onde o primeiro trimestre começa em janeiro. Portanto, no exemplo abaixo, os primeiros 3 meses de agregação se traduziriam no início do segundo trimestre (formato desejado: ...
Python - dividindo o quadro de dados em vários quadros de dados com base nos valores das colunas e nomeando-os com esses valores [duplicado]
Esta pergunta já tem uma resposta aqui: Dividindo o quadro de dados em vários quadros de dados [/questions/19790790/splitting-dataframe-into-multiple-dataframes] 9 respostasEu tenho um grande conjunto de dados que lista produtos concorrentes à ...