Resultados da pesquisa a pedido "dataframe"

1 a resposta

Scala: Como obter um intervalo de linhas em um dataframe

eu tenho umDataFrame criado executandosqlContext.read de um arquivo de parquet. oDataFrame consiste em 300 M. linhas. Preciso usar essas linhas como entrada para outra função, mas quero fazê-lo em lotes menores para evitar erros de ...

1 a resposta

Mesclar dados com a mesma chave em uma linha [duplicado]

Esta pergunta já tem uma resposta aqui: Como remodelar dados de formato longo para amplo? [/questions/5890584/how-to-reshape-data-from-long-to-wide-format] 9 respostasEu tenho um quadro de dados com vários dados como este Key A B C 1 1 2 3 1 4 ...

7 a resposta

Como concatenar vários valores de coluna em uma única coluna no dataframe do Panda

Esta pergunta é igual apublicado [https://stackoverflow.com/questions/11858472/pandas-combine-string-and-int-columns] mais cedo. Quero concatenar três colunas em vez de concatenar duas colunas: Aqui está a combinação de duas colunas: df = ...

1 a resposta

Pandas: remova duplicatas reversas do dataframe

Eu tenho um quadro de dados com duas colunas,A eB. A ordem deA eB não é importante neste contexto; por exemplo, eu consideraria(0,50) e(50,0) para ser duplicado. Nos pandas, qual é uma maneira eficiente de remover essas duplicatas de um ...

2 a resposta

Salve a coluna pandas (string / objeto) como VARCHAR no Oracle DB em vez de CLOB (comportamento padrão)

Estou tentando transferir um dataframe para o banco de dados oracle, mas a transferência está demorando muito, porque o tipo de dados da variável está mostrando comoclobno oráculo. No entanto, acredito que se eu converter o tipo de dados decloba ...

1 a resposta

Qual é o tamanho máximo para um objeto de transmissão no Spark?

Ao usar o Dataframetransmissão [http://spark.apache.org/docs/2.0.0/api/java/org/apache/spark/sql/functions.html#broadcast(org.apache.spark.sql.Dataset)] função ou o ...

4 a resposta

Agrupamento de dataframe R por valores conectados

Não encontrei uma solução para esse problema comum de agrupamento no R: Este é o meu conjunto de dados original ID State 1 A 2 A 3 B 4 B 5 B 6 A 7 A 8 A 9 C 10 CEsse deve ser meu conjunto de dados resultante agrupado State min(ID) max(ID) A 1 ...

3 a resposta

Quando aplicar (pd.to_numeric) e quando astype (np.float64) em python?

Eu tenho um objeto DataFrame do pandas chamadoxiv que tem uma coluna deint64 Medições de volume. In[]: xiv['Volume'].head(5) Out[]: 0 252000 1 484000 2 62000 3 168000 4 232000 Name: Volume, dtype: int64Eu li outras postagens ...

1 a resposta

como converter dados mensais para trimestrais em pandas

Eu tenho dados mensais. Quero convertê-lo para "períodos" de 3 meses, onde o primeiro trimestre começa em janeiro. Portanto, no exemplo abaixo, os primeiros 3 meses de agregação se traduziriam no início do segundo trimestre (formato desejado: ...

1 a resposta

Python - dividindo o quadro de dados em vários quadros de dados com base nos valores das colunas e nomeando-os com esses valores [duplicado]

Esta pergunta já tem uma resposta aqui: Dividindo o quadro de dados em vários quadros de dados [/questions/19790790/splitting-dataframe-into-multiple-dataframes] 9 respostasEu tenho um grande conjunto de dados que lista produtos concorrentes à ...