Resultados da pesquisa a pedido "dataframe"

3 a resposta

Explodir listas com diferentes comprimentos no Pandas

Eu tenho um dataframe de pandas no qual uma das colunas contém listas com comprimentos diferentes. As soluções para explodir listas em pandas assumem que as listas a serem explodidas têm o mesmo comprimento. Este é o meu df: Dep Exp Fl-No ...

2 a resposta

Ocorreu um problema ao chamar o `str.len` em uma coluna de objeto do pandas

Eu tenho um DataFrame do Pandas com uma coluna de string chamadatitle e quero converter a entrada de cada linha no comprimento dessa string. Então "abcd" seria convertido para 4, etc. Eu estou fazendo isto: result_df['title'] = ...

2 a resposta

Adicionar coluna Número de dias à coluna Data no mesmo quadro de dados para o aplicativo Spark Scala

eu tenho umdataframe df decolumns ("id", "current_date", "days") e estou tentando adicionar o "days" para "current_date"e crie um novodataframe com novocolumn chamado "new_date"usando a função spark scaladate_add() val newDF = ...

1 a resposta

Como desenrolar a matriz no DataFrame (de JSON)?

Cada registro em um RDD contém um json. Estou usando o SQLContext para criar um DataFrame a partir do Json assim: val signalsJsonRdd = sqlContext.jsonRDD(signalsJson)Abaixo está o esquema. datapayload é uma matriz de itens. Eu quero explodir a ...

1 a resposta

Pandas - Dataframe grande em fatias em pedaços

Eu tenho um grande dataframe (> 3MM linhas) que estou tentando passar por uma função (a abaixo é bastante simplificada) e continuo recebendo umMemory Error mensagem. Eu acho que estou passando um quadro de dados muito grande para a função, ...

2 a resposta

Acessando dinamicamente uma coluna de dataframe do pandas

Considere este exemplo simples import pandas as pd df = pd.DataFrame({'one' : [1,2,3], 'two' : [1,0,0]}) df Out[9]: one two 0 1 1 1 2 0 2 3 0Eu quero escrever uma função que tome como entrada um quadro de dadosdf e uma colunamycol. Agora isso ...

2 a resposta

Gerar um dataframe de pandas a partir de orderdict?

Estou tentando criar um dataframe de pandas a partir de um decreto de ordem para preservar a ordem dos valores. Mas, por algum motivo, após a criação do quadro de dados, os campos são alterados novamente. Aqui está a lista de ...

5 a resposta

Criando uma nova coluna, dependendo da igualdade de duas outras colunas

Eu quero comparar os valores de duas colunas onde eu crio uma nova colunabin_crnn. Eu quero 1 se eles são iguais ou 0 se não. # coding: utf-8 import pandas as pd df = pd.read_csv('file.csv',sep=',') if df['crnn_pred']==df['manual_raw_value']: ...

2 a resposta

Filtrando dinamicamente um dataframe de pandas

Estou tentando filtrar um quadro de dados do pandas usando limites para três colunas import pandas as pd df = pd.DataFrame({"A" : [6, 2, 10, -5, 3], "B" : [2, 5, 3, 2, 6], "C" : [-5, 2, 1, 8, 2]}) df = df.loc[(df.A > 0) & (df.B > 2) & (df.C ...

1 a resposta

Por que o df.apply (tupla) funciona, mas não o df.apply (lista)?

Aqui está um quadro de dados: A B C 0 6 2 -5 1 2 5 2 2 10 3 1 3 -5 2 8 4 3 6 2Eu poderia recuperar uma coluna que é basicamente uma tupla de colunas do originaldf usandodf.apply: out = df.apply(tuple, 1) print(out) 0 (6, 2, -5) 1 (2, 5, 2) 2 ...