Resultados da pesquisa a pedido "dataframe"
Explodir listas com diferentes comprimentos no Pandas
Eu tenho um dataframe de pandas no qual uma das colunas contém listas com comprimentos diferentes. As soluções para explodir listas em pandas assumem que as listas a serem explodidas têm o mesmo comprimento. Este é o meu df: Dep Exp Fl-No ...
Ocorreu um problema ao chamar o `str.len` em uma coluna de objeto do pandas
Eu tenho um DataFrame do Pandas com uma coluna de string chamadatitle e quero converter a entrada de cada linha no comprimento dessa string. Então "abcd" seria convertido para 4, etc. Eu estou fazendo isto: result_df['title'] = ...
Adicionar coluna Número de dias à coluna Data no mesmo quadro de dados para o aplicativo Spark Scala
eu tenho umdataframe df decolumns ("id", "current_date", "days") e estou tentando adicionar o "days" para "current_date"e crie um novodataframe com novocolumn chamado "new_date"usando a função spark scaladate_add() val newDF = ...
Como desenrolar a matriz no DataFrame (de JSON)?
Cada registro em um RDD contém um json. Estou usando o SQLContext para criar um DataFrame a partir do Json assim: val signalsJsonRdd = sqlContext.jsonRDD(signalsJson)Abaixo está o esquema. datapayload é uma matriz de itens. Eu quero explodir a ...
Pandas - Dataframe grande em fatias em pedaços
Eu tenho um grande dataframe (> 3MM linhas) que estou tentando passar por uma função (a abaixo é bastante simplificada) e continuo recebendo umMemory Error mensagem. Eu acho que estou passando um quadro de dados muito grande para a função, ...
Acessando dinamicamente uma coluna de dataframe do pandas
Considere este exemplo simples import pandas as pd df = pd.DataFrame({'one' : [1,2,3], 'two' : [1,0,0]}) df Out[9]: one two 0 1 1 1 2 0 2 3 0Eu quero escrever uma função que tome como entrada um quadro de dadosdf e uma colunamycol. Agora isso ...
Gerar um dataframe de pandas a partir de orderdict?
Estou tentando criar um dataframe de pandas a partir de um decreto de ordem para preservar a ordem dos valores. Mas, por algum motivo, após a criação do quadro de dados, os campos são alterados novamente. Aqui está a lista de ...
Criando uma nova coluna, dependendo da igualdade de duas outras colunas
Eu quero comparar os valores de duas colunas onde eu crio uma nova colunabin_crnn. Eu quero 1 se eles são iguais ou 0 se não. # coding: utf-8 import pandas as pd df = pd.read_csv('file.csv',sep=',') if df['crnn_pred']==df['manual_raw_value']: ...
Filtrando dinamicamente um dataframe de pandas
Estou tentando filtrar um quadro de dados do pandas usando limites para três colunas import pandas as pd df = pd.DataFrame({"A" : [6, 2, 10, -5, 3], "B" : [2, 5, 3, 2, 6], "C" : [-5, 2, 1, 8, 2]}) df = df.loc[(df.A > 0) & (df.B > 2) & (df.C ...
Por que o df.apply (tupla) funciona, mas não o df.apply (lista)?
Aqui está um quadro de dados: A B C 0 6 2 -5 1 2 5 2 2 10 3 1 3 -5 2 8 4 3 6 2Eu poderia recuperar uma coluna que é basicamente uma tupla de colunas do originaldf usandodf.apply: out = df.apply(tuple, 1) print(out) 0 (6, 2, -5) 1 (2, 5, 2) 2 ...