Resultados da pesquisa a pedido "dataframe"
Dataframe do Python / Pandas substitui 0 pelo valor mediano
Eu tenho um dataframe python pandas com várias colunas e uma coluna tem0 valores. Eu quero substituir o0 valores com omedian oumean desta coluna. data é meu quadro de dados artist_hotness é a coluna mean_artist_hotness = ...
python / pandas: converte int do mês em nome do mês
A maioria das informações que encontrei não estava em python> pandas> dataframe, daí a pergunta. Quero transformar um número inteiro entre 1 e 12 em um nome de mês abreviado. Eu tenho um df que se parece com: client Month 1 sss 02 2 yyy 12 3 ...
Os pandas agrupam duas colunas e obtêm o ditado por valores
Eu tenho um dataframe de pandas: banned_titles = TitleId RelatedTitleId 0 89989 32598 1 89989 3085083 2 95281 3085083quando aplico groupby da seguinte maneira In [84]: banned_titles.groupby('TitleId').groups Out[84]: {89989: [0, 1], ...
PySpark: condições múltiplas na cláusula when
Gostaria de modificar os valores das células de uma coluna de dataframe (Age) onde atualmente está em branco e só o faria se outra coluna (Survived) tiver o valor 0 para a linha correspondente onde está em branco para Age. Se for 1 na coluna ...
Como alterar a classe do quadro de dados para o polígono espacial?
Eu encontrei o mesmo aquiComo converter quadro de dados em coordenadas espaciais [https://stackoverflow.com/questions/29736577/how-to-convert-data-frame-to-spatial-coordinates] . Mas no meu caso, obtive dados muito grandes. exchange longitude ...
Como calcular o número de palavras em uma seqüência de caracteres no DataFrame? [duplicado]
Esta pergunta já tem uma resposta aqui: Contar o número de palavras por linha [/questions/49984905/count-number-of-words-per-row] 4 respostasSuponha que tenhamos Dataframe simples df = pd.DataFrame(['one apple','banana','box of oranges','pile ...
Coluna Pivot String no Pyspark Dataframe
Eu tenho um quadro de dados simples como este: rdd = sc.parallelize( [ (0, "A", 223,"201603", "PORT"), (0, "A", 22,"201602", "PORT"), (0, "A", 422,"201601", "DOCK"), (1,"B", 3213,"201602", "DOCK"), (1,"B", 3213,"201601", "PORT"), (2,"C", ...
Python - Acelere a conversão de uma variável categórica em seu índice numérico
Preciso converter uma coluna de variáveis categóricas em um quadro de dados do Pandas em um valor numérico que corresponde ao índice em uma matriz das variáveis categóricas exclusivas da coluna (história longa!) E aqui está um trecho de código ...
Pandas Read_CSV cita questão
Eu tenho um arquivo que se parece com: 'colA'|'colB' 'word"A'|'A' 'word'B'|'B'Eu quero usarpd.read_csv('input.csv',sep='|', quotechar="'"), mas recebo a seguinte saída: colA colB word"A A wordB' BA última linha não está correta, deve serword'B ...
Agregando várias colunas com função personalizada no Spark
Fiquei me perguntando se existe alguma maneira de especificar uma função de agregação personalizada para quadros de dados spark em várias colunas. Eu tenho uma tabela como esta do tipo (nome, item, preço): john | tomato | 1.99 john | carrot | ...