Resultados da pesquisa a pedido "dataframe"

4 a resposta

Dataframe do Python / Pandas substitui 0 pelo valor mediano

Eu tenho um dataframe python pandas com várias colunas e uma coluna tem0 valores. Eu quero substituir o0 valores com omedian oumean desta coluna. data é meu quadro de dados artist_hotness é a coluna mean_artist_hotness = ...

8 a resposta

python / pandas: converte int do mês em nome do mês

A maioria das informações que encontrei não estava em python> pandas> dataframe, daí a pergunta. Quero transformar um número inteiro entre 1 e 12 em um nome de mês abreviado. Eu tenho um df que se parece com: client Month 1 sss 02 2 yyy 12 3 ...

2 a resposta

Os pandas agrupam duas colunas e obtêm o ditado por valores

Eu tenho um dataframe de pandas: banned_titles = TitleId RelatedTitleId 0 89989 32598 1 89989 3085083 2 95281 3085083quando aplico groupby da seguinte maneira In [84]: banned_titles.groupby('TitleId').groups Out[84]: {89989: [0, 1], ...

2 a resposta

PySpark: condições múltiplas na cláusula when

Gostaria de modificar os valores das células de uma coluna de dataframe (Age) onde atualmente está em branco e só o faria se outra coluna (Survived) tiver o valor 0 para a linha correspondente onde está em branco para Age. Se for 1 na coluna ...

1 a resposta

Como alterar a classe do quadro de dados para o polígono espacial?

Eu encontrei o mesmo aquiComo converter quadro de dados em coordenadas espaciais [https://stackoverflow.com/questions/29736577/how-to-convert-data-frame-to-spatial-coordinates] . Mas no meu caso, obtive dados muito grandes. exchange longitude ...

2 a resposta

Como calcular o número de palavras em uma seqüência de caracteres no DataFrame? [duplicado]

Esta pergunta já tem uma resposta aqui: Contar o número de palavras por linha [/questions/49984905/count-number-of-words-per-row] 4 respostasSuponha que tenhamos Dataframe simples df = pd.DataFrame(['one apple','banana','box of oranges','pile ...

1 a resposta

Coluna Pivot String no Pyspark Dataframe

Eu tenho um quadro de dados simples como este: rdd = sc.parallelize( [ (0, "A", 223,"201603", "PORT"), (0, "A", 22,"201602", "PORT"), (0, "A", 422,"201601", "DOCK"), (1,"B", 3213,"201602", "DOCK"), (1,"B", 3213,"201601", "PORT"), (2,"C", ...

2 a resposta

Python - Acelere a conversão de uma variável categórica em seu índice numérico

Preciso converter uma coluna de variáveis categóricas em um quadro de dados do Pandas em um valor numérico que corresponde ao índice em uma matriz das variáveis categóricas exclusivas da coluna (história longa!) E aqui está um trecho de código ...

2 a resposta

Pandas Read_CSV cita questão

Eu tenho um arquivo que se parece com: 'colA'|'colB' 'word"A'|'A' 'word'B'|'B'Eu quero usarpd.read_csv('input.csv',sep='|', quotechar="'"), mas recebo a seguinte saída: colA colB word"A A wordB' BA última linha não está correta, deve serword'B ...

4 a resposta

Agregando várias colunas com função personalizada no Spark

Fiquei me perguntando se existe alguma maneira de especificar uma função de agregação personalizada para quadros de dados spark em várias colunas. Eu tenho uma tabela como esta do tipo (nome, item, preço): john | tomato | 1.99 john | carrot | ...