Resultados da pesquisa a pedido "dataframe"

1 a resposta

Criando loop no Pandas DataFrame com valor condicional na célula

No script abaixo, atribuo os valores 0 ou 1 se a célula DataFrame tiverNo ouYes neles. answer= {'account': ['Adam', 'Ben', 'Tom', 'Isabel'], 'a1': ['No', 'Yes', 'Yes', 'No'], 'a2': ['No', 'Yes', 'No', 'No'], 'a3': ['No', 'Yes', 'No', 'No'], ...

1 a resposta

gráfico de pizza múltiplo para cada panda de linha

Eu gostaria de criar vários gráficos de pizza para cada continente para mostrar o álcool que serve com porcentagem. [/imgs/w34En.jpg] Obrigado

2 a resposta

Converta a coluna Pyspark Dataframe da matriz para novas colunas

Eu tenho um Dataframe Pyspark com esta estrutura: root |-- Id: string (nullable = true) |-- Q: array (nullable = true) | |-- element: struct (containsNull = true) | | |-- pr: string (nullable = true) | | |-- qt: double (nullable = true)Algo ...

2 a resposta

Dividir a coluna em colunas separadas com base nas seqüências de caracteres separadoras

Por exemplo, temos um arquivo csv com name age address john 25 koramangala banglore #@ sales maneger %$ india harshuth rao 36 belandur banglore #@ maneger %$ india vijay kumar 45 ulsoor banglore #@ sales maneger %$ india suhas 25 koramangala ...

3 a resposta

Selecionando linhas em um quadro de dados MultiIndex por índice sem perder nenhum nível

Gostaria de selecionar uma linha chamada 'Mid', sem perder o índice 'Site' O código a seguir mostra o quadro de dados: m.commodity price max maxperstep Site Commodity Type Mid Biomass Stock 6.0 inf inf CO2 Env 0.0 inf inf Coal Stock 7.0 inf inf ...

1 a resposta

À esquerda, justificar valores de sequência em um DataFrame do pandas

Portanto, eu tenho um DataFrame com mais de 180000 valores e preciso (1) substituir valores duplicados e determinados nas células por linha e (2) reorganizar. Aqui está o meu DataFrame, df: key sellyr brand makrc item1 item2 item3 item4 item5 ...

1 a resposta

Expanda data.frame criando duplicatas com base na condição de grupo (2)

A partir de @AndrewGustar resposta / código:Expanda data.frame criando duplicatas com base na condição do grupo [https://stackoverflow.com/questions/44239415/expand-data-frame-by-creating-duplicates-based-on-group-condition] 1) E se eu tiver a ...

2 a resposta

Filtragem de pandas para várias substrings em série

Eu preciso filtrar linhas em umpandas dataframe para que uma coluna específica contenha pelo menos uma de uma lista de substrings fornecidas. As substrings podem ter caracteres incomuns / regex. A comparação não deve envolver regex e faz ...

1 a resposta

Calculando a semelhança de cosseno entre todas as linhas de um quadro de dados no pyspark

Eu tenho um conjunto de dados que contém trabalhadores com suas informações demográficas, como idade, sexo, endereço etc. e seus locais de trabalho. Criei um RDD a partir do conjunto de dados e o convertei em um DataFrame. Existem várias ...

1 a resposta

Como recuperar linhas de um objeto Pandas GroupBy no loop for

Eu tenho um grupo por objeto.Eu quero recuperar linhas de uma coluna específica do grupo por objeto em para loop e fazer algum processamento. Por exemplo, estou fornecendo aqui um código de exemplo para agrupar por objeto df = pd.DataFrame({'A' ...