Resultados da pesquisa a pedido "dataframe"
Criando loop no Pandas DataFrame com valor condicional na célula
No script abaixo, atribuo os valores 0 ou 1 se a célula DataFrame tiverNo ouYes neles. answer= {'account': ['Adam', 'Ben', 'Tom', 'Isabel'], 'a1': ['No', 'Yes', 'Yes', 'No'], 'a2': ['No', 'Yes', 'No', 'No'], 'a3': ['No', 'Yes', 'No', 'No'], ...
gráfico de pizza múltiplo para cada panda de linha
Eu gostaria de criar vários gráficos de pizza para cada continente para mostrar o álcool que serve com porcentagem. [/imgs/w34En.jpg] Obrigado
Converta a coluna Pyspark Dataframe da matriz para novas colunas
Eu tenho um Dataframe Pyspark com esta estrutura: root |-- Id: string (nullable = true) |-- Q: array (nullable = true) | |-- element: struct (containsNull = true) | | |-- pr: string (nullable = true) | | |-- qt: double (nullable = true)Algo ...
Dividir a coluna em colunas separadas com base nas seqüências de caracteres separadoras
Por exemplo, temos um arquivo csv com name age address john 25 koramangala banglore #@ sales maneger %$ india harshuth rao 36 belandur banglore #@ maneger %$ india vijay kumar 45 ulsoor banglore #@ sales maneger %$ india suhas 25 koramangala ...
Selecionando linhas em um quadro de dados MultiIndex por índice sem perder nenhum nível
Gostaria de selecionar uma linha chamada 'Mid', sem perder o índice 'Site' O código a seguir mostra o quadro de dados: m.commodity price max maxperstep Site Commodity Type Mid Biomass Stock 6.0 inf inf CO2 Env 0.0 inf inf Coal Stock 7.0 inf inf ...
À esquerda, justificar valores de sequência em um DataFrame do pandas
Portanto, eu tenho um DataFrame com mais de 180000 valores e preciso (1) substituir valores duplicados e determinados nas células por linha e (2) reorganizar. Aqui está o meu DataFrame, df: key sellyr brand makrc item1 item2 item3 item4 item5 ...
Expanda data.frame criando duplicatas com base na condição de grupo (2)
A partir de @AndrewGustar resposta / código:Expanda data.frame criando duplicatas com base na condição do grupo [https://stackoverflow.com/questions/44239415/expand-data-frame-by-creating-duplicates-based-on-group-condition] 1) E se eu tiver a ...
Filtragem de pandas para várias substrings em série
Eu preciso filtrar linhas em umpandas dataframe para que uma coluna específica contenha pelo menos uma de uma lista de substrings fornecidas. As substrings podem ter caracteres incomuns / regex. A comparação não deve envolver regex e faz ...
Calculando a semelhança de cosseno entre todas as linhas de um quadro de dados no pyspark
Eu tenho um conjunto de dados que contém trabalhadores com suas informações demográficas, como idade, sexo, endereço etc. e seus locais de trabalho. Criei um RDD a partir do conjunto de dados e o convertei em um DataFrame. Existem várias ...
Como recuperar linhas de um objeto Pandas GroupBy no loop for
Eu tenho um grupo por objeto.Eu quero recuperar linhas de uma coluna específica do grupo por objeto em para loop e fazer algum processamento. Por exemplo, estou fornecendo aqui um código de exemplo para agrupar por objeto df = pd.DataFrame({'A' ...