Resultados da pesquisa a pedido "dataframe"

1 a resposta

Como adicionar um Spark Dataframe na parte inferior de outro dataframe?

Eu posso usarwithcolumnpara adicionar novas colunas a um Dataframe. Mas no scala como posso adicionar novas linhas a um DataFrame? Estou tentando adicionar um quadro de dados na parte inferior de outro. Portanto, como adicionar linhas no scala ...

6 a resposta

Dataframe do Pandas: como aplicar o description () a cada grupo e adicionar a novas colunas?

df: name score A 1 A 2 A 3 A 4 A 5 B 2 B 4 B 6 B 8Deseja obter o seguinte novo quadro de dados na forma abaixo: name count mean std min 25% 50% 75% max A 5 3 .. .. .. .. .. .. B 4 5 .. .. .. .. .. ..Como extrair as informações de df.describe () ...

2 a resposta

Python-pandas Substitua NA pela mediana ou média de um grupo no dataframe

Suponha que tenhamos um df: A B apple 1.0 apple 2.0 apple NA orange NA orange 7.0 melon 14.0 melon NA melon 15.0 melon 16.0para substituir o NA, podemos usar df ["B"]. fillna (df ["B"]. mediana ()), mas preencherá NA com a mediana de todos os ...

3 a resposta

Divida o valor de um data.frame e crie uma linha adicional para armazenar seu componente

Em R, eu tenho um quadro de dados chamadodfcomo o seguinte: A B C D a1 b1 c1 2,5 a2 b2 c2 3,5 a3 b3 c3 5 - 7 a4 b4 c4 2,5 Eu quero dividir o valor da terceira linha eDcoluna pelo traço e crie outra linha para o segundo valor, mantendo os ...

3 a resposta

filtragem de quadro de dados com base em NA em várias colunas

Eu tenho o seguinte quadro de dados, vamos chamá-lo df id type company 1 NA NA 2 NA ADM 3 North Alex 4 South NA NA North BDA 6 NA CA Quero manter apenas os registros que não possuem NA na coluna "tipo" e "empresa" id type company 3 North Alex ...

2 a resposta

Lista nomeada aninhada no quadro de dados

Eu tenho o seguinte resultado da lista nomeada de uma análise. O código reproduzível é o seguinte: list(structure(c(-213.555409754509, -212.033637890131, -212.029474755074, -211.320398316741, -211.158815833294, -210.470525157849), .Names = ...

3 a resposta

A maneira mais simples de converter uma lista com vários vetores de comprimento em um data.frame em R

Aqui eu tenho uma lista com diferentes vetores de comprimento. E eu gostaria de obter um data.frame. Eu já vi muitas postagens sobre isso no SO (consulte ref), mas nenhuma delas é tão simples quanto eu esperava, porque essa é realmente uma tarefa ...

2 a resposta

como ler determinadas colunas do Excel usando o Pandas - Python

Estou lendo uma planilha do Excel e quero ler determinadas colunas: coluna 0 porque é o índice de linha e as colunas 22:37. Agora, aqui está o que eu faço: import pandas as pd import numpy as np file_loc = "path.xlsx" df ...

3 a resposta

python - Usando estruturas de pandas com csv grande (iterar e chunksize)

Eu tenho um arquivo csv grande, cerca de 600mb com 11 milhões de linhas e quero criar dados estatísticos como pivôs, histogramas, gráficos etc. Obviamente, tentando apenas ler normalmente: df = pd.read_csv('Check400_900.csv', sep='\t')não ...

3 a resposta

Não é possível descartar NAN com dropna em pandas

Eu importo pandas como pd e corro o código abaixo e obtenho o seguinte resultado Código: traindataset = pd.read_csv('/Users/train.csv') print traindataset.dtypes print traindataset.shape print traindataset.iloc[25,3] ...