Resultados da pesquisa a pedido "dataframe"

1 a resposta

Por que o id de uma célula de dataframe do pandas muda a cada execução?

Eu me deparei com esse problema quando estava tentando garantir algumas propriedades da exibição do quadro de dados. Suponha que eu tenha um quadro de dados definido como:df = pd.DataFrame(columns=list('abc'), data=np.arange(18).reshape(6, 3)) e ...

3 a resposta

Python Jupyter Notebook imprimir bordas do quadro de dados

Provavelmente, tenho uma pergunta simples, mas não consigo encontrar uma solução online. Se eu criar um dataframe "df" em um notebook Jupyter e depois imprimi-lo usando print (), a tabela exibida no meu broswer não exibirá nenhuma borda. ...

1 a resposta

dataframe de pandas exclui linhas com baixa frequência

Qual é a melhor prática para remover todas as linhas que possuem uma coluna com baixo valor de frequência? Quadro de dados: IN: foo bar poo 1 a A 2 a A 3 a B 4 b B 5 b A 6 b A 7 c C 8 d B 9 e BExemplo 1: Remova todas as linhas que tenham menos ...

3 a resposta

Gerando variáveis de interação em quadros de dados R

Existe uma maneira - além do loop for - de gerar novas variáveis em um dataframe R, que serão todas as interações bidirecionais possíveis entre as existentes? ou seja, supondo um quadro de dados com três variáveis numéricas V1, V2, V3, ...

2 a resposta

Importando muitos arquivos ao mesmo tempo e adicionando indicador de ID

Eu tenho 91 arquivos - formato .log: rajectory Log File Rock type: 2 (0: Sphere, 1: Cuboid, 2: Rock) Nr of Trajectories: 91 Trajectory-Mode: ON Average Slope (Degrees): 28.05 / 51.99 / 64.83 Filename: test_tschamut_Pos1.xml Z-offset: 1.32000 ...

5 a resposta

Como adiciono `NA`s aleatórios a um quadro de dados

Eu criei um quadro de dados com valores aleatórios n <- 50 df <- data.frame(id = seq (1:n), age = sample(c(20:90), n, rep = TRUE), sex = sample(c("m", "f"), n, rep = TRUE, prob = c(0.55, 0.45)) )e gostaria de apresentar algunsNA valores para ...

2 a resposta

Removendo nível de fator específico da variável de fator

Eu tenho um quadro de dados que tem várias variáveis que têm 5 níveis de fator. Eu quero excluir apenas um desses níveis. Primeiro, designei todas as instâncias desse nível a NA e depois usei odroplevels comando para se livrar dos ...

11 a resposta

Importe vários arquivos CSV para pandas e concatene em um DataFrame

Gostaria de ler vários arquivos csv de um diretório para pandas e concatená-los em um grande DataFrame. Ainda não consegui descobrir. Aqui está o que eu tenho até agora: import glob import pandas as pd # get data file names ...

2 a resposta

Definir nomes de colunas ao chamar uma função

Considere que temos um data.frame numéricofoo e deseja encontrar a soma de cada duas colunas: foo <- data.frame(x=1:5,y=4:8,z=10:14, w=8:4) bar <- combn(colnames(foo), 2, function(x) foo[,x[1]] + foo[,x[2]]) bar # [,1] [,2] [,3] [,4] [,5] [,6] ...

1 a resposta

Mesclar vários registros em um dataframe com base em uma chave no scala spark

Eu tenho um quadro de dados que contém registros identificados por uma chave. Mas pode haver um caso em que uma chave pode se tornar repetitiva. Meu objetivo é mesclar todos os registros com base nessa chave da seguinte maneira Vamos supor que ...