Resultados da pesquisa a pedido "dataframe"
Por que o id de uma célula de dataframe do pandas muda a cada execução?
Eu me deparei com esse problema quando estava tentando garantir algumas propriedades da exibição do quadro de dados. Suponha que eu tenha um quadro de dados definido como:df = pd.DataFrame(columns=list('abc'), data=np.arange(18).reshape(6, 3)) e ...
Python Jupyter Notebook imprimir bordas do quadro de dados
Provavelmente, tenho uma pergunta simples, mas não consigo encontrar uma solução online. Se eu criar um dataframe "df" em um notebook Jupyter e depois imprimi-lo usando print (), a tabela exibida no meu broswer não exibirá nenhuma borda. ...
dataframe de pandas exclui linhas com baixa frequência
Qual é a melhor prática para remover todas as linhas que possuem uma coluna com baixo valor de frequência? Quadro de dados: IN: foo bar poo 1 a A 2 a A 3 a B 4 b B 5 b A 6 b A 7 c C 8 d B 9 e BExemplo 1: Remova todas as linhas que tenham menos ...
Gerando variáveis de interação em quadros de dados R
Existe uma maneira - além do loop for - de gerar novas variáveis em um dataframe R, que serão todas as interações bidirecionais possíveis entre as existentes? ou seja, supondo um quadro de dados com três variáveis numéricas V1, V2, V3, ...
Importando muitos arquivos ao mesmo tempo e adicionando indicador de ID
Eu tenho 91 arquivos - formato .log: rajectory Log File Rock type: 2 (0: Sphere, 1: Cuboid, 2: Rock) Nr of Trajectories: 91 Trajectory-Mode: ON Average Slope (Degrees): 28.05 / 51.99 / 64.83 Filename: test_tschamut_Pos1.xml Z-offset: 1.32000 ...
Como adiciono `NA`s aleatórios a um quadro de dados
Eu criei um quadro de dados com valores aleatórios n <- 50 df <- data.frame(id = seq (1:n), age = sample(c(20:90), n, rep = TRUE), sex = sample(c("m", "f"), n, rep = TRUE, prob = c(0.55, 0.45)) )e gostaria de apresentar algunsNA valores para ...
Removendo nível de fator específico da variável de fator
Eu tenho um quadro de dados que tem várias variáveis que têm 5 níveis de fator. Eu quero excluir apenas um desses níveis. Primeiro, designei todas as instâncias desse nível a NA e depois usei odroplevels comando para se livrar dos ...
Importe vários arquivos CSV para pandas e concatene em um DataFrame
Gostaria de ler vários arquivos csv de um diretório para pandas e concatená-los em um grande DataFrame. Ainda não consegui descobrir. Aqui está o que eu tenho até agora: import glob import pandas as pd # get data file names ...
Definir nomes de colunas ao chamar uma função
Considere que temos um data.frame numéricofoo e deseja encontrar a soma de cada duas colunas: foo <- data.frame(x=1:5,y=4:8,z=10:14, w=8:4) bar <- combn(colnames(foo), 2, function(x) foo[,x[1]] + foo[,x[2]]) bar # [,1] [,2] [,3] [,4] [,5] [,6] ...
Mesclar vários registros em um dataframe com base em uma chave no scala spark
Eu tenho um quadro de dados que contém registros identificados por uma chave. Mas pode haver um caso em que uma chave pode se tornar repetitiva. Meu objetivo é mesclar todos os registros com base nessa chave da seguinte maneira Vamos supor que ...