Resultados da pesquisa a pedido "dataframe"
Extrair sequência da coluna seguindo um padrão específico
Perdoe minha pergunta sobre o panda novato, mas eu tenho uma coluna de cidades e estados dos EUA, como a versão truncada mostrada abaixo (Por alguma estranha razão, o nome da coluna é chamado 'Alabama [editar]', que está associado à primeira 0-7 ...
Localizar entrada vazia ou NaN no Pandas Dataframe
Estou tentando pesquisar um Dataframe do Pandas para descobrir onde ele tem uma entrada ausente ou uma entrada NaN. Aqui está um quadro de dados com o qual estou trabalhando: cl_id a c d e A1 A2 A3 0 1 -0.419279 0.843832 -0.530827 text76 ...
Combinar colunas em um DataFrame do Pandas com uma coluna de listas em um DataFrame
Considere o seguinteDataFrame. n v1 v2 v3 v4 v5 0 1 2 3 4 5 1 1 2 3 4 5 2 1 2 3 4 5Para cada linha, quero adicionar os valores dev2, v3, v4 para uma lista e multiplique os valores na lista comv5 e coloque o resultado em uma nova colunav6 de tal ...
Maneira vetorizada de contar ocorrências de sequência em uma das duas colunas
Eu tenho um problema que ésemelhante paraessa questão [https://stackoverflow.com/questions/39451385/how-to-count-the-number-of-occurrences-in-either-of-two-columns] , mas diferente o suficiente para que não possa ser resolvido com a mesma solução ...
Remodelar vários valores de uma só vez
Eu tenho um longo conjunto de dados que gostaria de ampliar e estou curioso para saber se existe uma maneira de fazer isso tudo em uma única etapa, usando os pacotes reshape2 ou tidyr em R. O quadro de dadosdf se parece com isso: id type ...
pandas: melhor maneira de selecionar todas as colunas cujos nomes começam com X
Eu tenho um DataFrame: import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], 'foo.fighters': [0, 1, np.nan, 0, 0, 0], 'foo.bars': [0, 0, 0, 0, 0, 1], 'bar.baz': [5, 5, 6, 5, 5.6, 6.8], 'foo.fox': ...
Como remover determinadas colunas em vários quadros de dados no R?
digamos que tenho muitos quadros de dados com nomes diferentes de colunas quase semelhantes. Como manipulo as colunas de quadros de dados individuais usando loops (ou qualquer outra maneira)? Por exemplo, quero remover a primeira coluna de todos ...
Compare duas colunas usando pandas
Usando isso como ponto de partida: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0Eu quero usar algo como umif ...
Insira NAs aleatoriamente no dataframe proporcionalmente
Eu tenho um quadro de dados completo. Desejo que 20% dos valores no quadro de dados sejam substituídos por NAs para simular dados ausentes aleatórios. A <- c(1:10) B <- c(11:20) C <- c(21:30) df<- data.frame(A,B,C)Alguém pode sugerir uma maneira ...
Subconjunto de colunas com base na lista de nomes de colunas e traz a coluna antes dela
Eu tenho um conjunto de dados maior seguindo a mesma ordem, uma coluna de data exclusiva, dados, coluna de data exclusiva, data etc. Estou tentando subconjunto não apenas a coluna de dados por nome, mas também a coluna de data exclusiva. O código ...