Resultados da pesquisa a pedido "dataframe"
Remova o primeiro x número de caracteres de cada linha em uma coluna de um quadro de dados Python
Eu tenho um quadro de dados Python com cerca de 1.500 linhas e 15 colunas. Com uma coluna específica, eu gostaria de remover os 3 primeiros caracteres de cada linha. Como um exemplo simples, aqui está um quadro de dados: import pandas as pd d = ...
Data.frame “incorporado” em R. Como é, como é chamado, por que se comporta dessa maneira?
Eu tenho a seguinte estrutura de dados em R: df <- structure( list( ID = c(1L, 2L, 3L, 4L, 5L), var1 = c('a', 'b', 'c', 'd', 'e'), var2 = structure( list( var2a = c('v', 'w', 'x', 'y', 'z'), var2b = c('vv', 'ww', 'xx', 'yy', 'zz')), .Names = ...
Usando o Pandas para encontrar valores mínimos de linhas agrupadas
Esta pode ser uma pergunta trivial, mas ainda estou tentando descobrir pandas / numpy. Então, suponha que eu tenha uma tabela com a seguinte estrutura: group_id | col1 | col2 | col3 | "A" | "B" x | 1 | 2 | 3 | NaN | 1 x | 3 | 2 | 3 | 1 | 1 x | ...
Comparação booleana de pandas no dataframe
Estou recebendo o erro quando faço uma comparação em um único elemento em um quadro de dados, mas não entendo o porquê. Eu tenho um dataframe df com dados de séries temporais para vários clientes, com alguns valores nulos: df.head() 8143511 ...
Grupo de pandas Python por agregado em várias colunas e, em seguida, dinâmico
No Python, eu tenho um DataFrame do pandas semelhante ao seguinte: Item | shop1 | shop2 | shop3 | Category ------------------------------------ Shoes| 45 | 50 | 53 | Clothes TV | 200 | 300 | 250 | Technology Book | 20 | 17 | 21 | Books phone| ...
Substitua as palavras verificando no dataframe do pandas
Eu tenho um quadro de dados como abaixo. ID Word Synonyms ------------------------ 1 drove drive 2 office downtown 3 everyday daily 4 day daily 5 work downtownEstou lendo uma frase e gostaria de substituir as palavras nessa frase pelos ...
Remova caracteres não ASCII das colunas de string nos pandas
Eu tenho o panda dataframe com várias colunas que se misturavam com valores e caracteres indesejados. columnA columnB columnC ColumnD \x00A\X00B NULL \x00C\x00D 123 \x00E\X00F NULL NULL 456o que eu gostaria de fazer é criar esse quadro de dados ...
Caso aninhado Spark Dataframe When
Preciso implementar a lógica SQL abaixo no SparkDataFrame SELECT KEY, CASE WHEN tc in ('a','b') THEN 'Y' WHEN tc in ('a') AND amt > 0 THEN 'N' ELSE NULL END REASON, FROM dataset1;Minha entradaDataFrame é como abaixo: val dataset1 = Seq((66, ...
Python Pandas - Atualizar uma coluna de quadro de dados com valores de outro
Estou tentando melhorar em Python e decidi fazer algumas análises em uma das minhas paixões. Luta livre! Neste caso, luta livre japonesa! Basicamente, estou tentando atualizar valores em um quadro de dados de outro quadro de dados. Aqui está a ...
Qual é a diferença entre combine_first e fillna?
Essas duas funções parecem equivalentes para mim. Você pode ver que eles alcançam o mesmo objetivo no código abaixo, pois as colunas c e d são iguais. Então, quando devo usar um sobre o outro? Aqui está um exemplo: import pandas as pd import ...