Resultados da pesquisa a pedido "dataframe"
NullPointerException após extrair uma tabela Teradata com Scala / Spark
Preciso extrair uma tabela do Teradata (acesso somente leitura) para parquet com o Scala (2.11) / Spark (2.1.0). Estou construindo um quadro de dados que posso carregar com sucesso val df = ...
converter quadro de dados em nova lista
Eu tenho um data.frame NOAA_OLR_TEST NOAA_OLR_TEST <- structure(list(DATE_START = structure(c(1170720000, 1170806400, 1170892800, 1170979200, 1171065600, 1171152000, 1171238400, 1171324800, 1171411200, 1171497600), class = c("POSIXct", ...
Filtrando linhas em um conjunto de dados por colunas
Eu tenho a seguinte tabela: FN LN LN1 LN2 LN3 LN4 LN5 a b b x x x x a c b d e NA NA a d c a b x x a e b c d x eEstou filtrando registros para os quais o LN está presente no LN1 ao LN5. O código que eu usei: testFilter = filter(test, LN %in% ...
Dataframe do Pandas para JSON aninhado
Estou tentando converter um Dataframe do Pandas em um objeto JSON. Meu Dataframe contém dados no seguinte formato: student date grade course 0 Student_1 2017-06-25 93 ENGLISH 1 Student_2 2017-06-25 83 ENGLISH 2 Student_1 2017-06-25 93 MATH 3 ...
Anexar tfidf ao dataframe do pandas
Eu tenho a seguinte estrutura de pandas: col1 col2 col3 text 1 1 0 meaningful text 5 9 7 trees 7 8 2 textEu gostaria de vetorizá-lo usando um vetorizador tfidf. Isso, no entanto, retorna uma matriz de análise, que eu posso realmente transformar ...
Convertendo uma matriz numpy 2D em linhas do quadro de dados
Eu tenho uma lista que gostaria de fazer como uma linha. O mais próximo que cheguei foi usando essepostar [https://stackoverflow.com/questions/19112398/getting-list-of-lists-into-pandas-dataframe] . No entanto, não consegui minha resposta. Por ...
Mudando as abreviações de milhões / bilhões para números reais? ie 5,12M -> 5.120.000 [duplicado]
Esta pergunta já tem uma resposta aqui: Converta de bilhões para milhões e vice-versa [/questions/38013217/convert-from-billion-to-million-and-vice-versa] 6 respostas Como o título sugere, estou procurando uma maneira de transformar o ...
Substituir valores da coluna usando um dicionário
Eu tenho esse dataframe em que o sexo deve ser masculino ou feminino. from io import StringIO import pandas as pd audit_trail = StringIO(''' course_id AcademicYear_to months TotalFee Gender 260 2017 24 100 male 260 2018 12 140 male 274 2016 36 ...
Filtro de várias condições no quadro de dados
Alguém pode me explicar por que estou obtendo resultados diferentes para essas duas expressões? Estou tentando filtrar entre 2 datas: df.filter("act_date <='2017-04-01'" and "act_date ...
insere linhas entre datas por grupo
Quero inserir linhas entre duas datas por grupo. Minha maneira de fazer isso é tão complicada que insiro valores ausentes pela última observação, carrega para frente e depois mesclo. Eu queria saber se existe alguma maneira mais fácil ...