Resultados da pesquisa a pedido "dataframe"
Data.frame torna-se fator / vetor após filtragem / subconjunto
Eu tenho um data.frame com uma coluna, assim: >d = data.frame(animal=c("horse","dog","cat"))então eu o filtrei excluindo todos os itens também presentes em um vetor. por exemplo.: > res = d[!(d$animal %in% c("horse")),] > res [1] dog cat ...
Corresponda as linhas do quadro de dados de acordo com duas variáveis (indexação)
Estou essencialmente tentando obter dados desorganizados em forma longa para modelagem linear. Eu tenho 2 data.frames "rec" e "book" Cada linha no "livro" precisa ser colada no final de várias linhas de "rec" de acordo com duas variáveis na ...
Criando / acessando dataframe dentro da transformação de outro dataframe
Estou atualizando algum código existente para usar o Spark. Eu tenho vários quadros de dados que contêm conjuntos de dados diferentes. Ao transformar meu quadro de dados principal (ou meu conjunto de dados principal), preciso usar dados de outros ...
PySpark, principal para DataFrame
O que eu quero fazer é um DataFrame, pegue os n elementos principais de acordo com alguma coluna especificada. O topo (self, num) na API RDD é exatamente o que eu quero. Gostaria de saber se existe API equivalente no mundo DataFrame? Minha ...
Exclua linhas duplicadas com o mesmo valor em todas as colunas nos pandas
Eu tenho um quadro de dados com cerca de meio milhão de linhas. Como pude ver, há muitas linhas duplicadas; portanto, como posso remover linhas duplicadas com o mesmo valor em todas as colunas (cerca de 80 colunas), e não apenas em ...
Derretendo um dataframe de pandas
Eu tenho um quadro de dados como este NSW VIC 0 6718023 5023203 1 6735528 5048207 2 6742690 5061266 3 6766133 5083593 4 6786160 5103965Eu quero mudar assim 0 6718023 NSW 1 6735528 NSW 2 6742690 NSW 3 6766133 NSW 4 6786160 NSW 5 5023203 VIC 6 ...
Problemas ao adicionar uma nova coluna a um quadro de dados - spark / scala
Eu sou novo no spark / scala. Estou tentando ler alguns dados de uma tabela de seção para um dataframe spark e adicionar uma coluna com base em alguma condição. Aqui está o meu código: val DF = hiveContext.sql("select * from (select * from ...
python conta quantas vezes uma string está presente na linha inteira de um dataframe do pandas
Eu tenho uma pergunta com base no meu anteriorPergunta, questão [https://stackoverflow.com/questions/48330608/pandas-dataframe-search-sting-in-the-entire-row] . O código abaixo funciona bem e me diz se osearch_string está presente na ...
converter índice em coluna panda dataframe
Eu tenho os seguintes pandas dataframe: | id | LocTime |ZPos | XPos datetime | 2017-01-02 00:14:39 |20421902611| 12531245409231| 0 | -6 2017-01-02 00:14:40 |30453291020| 28332479673070| 0 | -2 Quero converter o índice de data e hora na coluna do ...
Configuração do formato da tabela de saída pandas.DataFrame
Onde posso configurar o Jupyter para fazer com que um objeto DataFrame apareça comotabela de borda completapor padrão? Agora fica assim: [/imgs/CHbnW.jpg] Eu gostaria que pudesse parecer com: [/imgs/VmxT7.jpg]