Resultados da pesquisa a pedido "dataframe"
Como combinar várias colunas no pandas DataFrame para um "intervalo"?
Eu tenho os seguintes pandas DataFrame: import pandas as pd df = pd.DataFrame('filename.csv') print(df) order start end value 1 1342 1357 category1 1 1459 1489 category7 1 1572 1601 category23 1 1587 1599 category2 1 1591 1639 category1 .... 15 ...
R: subconjunto de um quadro de dados com base nas condições de outro quadro de dados
Aqui está um problema que estou tentando resolver. Diga, eu tenho dois quadros de dados como o seguinte:
MemoryError em grandes mesclagens com pandas em Python
Estou usando pandas para fazer um
Pandas Python: indexação booleana em várias colunas [duplicado]
Esta questão já tem uma resposta aqui:selecionando através de múltiplas colunas com pandas python? 3 respostasapesar de haver pelo menosdois Boa tutoriais so...
adicionando uma coluna zscore agrupada a um dataframe do pandas
Eu posso inserir uma coluna em um dataframe que z-scores outra coluna como esta: [1] df.insert(<loc>, column='ZofA', value=(df['A']-df['A'].mean())/df['A'].std())Eu posso fazer uma redução simples de uma coluna agrupada por 2 outras colunas como ...
Pandas: excluir linhas com base em outras linhas
Eu tenho um dataframe de pandas que se parece com isso: qseqid sseqid qstart qend 2 1 125 345 4 1 150 320 3 2 150 450 6 2 25 300 8 2 50 500Gostaria de remover linhas com base em outros valores de linhas com estes critérios: Uma linha (r1) deve ...
Extrair coluna de data.frame como um vetor
Eu sou novo em R. Eu tenho um Data.frame com uma coluna chamada "Symbol". Symbol 1 "IDEA" 2 "PFC" 3 "RPL" 4 "SOBHA"Preciso armazenar seus valores como um vetor (x = c("IDEA","PFC","RPL","SOBHA")) Qual é a maneira mais concisa de fazer isso?
Como filtrar o quadro de dados Spark se uma coluna é membro de outra coluna
Eu tenho um quadro de dados com duas colunas (uma sequência e uma matriz de sequência): root |-- user: string (nullable = true) |-- users: array (nullable = true) | |-- element: string (containsNull = true)Como posso filtrar o quadro de dados ...
pandas restantes - por que mais resultados?
Como é possível que um panda deixado se junte como df.merge(df2, left_on='first', right_on='second', how='left')aumenta o quadro de dados de 221309 para 1388680 linhas? editarforma de df 1 (221309, 83) forma de df2 (7602, 6)