Resultados da pesquisa a pedido "data-science"
A maneira mais simples de converter uma lista com vários vetores de comprimento em um data.frame em R
Aqui eu tenho uma lista com diferentes vetores de comprimento. E eu gostaria de obter um data.frame. Eu já vi muitas postagens sobre isso no SO (consulte ref), mas nenhuma delas é tão simples quanto eu esperava, porque essa é realmente uma tarefa ...
Como saber qual modelo Keras é melhor?
Não entendo qual precisão na saída usar para comparar meus dois modelos Keras para ver qual é o melhor. Eu uso o "acc" (dos dados de treinamento?) Um ou o "val acc" (dos dados de validação?) Um? Existem accs e val accs diferentes para cada ...
Onde eu chamo a função BatchNormalization no Keras?
Se eu quiser usar a função BatchNormalization no Keras, preciso chamá-la apenas uma vez no início? Eu li esta documentação para ele:http://keras.io/layers/normalization/ [http://keras.io/layers/normalization/] Não vejo para onde devo chamá-lo. ...
Árvores de decisão Spark MLib: probabilidade de rótulos por recursos?
Eu consegui exibir as probabilidades totais do meulabels, por exemplo, depois de exibir minha árvore de decisão, tenho uma tabela: Total Predictions : 65% impressions 30% clicks 5% conversionsMas meu problema é encontrar probabilidades (ou ...
normalização quantílica no dataframe de pandas
Simplificando, como aplicar a normalização quantílica em um grande dataframe do Pandas (provavelmente 2.000.000 de linhas) em Python? PS. Eu sei que existe um pacote chamado rpy2 que poderia executar R no subprocesso, usando normalização de ...
pandas reset_index após groupby.value_counts ()
Estou tentando agrupar por uma coluna e calcular o valor conta em outra coluna. import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2], 'Amt':[20,20,20,30,30,30,30,40, 40,10, 10, 40,40,40]}) print(dftest)dftest parece A ...
Como extraio a data / ano / mês do dataframe do pandas?
Estou tentando extrair informações de ano / data / mês da coluna 'data' no dataframe do pandas. Aqui está o meu código de exemplo: from datetime import datetime def date_split(calendar): for row in calendar: new_calendar={} ...
ValueError: deve passar o DataFrame apenas com valores booleanos
Pergunta, questão Nesse arquivo de dados, os Estados Unidos são divididos em quatro regiões usando a coluna "REGION". Crie uma consulta que encontre os municípios que pertencem às regiões 1 ou 2, cujo nome começa com 'Washington' e cujo ...
Como otimizar o código MAPE em Python?
Eu preciso ter uma função MAPE, mas não consegui encontrá-la em pacotes padrão ... Abaixo, minha implementação dessa função. def mape(actual, predict): tmp, n = 0.0, 0 for i in range(0, len(actual)): if actual[i] <> 0: tmp += ...
GridSearchCV - XGBoost - Parada antecipada
Estou tentando fazer uma pesquisa por hiperparâmetro usando o GridSearchCV do scikit-learn no XGBoost. Durante a pesquisa em grade, eu gostaria que parasse cedo, pois reduz drasticamente o tempo de pesquisa e (espera) obter melhores resultados na ...