Resultados da pesquisa a pedido "data-science"

3 a resposta

A maneira mais simples de converter uma lista com vários vetores de comprimento em um data.frame em R

Aqui eu tenho uma lista com diferentes vetores de comprimento. E eu gostaria de obter um data.frame. Eu já vi muitas postagens sobre isso no SO (consulte ref), mas nenhuma delas é tão simples quanto eu esperava, porque essa é realmente uma tarefa ...

2 a resposta

Como saber qual modelo Keras é melhor?

Não entendo qual precisão na saída usar para comparar meus dois modelos Keras para ver qual é o melhor. Eu uso o "acc" (dos dados de treinamento?) Um ou o "val acc" (dos dados de validação?) Um? Existem accs e val accs diferentes para cada ...

6 a resposta

Onde eu chamo a função BatchNormalization no Keras?

Se eu quiser usar a função BatchNormalization no Keras, preciso chamá-la apenas uma vez no início? Eu li esta documentação para ele:http://keras.io/layers/normalization/ [http://keras.io/layers/normalization/] Não vejo para onde devo chamá-lo. ...

1 a resposta

Árvores de decisão Spark MLib: probabilidade de rótulos por recursos?

Eu consegui exibir as probabilidades totais do meulabels, por exemplo, depois de exibir minha árvore de decisão, tenho uma tabela: Total Predictions : 65% impressions 30% clicks 5% conversionsMas meu problema é encontrar probabilidades (ou ...

5 a resposta

normalização quantílica no dataframe de pandas

Simplificando, como aplicar a normalização quantílica em um grande dataframe do Pandas (provavelmente 2.000.000 de linhas) em Python? PS. Eu sei que existe um pacote chamado rpy2 que poderia executar R no subprocesso, usando normalização de ...

1 a resposta

pandas reset_index após groupby.value_counts ()

Estou tentando agrupar por uma coluna e calcular o valor conta em outra coluna. import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2], 'Amt':[20,20,20,30,30,30,30,40, 40,10, 10, 40,40,40]}) print(dftest)dftest parece A ...

1 a resposta

Como extraio a data / ano / mês do dataframe do pandas?

Estou tentando extrair informações de ano / data / mês da coluna 'data' no dataframe do pandas. Aqui está o meu código de exemplo: from datetime import datetime def date_split(calendar): for row in calendar: new_calendar={} ...

3 a resposta

ValueError: deve passar o DataFrame apenas com valores booleanos

Pergunta, questão Nesse arquivo de dados, os Estados Unidos são divididos em quatro regiões usando a coluna "REGION". Crie uma consulta que encontre os municípios que pertencem às regiões 1 ou 2, cujo nome começa com 'Washington' e cujo ...

1 a resposta

Como otimizar o código MAPE em Python?

Eu preciso ter uma função MAPE, mas não consegui encontrá-la em pacotes padrão ... Abaixo, minha implementação dessa função. def mape(actual, predict): tmp, n = 0.0, 0 for i in range(0, len(actual)): if actual[i] <> 0: tmp += ...

1 a resposta

GridSearchCV - XGBoost - Parada antecipada

Estou tentando fazer uma pesquisa por hiperparâmetro usando o GridSearchCV do scikit-learn no XGBoost. Durante a pesquisa em grade, eu gostaria que parasse cedo, pois reduz drasticamente o tempo de pesquisa e (espera) obter melhores resultados na ...