Resultados da pesquisa a pedido "data-science"

3 a resposta

A maneira mais simples de converter uma lista com vários vetores de comprimento em um data.frame em R

Aqui eu tenho uma lista com diferentes vetores de comprimento. E eu gostaria de obter um data.frame. Eu já vi muitas postagens sobre isso no SO (consulte ref), mas nenhuma delas é tão simples quanto eu esperava, porque essa é realmente uma tarefa ...

1 a resposta

Configuração específica do servidor postgresql para fins de análise de dados

Há alguma dica sobre o desempenho do servidor de ajuste usando o arquivo postgresql.conf, caso você use um banco de dados postgresqlespecificament para o departamento de ciência de dados e para fins de análise de dados? Ou o ajuste de desempenho ...

1 a resposta

Sparklyr: use group_by e concatene seqüências de caracteres de linhas em um grupo

Eu estou tentando usar as funções group_by () e mutate () no sparklyr para concatenar linhas em um grupo. Aqui está um exemplo simples que acho que deve funcionar, mas não funciona: library(sparkylr) d <- data.frame(id=c("1", "1", "2", "2", ...

10 a resposta

'Conda' não é reconhecido como comando interno ou externo

Instalei o Anaconda3 4.4.0 (32 bits) na minha máquina Windows 7 Professional e importei o NumPy e o Pandas no notebook Jupyter, por isso presumo que o Python foi instalado corretamente. Mas quando eu digitoconda list econda --version no prompt de ...

2 a resposta

como plotar duas colunas de um único DataFrame no eixo Y do gráfico de linhas

Eu tenho o dataframe total_ano que contém três colunas (ano, ação, comédia). total_ano [/imgs/u7BTR.png] Eu quero traçar a coluna do ano no eixo X e (ação e comédia), ambos no eixo Y. Como eu posso plotar duas colunas (aciton e comédia) no ...

1 a resposta

sklearn parcial_fit () não mostrando resultados precisos como fit ()

Estou treinando 3 listas de dados L1, L2, L3. Primeiro eu treino todos eles com SGDClassifier fit () e, posteriormente, instância por instância com o parcial_fit (). Eu testo os dados com L4, L5. [Os dados nas listas são dados de imagem e as ...

1 a resposta

Árvores de decisão Spark MLib: probabilidade de rótulos por recursos?

Eu consegui exibir as probabilidades totais do meulabels, por exemplo, depois de exibir minha árvore de decisão, tenho uma tabela: Total Predictions : 65% impressions 30% clicks 5% conversionsMas meu problema é encontrar probabilidades (ou ...

5 a resposta

normalização quantílica no dataframe de pandas

Simplificando, como aplicar a normalização quantílica em um grande dataframe do Pandas (provavelmente 2.000.000 de linhas) em Python? PS. Eu sei que existe um pacote chamado rpy2 que poderia executar R no subprocesso, usando normalização de ...

6 a resposta

Onde eu chamo a função BatchNormalization no Keras?

Se eu quiser usar a função BatchNormalization no Keras, preciso chamá-la apenas uma vez no início? Eu li esta documentação para ele:http://keras.io/layers/normalization/ [http://keras.io/layers/normalization/] Não vejo para onde devo chamá-lo. ...

3 a resposta

Filtrar o dataframe dos pandas por lista

Eu tenho um quadro de dados que tem uma linha chamada "REF de hibridação". Gostaria de filtrar para obter apenas os dados dos itens com o mesmo rótulo de um dos itens da minha lista. Basicamente, eu gostaria de fazer o ...