Resultados da pesquisa a pedido "bigdata"
É uma boa ideia gerar coleções por dia no mongodb
É uma boa ideia criar coleções por dia para dados em um determinado dia (poderíamos começar por dia e depois passar para por hora se houver muitos dados). Ex...
Fator desequilibrado de KMeans?
Edit: A resposta desta pergunta é fortemente discutida em:A soma no Spark foi ruim [https://stackoverflow.com/questions/39627773/sum-in-spark-gone-bad] NoCalcular o custo de ...
Como criar um grande dataframe de pandas a partir de uma consulta sql sem ficar sem memória?
Estou tendo problemas para consultar uma tabela de> 5 milhões de registros do meu banco de dados do MS SQL Server. Eu quero ser capaz de selecionar todos ...
Como faço para saída dos resultados de uma consulta HiveQL para CSV?
Gostaríamos de colocar os resultados de uma consulta Hive em um arquivo CSV. Eu pensei que o comando deveria ser assim:
Foverlaps R equivalentes em Python
Estou tentando reescrever algum código R em Python e não consigo passar um bit específico de código. Eu encontrei ofoverlaps A função no R é muito útil ao executar uma junção baseada em tempo, mas não encontrou nada que funcione tão bem no ...
Existe uma maneira de transpor dados no Hive?
Os dados do Hive podem ser transpostos? Como em, as linhas se tornam colunas e colunas são as linhas? Se não houver nenhuma função, existe uma maneira de faz...