Resultados da pesquisa a pedido "bigdata"

3 a resposta

É uma boa ideia gerar coleções por dia no mongodb

É uma boa ideia criar coleções por dia para dados em um determinado dia (poderíamos começar por dia e depois passar para por hora se houver muitos dados). Ex...

1 a resposta

Fator desequilibrado de KMeans?

Edit: A resposta desta pergunta é fortemente discutida em:A soma no Spark foi ruim [https://stackoverflow.com/questions/39627773/sum-in-spark-gone-bad] NoCalcular o custo de ...

2 a resposta

Como criar um grande dataframe de pandas a partir de uma consulta sql sem ficar sem memória?

Estou tendo problemas para consultar uma tabela de> 5 milhões de registros do meu banco de dados do MS SQL Server. Eu quero ser capaz de selecionar todos ...

12 a resposta

Como faço para saída dos resultados de uma consulta HiveQL para CSV?

Gostaríamos de colocar os resultados de uma consulta Hive em um arquivo CSV. Eu pensei que o comando deveria ser assim:

0 a resposta

Foverlaps R equivalentes em Python

Estou tentando reescrever algum código R em Python e não consigo passar um bit específico de código. Eu encontrei ofoverlaps A função no R é muito útil ao executar uma junção baseada em tempo, mas não encontrou nada que funcione tão bem no ...

2 a resposta

Qual é a diferença básica entre jobconf e job?

2 a resposta

Existe uma maneira de transpor dados no Hive?

Os dados do Hive podem ser transpostos? Como em, as linhas se tornam colunas e colunas são as linhas? Se não houver nenhuma função, existe uma maneira de faz...

2 a resposta

encontrar todas as duas frases de palavras que aparecem em mais de uma linha em um conjunto de dados

3 a resposta

Lendo dados grandes com largura fixa

5 a resposta

Qual é a diferença real entre o Data Warehouse e Big Data?