Resultados da pesquisa a pedido "data-processing"

4 a resposta

Como ler um arquivo de 4 GB no sistema de 32 bits

No meu caso, eu tenho arquivos diferentes, vamos supor que eu tenha um arquivo> 4GB com dados. Quero ler esse arquivo linha por linha e processar cada linha. Uma das minhas restrições é que o soft deve ser executado no MS Windows de 32 bits ou em ...

3 a resposta

Manipulação de dados ausentes / incompletos no R - existe função para mascarar, mas não remover NAs?

Como seria de esperar de uma DSL destinada à análise de dados, R lida com dados ausentes / incomp e lete muito bem, por exemplo: Muitas funções R têm umna.rmsinalizar que, quando definido comoVERDADEIRO, remova as NAs: >>> v = mean( c(5, NA, 6, ...

2 a resposta

Dicionário léxico para palavras sinônimas

Existem poucos dicionários disponíveis para processamento de linguagem natural. Como dicionários de palavras positivas, negativas etc. Existe algum dicionário disponível que contenha uma lista de sinônimos para todas as palavras do ...

3 a resposta

Processamento de dados em grande escala Hbase vs Cassandra [fechado]

Estou quase chegando em Cassandra após minha pesquisa em soluções de armazenamento de dados em larga escala. Mas geralmente se diz que o Hbase é a melhor solução para processamento e análise de dados em larga escal Enquanto ambos têm o mesmo ...

1 a resposta

DataFrame do Pandas selecionando grupos com cardinalidade mínima

Tenho um problema em que preciso obter grupos de linhas de um quadro de dados em que o número de itens em um grupo excede um determinado número (ponto de corte). Para esses grupos, preciso fazer algumas fileiras de cabeça e de cauda. Estou ...

1 a resposta

Processamento de dados com adição dinâmica de colunas no Dataframe do Python Pandas

Eu tenho o seguinte problema. Vamos dizer que este é o meu CSV id f1 f2 f3 1 4 5 5 1 3 1 0 1 7 4 4 1 4 3 1 1 1 4 6 2 2 6 0 ..........Então, eu tenho linhas que podem ser agrupadas por id. Eu quero criar um CSV como abaixo como uma saída. f1 f2 ...

7 a resposta

Como suavizar uma curva no caminho certo?

Vamos supor que temos um conjunto de dados que pode ser dado aproximadamente por