Resultados da pesquisa a pedido "categorical-data"

1 a resposta

In gbm multinomial dist, como usar o prognóstico para obter resultados categóricos? [duplicado

Esta pergunta já tem uma resposta aqui: GBM distribuição multinomial, como usar o preditor () para obter a classe prevista? [/questions/18257642/gbm-multinomial-distribution-how-to-use-predict-to-get-predicted-class] 2 respostas Minha resposta ...

2 a resposta

Como gerar pandas coluna DataFrame de Categórico da coluna de string?

Eu posso converter uma coluna de pandas string em Categorical, mas quando tento inseri-la como uma nova coluna DataFrame ela parece ser convertida de volta p...

2 a resposta

Legenda de um mapa raster com dados categóricos

Eu gostaria de traçar um raster contendo 4 valores diferentes (1) com uma legenda de texto categórico descrevendo as categorias como2 mas com caixas de cor:E...

2 a resposta

É possível ler colunas categóricas com o read_csv do panda?

Eu tentei passar odtype parâmetro comread_csv Comodtype={n: pandas.Categorical} mas isso não funciona corretamente (o resultado é um objeto).O manual não está claro [http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html].

2 a resposta

Problemas com a codificação binária one-hot (one-of-K) em python

A codificação binária one-hot (também conhecida como one-of-K) consiste em criar uma coluna binária para cada valor distinto de uma variável categórica. Por exemplo, se alguém possui uma coluna de cores (variável categórica) que aceita os valores ...

2 a resposta

R: criando uma variável categórica a partir de uma variável numérica e intervalos personalizados / abertos / de valor único

Costumo me encontrar tentando criar uma variável categórica a partir de uma variável numérica + de um conjunto de intervalos fornecido pelo usuário. Por exemplo, digamos que eu possua um data.frame com uma variável numéricadf$V e gostaria de ...

2 a resposta

predict.glm () com três novas categorias nos dados de teste (r) (erro)

Eu tenho um conjunto de dados chamadodata que tem 481 092 linhas. Eu dividodata em duas metades iguais: A primeira metade (linha 1: 240 546) é chamadatrain e foi usado para oglm();a segunda metade (linha 240 547: 481 092) é chamadatest e deve ...

2 a resposta

Como (e por que) você usa contrastes?

Em que casos você cria contrastes em sua análise? Como é feito e para que é usado? Eu chequei?contrasts e?C - ambos levam ao "Capítulo 2 dos modelos estatísticos em S", que não está prontamente disponível para mi

2 a resposta

Nomeie as categorias menos frequentes por "OTHER" python

No meu dataframe, tenho algumas colunas categóricas com mais de 100 categorias diferentes. Quero classificar as categorias pelas mais frequentes. Eu mantenho as 9 primeiras categorias mais frequentes e as menos frequentes as ...

3 a resposta

Criando variáveis ​​categóricas a partir de variáveis ​​dummy mutuamente exclusivas