Resultados da pesquisa a pedido "categorical-data"
In gbm multinomial dist, como usar o prognóstico para obter resultados categóricos? [duplicado
Esta pergunta já tem uma resposta aqui: GBM distribuição multinomial, como usar o preditor () para obter a classe prevista? [/questions/18257642/gbm-multinomial-distribution-how-to-use-predict-to-get-predicted-class] 2 respostas Minha resposta ...
Como gerar pandas coluna DataFrame de Categórico da coluna de string?
Eu posso converter uma coluna de pandas string em Categorical, mas quando tento inseri-la como uma nova coluna DataFrame ela parece ser convertida de volta p...
Legenda de um mapa raster com dados categóricos
Eu gostaria de traçar um raster contendo 4 valores diferentes (1) com uma legenda de texto categórico descrevendo as categorias como2 mas com caixas de cor:E...
É possível ler colunas categóricas com o read_csv do panda?
Eu tentei passar odtype parâmetro comread_csv Comodtype={n: pandas.Categorical} mas isso não funciona corretamente (o resultado é um objeto).O manual não está claro [http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html].
Problemas com a codificação binária one-hot (one-of-K) em python
A codificação binária one-hot (também conhecida como one-of-K) consiste em criar uma coluna binária para cada valor distinto de uma variável categórica. Por exemplo, se alguém possui uma coluna de cores (variável categórica) que aceita os valores ...
R: criando uma variável categórica a partir de uma variável numérica e intervalos personalizados / abertos / de valor único
Costumo me encontrar tentando criar uma variável categórica a partir de uma variável numérica + de um conjunto de intervalos fornecido pelo usuário. Por exemplo, digamos que eu possua um data.frame com uma variável numéricadf$V e gostaria de ...
predict.glm () com três novas categorias nos dados de teste (r) (erro)
Eu tenho um conjunto de dados chamadodata que tem 481 092 linhas. Eu dividodata em duas metades iguais: A primeira metade (linha 1: 240 546) é chamadatrain e foi usado para oglm();a segunda metade (linha 240 547: 481 092) é chamadatest e deve ...
Como (e por que) você usa contrastes?
Em que casos você cria contrastes em sua análise? Como é feito e para que é usado? Eu chequei?contrasts e?C - ambos levam ao "Capítulo 2 dos modelos estatísticos em S", que não está prontamente disponível para mi
Nomeie as categorias menos frequentes por "OTHER" python
No meu dataframe, tenho algumas colunas categóricas com mais de 100 categorias diferentes. Quero classificar as categorias pelas mais frequentes. Eu mantenho as 9 primeiras categorias mais frequentes e as menos frequentes as ...