Resultados da pesquisa a pedido "categorical-data"

2 a resposta

Nomeie as categorias menos frequentes por "OTHER" python

No meu dataframe, tenho algumas colunas categóricas com mais de 100 categorias diferentes. Quero classificar as categorias pelas mais frequentes. Eu mantenho as 9 primeiras categorias mais frequentes e as menos frequentes as ...

3 a resposta

Como correlacionar coluna categórica em pandas?

Eu tenho um DataFramedf com uma coluna não numéricaCatColumn. A B CatColumn 0 381.1396 7.343921 Medium 1 481.3268 6.786945 Medium 2 263.3766 7.628746 High 3 177.2400 5.225647 Medium-HighEu quero incluirCatColumn na análise de correlação com ...

1 a resposta

Fatore uma coluna de cordas em pandas

Como a pergunta diz, eu tenho um quadro de dadosdf_original que é bastante grande, mas se parece com: ID Count Column 2 Column 3 Column 4 RowX 1 234. 255. yes. 452 RowY 1 123. 135. no. 342 RowW 1 234. 235. yes. 645 RowJ 1 123. 115. no. 342 RowA ...

1 a resposta

Como o Tensorflow lida com recursos categóricos com várias entradas em uma coluna?

Por exemplo, eu tenho dados na seguintecsv formato: csv col0 col1 col2 col3 1 A E|A|C 3 0 B D|F 2 2 C | 2Cada coluna separada por vírgula representa um recurso. Normalmente, um recurso é muito quente (por exemplo,col0, col1, col3), mas nesse ...

0 a resposta

Pesquisa de incorporação do Tensorflow com listas de tamanhos desiguais

Ei pessoal, estou tentando projetar dados categóricos com várias etiquetas em um espaço denso usando casamentos. Aqui está um exemplo de brinquedo. Digamos que eu tenho quatro categorias e quero projetá-las em um espaço 2D. Além disso, recebi ...

1 a resposta

pd.get_dummies () lento em grandes níveis

Não tenho certeza se esse já é o método mais rápido possível ou se estou fazendo isso de forma ineficiente. Quero codificar a quente uma coluna categórica específica que tem 27k + níveis possíveis. A coluna tem valores diferentes em 2 conjuntos ...

6 a resposta

Alguma maneira de obter mapeamentos de um codificador de rótulo em pandas Python?

Estou convertendo seqüências de caracteres para valores categóricos no meu conjunto de dados usando o seguinte trecho de código. data['weekday'] = pd.Categorical.from_array(data.weekday).labelsPor exemplo, index weekday 0 Sunday 1 Sunday 2 ...

1 a resposta

Revelar os recursos do cluster dos modos k

Estou realizando uma análise de cluster em dados categóricos, portanto, usando a abordagem dos modos k. Meus dados têm o formato de uma pesquisa de preferência: como você gosta de cabelos e olhos? [/imgs/6T7QR.png] O entrevistado pode obter ...

4 a resposta

Como codificar recursos categóricos no sklearn?

Eu tenho um conjunto de dados com 41 recursos [de 0 a 40 colunas], dos quais 7 são categóricos. Este conjunto categórico é dividido em dois subconjuntos: Um subconjunto do tipo de sequência (os recursos de coluna 1, 2, 3)Um subconjunto do tipo ...

4 a resposta

Reduza o número de níveis para grandes variáveis categóricas

Existem alguns prontos para usar bibliotecas ou pacotes para python ou R para reduzir o número de níveis de grandes fatores categóricos? Eu quero alcançar algo semelhante aoR: Variáveis categóricas ...