Resultados da pesquisa a pedido "categorical-data"
Nomeie as categorias menos frequentes por "OTHER" python
No meu dataframe, tenho algumas colunas categóricas com mais de 100 categorias diferentes. Quero classificar as categorias pelas mais frequentes. Eu mantenho as 9 primeiras categorias mais frequentes e as menos frequentes as ...
Como correlacionar coluna categórica em pandas?
Eu tenho um DataFramedf com uma coluna não numéricaCatColumn. A B CatColumn 0 381.1396 7.343921 Medium 1 481.3268 6.786945 Medium 2 263.3766 7.628746 High 3 177.2400 5.225647 Medium-HighEu quero incluirCatColumn na análise de correlação com ...
Fatore uma coluna de cordas em pandas
Como a pergunta diz, eu tenho um quadro de dadosdf_original que é bastante grande, mas se parece com: ID Count Column 2 Column 3 Column 4 RowX 1 234. 255. yes. 452 RowY 1 123. 135. no. 342 RowW 1 234. 235. yes. 645 RowJ 1 123. 115. no. 342 RowA ...
Como o Tensorflow lida com recursos categóricos com várias entradas em uma coluna?
Por exemplo, eu tenho dados na seguintecsv formato: csv col0 col1 col2 col3 1 A E|A|C 3 0 B D|F 2 2 C | 2Cada coluna separada por vírgula representa um recurso. Normalmente, um recurso é muito quente (por exemplo,col0, col1, col3), mas nesse ...
Pesquisa de incorporação do Tensorflow com listas de tamanhos desiguais
Ei pessoal, estou tentando projetar dados categóricos com várias etiquetas em um espaço denso usando casamentos. Aqui está um exemplo de brinquedo. Digamos que eu tenho quatro categorias e quero projetá-las em um espaço 2D. Além disso, recebi ...
pd.get_dummies () lento em grandes níveis
Não tenho certeza se esse já é o método mais rápido possível ou se estou fazendo isso de forma ineficiente. Quero codificar a quente uma coluna categórica específica que tem 27k + níveis possíveis. A coluna tem valores diferentes em 2 conjuntos ...
Alguma maneira de obter mapeamentos de um codificador de rótulo em pandas Python?
Estou convertendo seqüências de caracteres para valores categóricos no meu conjunto de dados usando o seguinte trecho de código. data['weekday'] = pd.Categorical.from_array(data.weekday).labelsPor exemplo, index weekday 0 Sunday 1 Sunday 2 ...
Revelar os recursos do cluster dos modos k
Estou realizando uma análise de cluster em dados categóricos, portanto, usando a abordagem dos modos k. Meus dados têm o formato de uma pesquisa de preferência: como você gosta de cabelos e olhos? [/imgs/6T7QR.png] O entrevistado pode obter ...
Como codificar recursos categóricos no sklearn?
Eu tenho um conjunto de dados com 41 recursos [de 0 a 40 colunas], dos quais 7 são categóricos. Este conjunto categórico é dividido em dois subconjuntos: Um subconjunto do tipo de sequência (os recursos de coluna 1, 2, 3)Um subconjunto do tipo ...
Reduza o número de níveis para grandes variáveis categóricas
Existem alguns prontos para usar bibliotecas ou pacotes para python ou R para reduzir o número de níveis de grandes fatores categóricos? Eu quero alcançar algo semelhante aoR: Variáveis categóricas ...