Resultados da pesquisa a pedido "dummy-variable"
Variáveis simuladas quando nem todas as categorias estão presentes
Eu tenho um conjunto de quadros de dados em que uma das colunas contém uma variável categórica. Gostaria de convertê-lo em várias variáveis fictícias, caso em que normalmente usariaget_dummies. O que acontece é queget_dummies examina os dados ...
Convertendo a coluna pandas de sequências separadas por vírgula em variáveis dummy
No meu dataframe, tenho uma variável categórica que gostaria de converter em variáveis dummy. Esta coluna, no entanto, possui vários valores separados por vírgulas: 0 'a' 1 'a,b,c' 2 'a,b,d' 3 'd' 4 'c,d'Por fim, eu gostaria de ter ...
crie uma matriz esparsa; dados os índices de elementos diferentes de zero para a criação de variáveis fictícias de uma coluna categórica de um grande conjunto de dados
Estou tentando usar uma matriz esparsa para gerar variáveis fictícias para um conjunto de dados com 5,8 milhões de linhas e duas colunas categóricas. A estrutura dos dados é: mydata: data.table de 5.800.000 linhas e duas variáveis categóricas ...
criando uma matriz fictícia a partir de uma coluna concatenada [duplicado]
Esta pergunta já tem uma resposta aqui: Dummify coluna de caracteres e encontre valores exclusivos [duplicado] [/questions/42387859/dummify-character-column-and-find-unique-values] 7 respostasEstou usando R e tenho uma coluna que se parece com ...
R: crie variáveis fictícias com base em uma variável categórica * de listas *
Eu tenho um quadro de dados com uma retenção de variável categóricalistas de strings, com comprimento variável (é importante porque, caso contrário, essa pergunta seria uma duplicata ...
Manipulação de valores desconhecidos para codificação de etiquetas
Como lidar com valores desconhecidos para codificação de etiquetas no sk-learn? O codificador de etiquetas explodirá apenas com a exceção de que novas etiquetas foram detectadas. O que eu quero é ocodificação de variáveis categóricasatravés ...
Pandas: manequins
Eu tenho o seguinte quadro de dados: amount catcode cid cycle date di feccandid type 0 1000 E1600 N00029285 2014 2014-05-15 D H8TX22107 24K 1 5000 G4600 N00026722 2014 2013-10-22 D H4TX28046 24K 2 4 C2100 N00030676 2014 2014-03-26 D H0MO07113 ...
Pandas Python: crie uma nova coluna para cada valor diferente de uma coluna de origem (com saída booleana como valores da coluna)
Estou tentando dividir uma coluna de origem de um quadro de dados em várias colunas com base em seu conteúdo e preencha essas colunas recém-geradas com um booleano 1 ou 0 da seguinte maneira: Dataframe original: ID source_column A value 1 B NaN ...
Página 1 do 2