Resultados da pesquisa a pedido "scikit-learn"

2 a resposta

Cluster de sentenças Doc2Vec

Eu tenho vários documentos que contêm várias frases. Eu quero usardoc2vecpara agrupar (por exemplo, k-means) os vetores de sentença usandosklearn. Como tal, a ideia é que sentenças semelhantes sejam agrupadas em vários grupos. No entanto, não ...

0 a resposta

Replicar MLPClassifier () do sklearn em keras

Eu sou novo em keras. Eu estava tentando um problema de ML. Sobre os dados: Possui 5 recursos de entrada, 4 classes de saída e cerca de 26000 registros. Eu tentei usando MLPClassifier () da seguinte maneira: clf = MLPClassifier(verbose=True, ...

1 a resposta

Codificador de etiquetas Scikit-learn: como preservar mapeamentos entre lotes?

Eu tenho 185 milhões de amostras que terão cerca de 3,8 MB por amostra. Para preparar meu conjunto de dados, precisarei codificar de forma única muitos dos recursos, após os quais terminarei com mais de 15.000 recursos. Mas preciso preparar o ...

1 a resposta

erro de forma inconsistente MultiLabelBinarizer em y_test, sklearn classificação de rótulos múltiplos

import numpy as np import pandas as pd from sklearn.pipeline import Pipeline from sklearn.feature_extraction.text import CountVectorizer from sklearn.svm import LinearSVC from sklearn.linear_model import SGDClassifier ...

1 a resposta

Por que a Random Forest com uma única árvore é muito melhor que um classificador da Decision Tree?

Eu aprendo o aprendizado de máquina com oscikit-learn biblioteca. Aplico o classificador da árvore de decisão e o classificador aleatório da floresta aos meus dados com este código: def decision_tree(train_X, train_Y, test_X, test_Y): clf ...

1 a resposta

k vizinhos mais próximos com validação cruzada para pontuação de precisão e matriz de confusão

Eu tenho os seguintes dados em que, para cada coluna, as linhas com números são a entrada e a letra é a ...

2 a resposta

Diferença entre coeficientes de regressão linear entre Python e R

Estou tentando executar uma regressão linear em Python que eu já fiz no R para encontrar variáveis com coeficientes 0. A questão que eu estou enfrentando é que a regressão linear em R retorna NAs para colunas com baixa variação, enquanto ...

1 a resposta

Modelos de mistura gaussiana do histograma de uma imagem

Estou tentando fazer uma segmentação automática de imagem das diferentes regiões de uma imagem de RM 2D com base nos valores de intensidade de pixel. O primeiro passo é implementar um Modelo de Mistura Gaussiano no histograma da imagem. ...

2 a resposta

Obter estado intermediário de dados no pipeline do scikit-learn

Dado o seguinte exemplo: from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.decomposition import NMF from sklearn.pipeline import Pipeline import pandas as pd pipe = Pipeline([ ("tf_idf", TfidfVectorizer()), ("nmf", NMF()) ...

4 a resposta

No sklearn.decomposition.PCA, por que os componentes são negativos?

Estou tentando acompanhar Abdi & Williams -Análise do componente principal [http://www.utdallas.edu/~herve/abdi-awPCA2010.pdf](2010) e construir componentes principais por meio do SVD, ...