Resultados da pesquisa a pedido "machine-learning"

2 a resposta

Como usar a validação cruzada k-fold em uma rede neural

Estamos escrevendo uma pequena RNA que deve categorizar 7000 produtos em 7 classes com base em 10 variáveis de entrada. Para fazer isso, precisamos usar a validação cruzada k-fold, mas estamos meio confusos. Temos este trecho do slide da ...

3 a resposta

Entropia cruzada no PyTorch

Estou um pouco confuso com a perda de entropia cruzada no PyTorch. Considerando este exemplo: import torch import torch.nn as nn from torch.autograd import Variable output = Variable(torch.FloatTensor([0,0,0,1])).view(1, -1) target ...

9 a resposta

O que é aprendizado de máquina? [fechadas]

O que éaprendizado de máquina ?O que o aprendizado de máquinacódigoFaz ?Quando dizemos que a máquina aprende, ela modifica o código deem siou modifica o histórico (banco de dados) que conterá a experiência do código para um determinado conjunto ...

3 a resposta

Scikit-learn GridSearch com o erro "ValueError: o formato multiclass não é suportado"

Estou tentando usar o GridSearch para estimativa de parâmetros de LinearSVC () da seguinte maneira - clf_SVM = LinearSVC() params = { 'C': [0.5, 1.0, 1.5], 'tol': [1e-3, 1e-4, 1e-5], 'multi_class': ['ovr', 'crammer_singer'], } gs = ...

4 a resposta

Resultados de filtragem colaborativa do Apache Spark ALS. Eles não fazem sentido

Eu queria experimentar o Spark para filtragem colaborativa usando o MLlib, conforme explicado neste ...

1 a resposta

Lidando com o desequilíbrio de classe na classificação binária

Aqui está uma breve descrição do meu problema: Estou trabalhando em umaprendizado supervisionado tarefa de treinar umbinário classificador.Eu tenho um conjunto de dados com uma classe grandedesequilíbrio distribuição: 8 instâncias negativas, ...

1 a resposta

Obter o nome do documento na matriz scikit-learn tf-idf

Eu criei uma matriz tf-idf, mas agora quero recuperar as 2 principais palavras para cada documento. Quero passar a identificação do documento e ele deve me dar as 2 principais palavras. No momento, tenho esses dados de exemplo: from ...

7 a resposta

Por que redimensionar recursos?

Eu descobri que o dimensionamento em problemas do SVM (Support Vector Machine) realmente melhora seu desempenho ... Eu li esta explicação: "A principal vantagem do dimensionamento é evitar atributos em intervalos numéricos maiores, dominando ...

1 a resposta

Como classificar URLs? o que são recursos de URLs? Como selecionar e extrair recursos do URL

Comecei a trabalhar em um problema de classificação. É um problema de duas classes, meu modelo treinado (Machine Learning) terá que decidir / prever ou permitir um URL ou bloqueá-lo. Minha pergunta é muito específica. Como classificar URLs? ...

2 a resposta

Qual é um bom intervalo de valores para os hiperparâmetros svm.SVC () a serem explorados via GridSearchCV ()?

Estou com o problema de que os hiperparâmetros do meusvm.SVC() são muito largas para que oGridSearchCV() nunca é concluído! Uma ideia é usarRandomizedSearchCV() em vez de. Mas, novamente, meu conjunto de dados é relativamente grande, de modo que ...