Resultados da pesquisa a pedido "machine-learning"
Como usar a validação cruzada k-fold em uma rede neural
Estamos escrevendo uma pequena RNA que deve categorizar 7000 produtos em 7 classes com base em 10 variáveis de entrada. Para fazer isso, precisamos usar a validação cruzada k-fold, mas estamos meio confusos. Temos este trecho do slide da ...
Entropia cruzada no PyTorch
Estou um pouco confuso com a perda de entropia cruzada no PyTorch. Considerando este exemplo: import torch import torch.nn as nn from torch.autograd import Variable output = Variable(torch.FloatTensor([0,0,0,1])).view(1, -1) target ...
O que é aprendizado de máquina? [fechadas]
O que éaprendizado de máquina ?O que o aprendizado de máquinacódigoFaz ?Quando dizemos que a máquina aprende, ela modifica o código deem siou modifica o histórico (banco de dados) que conterá a experiência do código para um determinado conjunto ...
Scikit-learn GridSearch com o erro "ValueError: o formato multiclass não é suportado"
Estou tentando usar o GridSearch para estimativa de parâmetros de LinearSVC () da seguinte maneira - clf_SVM = LinearSVC() params = { 'C': [0.5, 1.0, 1.5], 'tol': [1e-3, 1e-4, 1e-5], 'multi_class': ['ovr', 'crammer_singer'], } gs = ...
Resultados de filtragem colaborativa do Apache Spark ALS. Eles não fazem sentido
Eu queria experimentar o Spark para filtragem colaborativa usando o MLlib, conforme explicado neste ...
Lidando com o desequilíbrio de classe na classificação binária
Aqui está uma breve descrição do meu problema: Estou trabalhando em umaprendizado supervisionado tarefa de treinar umbinário classificador.Eu tenho um conjunto de dados com uma classe grandedesequilíbrio distribuição: 8 instâncias negativas, ...
Obter o nome do documento na matriz scikit-learn tf-idf
Eu criei uma matriz tf-idf, mas agora quero recuperar as 2 principais palavras para cada documento. Quero passar a identificação do documento e ele deve me dar as 2 principais palavras. No momento, tenho esses dados de exemplo: from ...
Por que redimensionar recursos?
Eu descobri que o dimensionamento em problemas do SVM (Support Vector Machine) realmente melhora seu desempenho ... Eu li esta explicação: "A principal vantagem do dimensionamento é evitar atributos em intervalos numéricos maiores, dominando ...
Como classificar URLs? o que são recursos de URLs? Como selecionar e extrair recursos do URL
Comecei a trabalhar em um problema de classificação. É um problema de duas classes, meu modelo treinado (Machine Learning) terá que decidir / prever ou permitir um URL ou bloqueá-lo. Minha pergunta é muito específica. Como classificar URLs? ...
Qual é um bom intervalo de valores para os hiperparâmetros svm.SVC () a serem explorados via GridSearchCV ()?
Estou com o problema de que os hiperparâmetros do meusvm.SVC() são muito largas para que oGridSearchCV() nunca é concluído! Uma ideia é usarRandomizedSearchCV() em vez de. Mas, novamente, meu conjunto de dados é relativamente grande, de modo que ...