Resultados da pesquisa a pedido "classification"
O arquivo de teste no weka requer o mesmo ou menos número de recursos que o trem?
Eu preparei dois arquivos .arff diferentes de dois conjuntos de dados diferentes, um para teste e outro para treinamento. Cada um deles tem instâncias iguais...
Como obter recursos mais informativos para os classificadores scikit-learn?
Os classificadores em pacotes de aprendizado de máquina como liblinear e nltk oferecem um método
Noções básicas sobre o recurso Spark RandomForest do Spark
estou a usarRandomForest.featureImportances mas não entendo o resultado da saída. Eu tenho 12 recursos, e esta é a saída que recebo. Eu entendo que isso pode não ser uma pergunta específica do apache-spark, mas não consigo encontrar nenhum ...
Vetorização no Apache Mahout
Eu sou novo no Mahout. Eu tenho um requisito para converter um arquivo de texto em um vetor para classificação no estágio posterior.Alguém poderia lançar alg...
Reconhecer uma sequência de datas arbitrárias
Eu preciso ser capaz de reconhecer cadeias de datas. Não importa se não consigo distinguir mês e data (por exemplo, 12/12/10), só preciso classificar a sequência como sendo uma data, em vez de convertê-la em um objeto Date. Portanto, isso é ...
Como posso obter termos de maior frequência de vetores TD-idf, para cada arquivo no scikit-learn?
Eu estou tentando obter termos de maior freqüência fora de vetores em scikit-learn. Do exemplo Pode ser feito usando isso para cada categoria, mas eu quero p...
ID3 e C4.5: Como a "taxa de ganho" normaliza o "ganho"?
O algoritmo ID3 usa a medida "Information Gain".O C4.5 usa a medida "Gain Ratio", que é o ganho de informação dividido por
Como lidar com valores de atributos ausentes na árvore de decisão C4.5 (J48)?
Qual é a melhor maneira de lidar com valores de atributo de recurso ausentes com a árvore de decisão C4.5 (J48) da Weka? O problema de valores ausentes ocorr...