Resultados de la búsqueda a petición "machine-learning"
¿Cómo calcular TF * IDF para un único documento nuevo que se clasificará?
Estoy usando vectores de término de documento para representar una colección de documentos. yo sueloTF * IDF [http://en.wikipedia.org/wiki/Tf%E2%80%93idf]para calcular el peso del término para cada vector de documento. Entonces podría usar esta ...
Árbol de decisión C5.0 - código c50 llamado salida con valor 1
Estoy teniendo el siguiente error código c50 llamado salida con valor 1 Estoy haciendo esto en los datos titánicos disponibles de Kaggle # Importing datasets train <- read.csv("train.csv", sep=",") # this is the structure str(train)Salida: ...
¿Factorización de matriz no negativa de Python que maneja ceros y datos faltantes?
Busco una implementación NMF que tenga una interfaz de python y maneje tanto los datos faltantes como los ceros. No quiero imputar mis valores perdidos antes de comenzar la factorización, quiero que se ignoren en la función minimizada. Parece ...
Clasificación SVM: número mínimo de conjuntos de entrada para cada clase
Estoy tratando de crear una aplicación para detectar imágenes que son anuncios de las páginas web. Una vez que los detecte, no permitiré que se muestren en el lado del cliente. De la ayuda que recibíesta pregunta de ...
¿Cuál es la inversa de la fuerza de regularización en la regresión logística? ¿Cómo debería afectar mi código?
estoy usandosklearn.linear_model.LogisticRegression [http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html] enscikit learn ejecutar una regresión logística. C : float, optional (default=1.0) Inverse of ...
¿Cómo transformar el marco de datos en un vector de características de etiqueta?
Estoy ejecutando un módulo de regresión logística en scala y tengo un marco de datos como el siguiente: df +-----------+------------+ |x |y | +-----------+------------+ | 0| 0| | 0| 33| | 0| 58| | 0| 96| | 0| 1| | 1| 21| | 0| 10| | 0| 65| | 1| ...
¿Puedo usar CountVectorizer en scikit-learn para contar la frecuencia de documentos que no se usaron para extraer los tokens?
He estado trabajando con elCountVectorizer clase en scikit-learn. Entiendo que si se usa de la manera que se muestra a continuación, el resultado final consistirá en una matriz que contiene recuentos de características o tokens. Estos tokens se ...
Cómo implementar una validación de retención en R
Digamos que estoy usando elSonar datos y me gustaría hacer una validación de retención en R. Particioné los datos usando elcreateFolds decaret paquete comofolds <- createFolds(mydata$Class, k=5). Entonces me gustaría usar exactamente el ...
¿Por qué dos vectores no es similitud pero el resultado es 1?
Estoy usando la fórmula de similitud de coseno para calcular la similitud entre dos vectores. Probé dos vectores diferentes como este: Vector1 (-1237373741, 27, 1, 1, 331289590, 1818540802) Vector2 (-1237373741, 49, 1, 1, 331289590, ...
¿Es posible usar tamaños de imagen arbitrarios en caffe?
Sé que caffe tiene la llamada capa de pirámide espacial, que permite a las redes usar tamaños de imagen arbitrarios. El problema que tengo es que la red parece rechazar el uso de tamaños de imagen arbitrarios dentro de un solo lote. ¿Echo de ...