Resultados de la búsqueda a petición "data-mining"

2 la respuesta

Utilice la correlación absoluta de Pearson como distancia en el algoritmo de K-medias (MATLAB)

3 la respuesta

agrupación de conjuntos de datos muy grandes en R

Tengo un conjunto de datos que consta de 70,000 valores numéricos que representan distancias que van desde 0 hasta 50, y quiero agrupar estos números; sin embargo, si estoy probando el enfoque de agrupamiento clásico, entonces tendría que ...

1 la respuesta

Uso de la función de distancia de ELKI

Este es un seguimiento de unPregunta anterior [https://stackoverflow.com/questions/23634614/running-dbscan-in-elki/23639300?noredirect=1#23639300] , donde comentamos que el uso de distancias euclidianas con lat, coordenadas largas no arroja ...

1 la respuesta

¿Haciendo solicitudes de tiempo muy específicas (al segundo) en la API de Twitter, usando Python Tweepy?

Me gustaría solicitar tweets sobre un tema específico (por ejemplo: "cáncer"), usando Python Tweepy. Pero por lo general, su tiempo solo puede especificarse para un día específico, por ejemplo. startSince = '2014-10-01' endUntil = '2014-10-02' ...

1 la respuesta

R: comportamiento poco claro de la función tuneRF (paquete randomForest)

Me siento incómodo con el significado destepFactor parámetro de latuneRF [http://www.inside-r.org/packages/cran/randomForest/docs/tuneRF]función que se utiliza para ajustar elmtry parámetro utilizado más en ...

5 la respuesta

'Similitud' en minería de datos

En el campo de la minería de datos, ¿existe una subdisciplina específica llamada 'Similitud'? En caso afirmativo, de qué se trata. Cualquier ejemplo, enlaces, referencias serán útiles. Además, al ser nuevo en el campo, me gustaría la opinión de ...

2 la respuesta

Python, minería de datos de registro web para patrones frecuentes

Necesito desarrollar una herramienta para la minería de datos de registro web. Al tener muchas secuencias de URL, solicitadas en una sesión de usuario en particular (recuperada de los registros de aplicaciones web), necesito descubrir los ...

3 la respuesta

Función GBM R: obtenga importancia variable por separado para cada clase

Estoy usando elgbm [http://www.inside-r.org/packages/cran/gbm/docs/gbm]funciona en R (paquete gbm) para adaptarse a modelos estocásticos de aumento de gradiente para clasificación multiclase. Simplemente estoy tratando de obtener la importancia ...

6 la respuesta

Formas de calcular similitud

Estoy haciendo un sitio web de la comunidad que requiere que calcule la similitud entre dos usuarios. Cada usuario se describe con los siguientes atributos: edad, tipo de piel (grasa, seca), tipo de cabello (largo, corto, mediano), estilo de ...

1 la respuesta

¿Cómo analizar una matriz de adyacencia escasa?

Estoy investigando matrices de adyacencia dispersas donde la mayoría de las celdas son ceros y algunas aquí y allá, cada relación entre dos celdas tiene una descripción polinómica que puede ser muy larga y su análisis lleva mucho tiempo. Mi ...