Resultados de la búsqueda a petición "nlp"

5 la respuesta

¿Cómo codificar frases en el nivel de personaje?

Me gustaría convertir una oración a una matriz de vectores de un solo hot. Estos vectores serían la representación única del alfabeto. Se vería así: "hello" # h=7, e=4 l=11 o=14se convertiría [[0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...

4 la respuesta

Interpretar la suma de puntajes de palabras TF-IDF en documentos

Primero extraigamos los puntajes TF-IDF por término por documento: from gensim import corpora, models, similarities documents = ["Human machine interface for lab abc computer applications", "A survey of user opinion of computer system response ...

2 la respuesta

¿Cuál es la conexión o diferencia entre lemma y synset en wordnet?

Soy un principiante completo de PNL y NLTK. No pude entender exactamentediferencia entre lemas y synsets en wordnet, porque ambos están produciendo casi la misma salida. por ejemplo, para la palabra pastel, produce esta salida. lemmas : ...

3 la respuesta

Forma rápida de dividir una cadena de palabras unidas en palabras individuales

Digamos que tenía esta cadena: hellohowareyou¿Hay una manera rápida de separar esto en palabras individuales, por lo que el resultado final eshello how are you? Puedo pensar en varias formas, pero serían EXTREMADAMENTE lentas (primero necesito ...

4 la respuesta

Agregar / eliminar palabras de detención con espacios

¿Cuál es la mejor manera de agregar / eliminar palabras vacías con espacios? estoy usandotoken.is_stop [https://spacy.io/docs/api/token]función y me gustaría hacer algunos cambios personalizados en el conjunto. Estaba mirando la documentación ...

2 la respuesta

¿Cómo calcula gensim los vectores de párrafo doc2vec?

voy a seguir este papelhttp://cs.stanford.edu/~quocle/paragraph_vector.pdf [http://cs.stanford.edu/~quocle/paragraph_vector.pdf] y dice que "El vector de párrafo y los vectores de palabras se promedian o concatenan para predecir la siguiente ...

1 la respuesta

¿Cómo se calcula el puntaje de polaridad 'compuesto' de Vader en Python NLTK?

Estoy usando el Vader SentimentAnalyzer para obtener los puntajes de polaridad. Utilicé los puntajes de probabilidad para positivo / negativo / neutral antes, pero me di cuenta de que el puntaje "compuesto", que varía de -1 (más neg) a 1 (más ...

2 la respuesta

Números binarios en lugar de vectores calientes

Mientras se realiza la regresión logística, es una práctica común usar uno de los vectores calientes como resultado deseado. Entonces,no of classes = no of nodes in output layer. No utilizamos el índice de palabras en el vocabulario (o un número ...

3 la respuesta

Resolución de coreferencia en python nltk usando Stanford coreNLP

Stanford CoreNLP proporciona resolución de coreferenciacomo se menciona aquí [http://nlp.stanford.edu/software/dcoref.shtml], ademáseste hilo [https://stackoverflow.com/questions/30954649/coreference-resolution-using-stanford-corenlp] , ...

1 la respuesta

Convertir la salida del análisis de dependencia a árbol

estoy usandoStanford dependency parser y obtengo el siguiente resultado de la oración Le disparé a un elefante mientras dormía python dep_parsing.py [((u'shot', u'VBD'), u'nsubj', (u'I', u'PRP')), ((u'shot', u'VBD'), u'dobj', (u'elephant', ...