Extraer sustantivo + sustantivo o (adj | sustantivo) + sustantivo del texto
Me gustaría consultar si es posible extraer sustantivo + sustantivo o (adj | sustantivo) + sustantivo en el paquete R openNLP? Es decir, me gustaría utilizar el filtrado lingüístico para extraer frases nominales candidatas. ¿Podrías indicarme cómo hacerlo? Muchas gracias.
Gracias por las respuestas Aquí está el código:
library("openNLP")
acq <- "Gulf Applied Technologies Inc said it sold its subsidiaries engaged in
pipeline and terminal operations for 12.2 mln dlrs. The company said
the sale is subject to certain post closing adjustments,
which it did not explain. Reuter."
acqTag <- tagPOS(acq)
acqTagSplit = strsplit(acqTag," ")
acqTagSplit
qq = 0
tag = 0
for (i in 1:length(acqTagSplit[[1]])){
qq[i] <-strsplit(acqTagSplit[[1]][i],'/')
tag[i] = qq[i][[1]][2]
}
index = 0
k = 0
for (i in 1:(length(acqTagSplit[[1]])-1)) {
if ((tag[i] == "NN" && tag[i+1] == "NN") |
(tag[i] == "NNS" && tag[i+1] == "NNS") |
(tag[i] == "NNS" && tag[i+1] == "NN") |
(tag[i] == "NN" && tag[i+1] == "NNS") |
(tag[i] == "JJ" && tag[i+1] == "NN") |
(tag[i] == "JJ" && tag[i+1] == "NNS"))
{
k = k +1
index[k] = i
}
}
index
El lector puede referiríndice enacqTagSplit hacer sustantivo + sustantivo o (adj | sustantivo) + sustantivo de extracción. (El código no es óptimo pero funciona. Si tienes alguna idea, házmelo saber).
Además, todavía tengo un problema.
Justeson y Katz (1995) propusieron otro filtrado lingüístico para extraer frases nominales candidatas:
((Adj | Sustantivo) + | ((Adj | Sustantivo)(Sustant-Prep)?) (Adj | Sustantivo))Sustantivo
No puedo entender bien su significado. ¿Podría hacerme un favor para explicarlo o transformar esa representación en lenguaje R. Muchas gracias.