Спасибо DWin. Как здорово вы были! (Пальцы вверх)

ел бы спросить, возможно ли извлечь существительное + существительное или (прилагательное | существительное) + существительное в пакете R openNLP? То есть я хотел бы использовать лингвистическую фильтрацию для извлечения фраз-кандидатов из имен существительных. Не могли бы вы указать мне, как это сделать? Большое спасибо.

Спасибо за ответы. вот код:

library("openNLP")

acq <- "Gulf Applied Technologies Inc said it sold its subsidiaries engaged in
        pipeline and terminal operations for 12.2 mln dlrs. The company said 
        the sale is subject to certain post closing adjustments, 
        which it did not explain. Reuter." 

acqTag <- tagPOS(acq)    
acqTagSplit = strsplit(acqTag," ")
acqTagSplit

qq = 0
tag = 0

for (i in 1:length(acqTagSplit[[1]])){
    qq[i] <-strsplit(acqTagSplit[[1]][i],'/')
    tag[i] = qq[i][[1]][2]
}

index = 0

k = 0

for (i in 1:(length(acqTagSplit[[1]])-1)) {

    if ((tag[i] == "NN" && tag[i+1] == "NN") | 
        (tag[i] == "NNS" && tag[i+1] == "NNS") | 
        (tag[i] == "NNS" && tag[i+1] == "NN") | 
        (tag[i] == "NN" && tag[i+1] == "NNS") | 
        (tag[i] == "JJ" && tag[i+1] == "NN") | 
        (tag[i] == "JJ" && tag[i+1] == "NNS"))
    {      
            k = k +1
            index[k] = i
    }

}

index

Читатель может сослатьсяиндекс наacqTagSplit делать существительное + существительное или (прилагательное | существительное) + извлечение существительного. (Код не является оптимальным, но работает. Если у вас есть идеи, пожалуйста, дайте мне знать.)

Кроме того, у меня все еще есть проблема.

Justeson и Katz (1995) предложили еще одну лингвистическую фильтрацию для выделения фраз-кандидатов:

((Adj | Существительное) + | ((Adj | Существительное)(Существительное-Prep)) (Adj |? Существительное))Имя существительное

Я не могу хорошо понять его значение. Не могли бы вы сделать мне одолжение, чтобы объяснить это или преобразовать такое представление в язык R. Большое спасибо.

Ответы на вопрос(2)

Ваш ответ на вопрос