Encontrando sub-frases significativas de uma frase

Existe uma maneira de encontrar todas as sub sentenças de uma frase que ainda são significativas e contêm pelo menos um assunto, verbo e um predicado / objet

Por exemplo, se tivermos uma frase como "Vou fazer um seminário sobre PNL na SXSW em Austin no próximo mês". Podemos extrair as seguintes sub-sentenças significativas desta frase: "Vou fazer um seminário", "Vou fazer um seminário sobre PNL", "Vou fazer um seminário sobre PNL na SXSW", " Vou fazer um seminário na SXSW "," Vou fazer um seminário em Austin "," Vou fazer um seminário sobre PNL no próximo mês ", etc.

Observe que não há frases deduzidas aqui (por exemplo, "Haverá um seminário de PNL no SXSW no próximo mês". Embora isso seja verdade, não precisamos disso como parte deste problema.). Todas as sentenças geradas fazem parte estritamente da sentença especificad

Como podemos abordar a solução desse problema? Eu estava pensando em criar dados de treinamento anotados com um conjunto de sub-sentenças legais para cada sentença no conjunto de dados de treinamento. E, em seguida, escreva alguns algoritmos de aprendizado supervisionado para gerar um model

Sou bastante novo na PNL e no Machine Learning, por isso seria ótimo se vocês pudessem sugerir algumas maneiras de resolver esse problem

questionAnswers(8)

yourAnswerToTheQuestion