Нахождение значимых под-предложений из предложения

Есть ли способ найти все под-предложения предложения, которые все еще имеют смысл и содержат хотя бы один предмет, глагол и предикат / объект?

Например, если у нас есть предложение типа «Я собираюсь провести семинар по НЛП на SXSW в Остине в следующем месяце». Из этого предложения мы можем извлечь следующие значимые подпункты: «Я собираюсь провести семинар», «Я собираюсь провести семинар по НЛП», «Я собираюсь провести семинар по НЛП на SXSW», « Я собираюсь провести семинар в SXSW »,« Я собираюсь сделать семинар в Остине »,« Я собираюсь сделать семинар по НЛП в следующем месяце »и т. Д.

Обратите внимание, что здесь нет выводимых предложений (например, «в следующем месяце на SXSW будет семинар по НЛП». Хотя это действительно так, нам это не нужно как часть этой проблемы). Все сгенерированные предложения являются строго частью данного предложения.

Как мы можем подойти к решению этой проблемы? Я думал о создании аннотированных обучающих данных, в которых есть набор юридических предложений для каждого предложения в наборе обучающих данных. А затем напишите некоторый контролируемый алгоритм (ы) обучения для генерации модели.

Я совершенно новичок в области НЛП и машинного обучения, поэтому было бы здорово, если бы вы, ребята, могли предложить несколько способов решения этой проблемы.

Ответы на вопрос(4)

Ваш ответ на вопрос