Поиск повторяющихся слов в PHP без указания самого слова
Я думал о чем-то для проекта, который я хочу сделать, я не продвинутый пользователь, и я только учусь. Не знаю, возможно ли это:
Предположим, у нас есть 100 HTML-документов, содержащих много таблиц и текст внутри них.
Вопрос первый: можно ли проанализировать весь этот текст, найти повторяющиеся слова и сосчитать его?
Да, это можно сделать с некоторыми функциями, но вот проблема: что, если мы не знали слов, которые найдем? То есть мы должны были бы сказать коду, что означает слово.
Предположим, например, что одно слово будет объединением из семи символов, идея состоит в том, чтобы найти другие похожие шаблоны и упомянуть его. Каков был бы лучший способ сделать это?
Заранее большое спасибо.
Пример:
Поиск: Пять символов символов по следующим фразам:
Текст первый:
«Требуется океан, чтобы не разбиться»
Текст второй:
«Океан - это соленая вода»
Результат
Takes 1
Break 1
water 1
Ocean 2
Заранее спасибо за вашу помощь.