Поиск повторяющихся слов в PHP без указания самого слова

я думал о чем-то для проекта, который я хочу сделать, яя не продвинутый пользователь и яЯ только учусь. Не знаю, возможно ли это:

Предположим, у нас есть 100 HTML-документов, содержащих много таблиц и текст внутри них.

Вопрос первый: можно ли проанализировать весь этот текст, найти повторяющиеся слова и сосчитать его?

Да, это'можно сделать с некоторыми функциями, но здесьПроблема в том, что, если мы не знали слов, которые найдем? То есть мы должны были бы сказать коду, что означает слово.

Предположим, например, что одно слово будет объединением из семи символов, идея состоит в том, чтобы найти другие похожие шаблоны и упомянуть его. Каков был бы лучший способ сделать это?

Заранее большое спасибо.

Пример:

Поиск: Пять символов символов по следующим фразам:

Текст первый: "

Требуется океан, чтобы не разбиться "

Текст второй:

Океан - это соленая вода "

Результат

Takes 1 
Break 1
water 1
Ocean 2

Заранее спасибо за помощь.

Ответы на вопрос(1)

Ваш ответ на вопрос