Поиск повторяющихся слов в PHP без указания самого слова

Я думал о чем-то для проекта, который я хочу сделать, я не продвинутый пользователь, и я только учусь. Не знаю, возможно ли это:

Предположим, у нас есть 100 HTML-документов, содержащих много таблиц и текст внутри них.

Вопрос первый: можно ли проанализировать весь этот текст, найти повторяющиеся слова и сосчитать его?

Да, это можно сделать с некоторыми функциями, но вот проблема: что, если мы не знали слов, которые найдем? То есть мы должны были бы сказать коду, что означает слово.

Предположим, например, что одно слово будет объединением из семи символов, идея состоит в том, чтобы найти другие похожие шаблоны и упомянуть его. Каков был бы лучший способ сделать это?

Заранее большое спасибо.

Пример:

Поиск: Пять символов символов по следующим фразам:

Текст первый:

«Требуется океан, чтобы не разбиться»

Текст второй:

«Океан - это соленая вода»

Результат

Takes 1 
Break 1
water 1
Ocean 2

Заранее спасибо за вашу помощь.

Ответы на вопрос(1)

Ваш ответ на вопрос