как я могу определить фарси веб-страниц по Тика?

Мне нужен пример кода, который поможет мне обнаружить веб-страницы на фарси с помощью Apache Tika Toolkit.

 LanguageIdentifier identifier = new LanguageIdentifier("فارسی");
        String language = identifier.getLanguage();

Я скачал файлы jar apache.tika и добавил их в путь к классам. но этот код выдает ошибку для языка фарси, но он работает для английского языка. как я могу добавить фарси в пакет languageIdentifier tika?

Ответы на вопрос(1)

Ваш ответ на вопрос