как я могу определить фарси веб-страниц по Тика?
Мне нужен пример кода, который поможет мне обнаружить веб-страницы на фарси с помощью Apache Tika Toolkit.
LanguageIdentifier identifier = new LanguageIdentifier("فارسی");
String language = identifier.getLanguage();
Я скачал файлы jar apache.tika и добавил их в путь к классам. но этот код выдает ошибку для языка фарси, но он работает для английского языка. как я могу добавить фарси в пакет languageIdentifier tika?