Разделение строк по регулярным выражениям с помощью знаков препинания, пробелов и т. Д. В Java
У меня есть этот текстовый файл, который я прочитал в приложение Java, а затем посчитал слова в нем построчно. Прямо сейчас я разделяю строки на слова
String.split([\\p{Punct}\\s+])"
Но я знаю, что мне не хватает некоторых слов из текстового файла. Например, слово «не может» следует разделить на два слова «можно» и «т».
Запятые и другие знаки препинания следует полностью игнорировать и рассматривать как пробел. Я пытался понять, как сформировать более точное Регулярное выражение, чтобы сделать это, но я новичок в этом вопросе, поэтому мне нужна помощь.
Что может быть лучшим регулярным выражением для цели, которую я описал?