Как разделить слова в «предложении» пробелами?

Фон

Нужна автоматизация создания доменов в JasperServer. Домены - это «просмотр» данных для создания специальных отчетов. Имена столбцов должны быть представлены пользователю в удобочитаемой форме.

проблема

Существует более 2000 возможных фрагментов данных, которые теоретически организация может захотеть включить в отчет. Данные получены из не дружественных человеку имен, таких как:

платежный период

Вопрос

Как бы вы автоматически изменили такие имена на:

код соответствия периода оплатыкод распределения трудазависимые отношенияидеи

Используйте GoogleТы имел ввиду двигатель, однако я думаю, что это нарушает их TOS:

lynx -dump «url» | grep "Did you mean" | awk ...

Языки

Любой язык хорош, но синтаксические анализаторы текста, такие как Perl, вероятно, подойдут. (Имена столбцов только на английском языке.)

Ненужная префекция

Цель - не 100% совершенство в разделении слов; следующий результат является приемлемым:

enrollmenteffectivedate -> Дата вступления в силуenrollmentenddate -> Enroll Men Tend Dateenrollmentrequirementset -> Набор требований регистрации

Независимо от того, что человеку нужно будет перепроверить результаты и исправить многие. Сокращение набора из 2000 результатов до 600 изменений приведет к значительной экономии времени. Закрепить нанемного Случаи, имеющие несколько возможностей (например, имя терапевта), должны полностью упустить смысл.

Ответы на вопрос(6)

Ваш ответ на вопрос