Как разделить слова в «предложении» пробелами?
Нужна автоматизация создания доменов в JasperServer. Домены - это «просмотр» данных для создания специальных отчетов. Имена столбцов должны быть представлены пользователю в удобочитаемой форме.
проблемаСуществует более 2000 возможных фрагментов данных, которые теоретически организация может захотеть включить в отчет. Данные получены из не дружественных человеку имен, таких как:
платежный период
ВопросКак бы вы автоматически изменили такие имена на:
код соответствия периода оплатыкод распределения трудазависимые отношенияидеиИспользуйте GoogleТы имел ввиду двигатель, однако я думаю, что это нарушает их TOS:
lynx -dump «url» | grep "Did you mean" | awk ...
Любой язык хорош, но синтаксические анализаторы текста, такие как Perl, вероятно, подойдут. (Имена столбцов только на английском языке.)
Ненужная префекцияЦель - не 100% совершенство в разделении слов; следующий результат является приемлемым:
enrollmenteffectivedate -> Дата вступления в силуenrollmentenddate -> Enroll Men Tend Dateenrollmentrequirementset -> Набор требований регистрацииНезависимо от того, что человеку нужно будет перепроверить результаты и исправить многие. Сокращение набора из 2000 результатов до 600 изменений приведет к значительной экономии времени. Закрепить нанемного Случаи, имеющие несколько возможностей (например, имя терапевта), должны полностью упустить смысл.