Результаты поиска по запросу "character-properties"

5 ответов

Регулярное выражение Python, соответствующее свойствам Юникода

Perl и некоторые другие текущие движки регулярных выражений поддерживают свойства Юникода, такие как категория, в регулярном выражении. Например. в Perl вы можете использовать\p{Ll} соответствовать произвольной строчной букве, илиp{Zs} для любого ...

3 ответа

 следует договориться о том, что такое слово характер, а что нет.

3 ответа

 и также isLetter и действительно подходит для меня. У вас есть таблицы символов Unicode, скомпилированные в?

аюсь написать достаточно разрешительный валидатор для имен в PHP, и моя первая попытка состоит в следующем: // unicode letters, apostrophe, hyphen, space $namePattern = "/^([\\p{L}'\\- ])+$/";Это в конечном итоге передается на ...

ТОП публикаций

2 ответа

(В последнем случае запятая - это китайская запятая.)

читал другие вопросы в Stackoverflow, но все же не ближе. Извините, если на это уже ответили, но я не получил ничего предложенного там, чтобы работать. >>> import re >>> m ...

2 ответа

Regex - справочник по свойствам Юникода и примеры

Я чувствую себя потерянным из-за свойств Regex Unicode, представленных RegexBuddy, я не могу различить любое из свойств Number, и свойство символа Math только кажется, что оно совпадает+ но нет-, *, /, ^ например. Свойства Unicode RegexBuddy ...

3 ответа

Исправлено, ура!

есть много вопросов и ответов о StackOverflow, которые предполагают, что «буква» может быть найдена в регулярном выражении[a-zA-Z], Однако в Юникоде есть еще много символов, которые большинство людей воспримут как букву (все греческие буквы, ...

3 ответа

Подчеркивание это слово характер.

#39;s\w соответствовать всем буквенно-цифровым символам, определенным в стандарте Unicode? Например, будет\w соответствовать всем (скажем) китайским и русским буквенно-цифровым символам? Я написал простой тестовый скрипт (см. Ниже), который ...

2 ответа

(Сценарии) Юникод

aScript мы можем сопоставлять отдельные кодовые точки Unicode или диапазоны кодовых точек, используя escape-последовательности Unicode, например: "A".match(/\u0041/) // => ["A"] "B".match(/[\u0041-\u007A]/) // => ["B"]Но как мы можем создать ...

2 ответа

@uTubeFan: Только что видел ваш предыдущий комментарий. В любом случае вы сохранили работу для меня :)

кнулся на некоторые регулярные выражения, которые содержат[^\\p{L}], Я понимаю, что это использует какую-то форму категории Юникод, но когда я ...

2 ответа

, если поддерживается, обнаруживать все, что есть (или нет, конечно), из языка, который использует любой из блоков Unicode Latin.

я есть некоторые документы, которые прошли конвертацию из PDF в HTML. Из-за этого у них было много случайных знаков препинания в юникоде, где конвертер испортился (то есть, elipses и т. Д.). У них также правильно есть набор неанглоязычных, но все ...