Результаты поиска по запросу "character-properties"

2 ответа

Regex - справочник по свойствам Юникода и примеры

Я чувствую себя потерянным из-за свойств Regex Unicode, представленных RegexBuddy, я не могу различить любое из свойств Number, и свойство символа Math тольк...

3 ответа

 и также isLetter и действительно подходит для меня. У вас есть таблицы символов Unicode, скомпилированные в?

аюсь написать достаточно разрешительный валидатор для имен в PHP, и моя первая попытка состоит в следующем: // unicode letters, apostrophe, hyphen, space $namePattern = "/^([\\p{L}'\\- ])+$/";Это в конечном итоге передается на ...

8 ответов

Python: разбить строку юникода на границы слов

Мне нужно взять строку и сократить ее до 140 символов. В настоящее время я занимаюсь: if len(tweet) > 140: tweet = re.sub(r"\s+", " ", tweet) #normalize space footer = "… " + utils.shorten_urls(post['url']) avail = 140 - len(footer) words ...

ТОП публикаций

8 ответов

Python: разбить строку юникода на границы слов

Мне нужно взять строку и сократить ее до 140 символов.В настоящее время я занимаюсь:

5 ответов

Регулярное выражение Python, соответствующее свойствам Юникода

Perl и некоторые другие текущие движки регулярных выражений поддерживают свойства Юникода, такие как категория, в регулярном выражении. Например. в Perl вы можете использовать\p{Ll} соответствовать произвольной строчной букве, илиp{Zs} для любого ...

1 ответ

Заменить управляющие символы Юникода

Мне нужно заменить все специальные управляющие символы в строке в Java.Я хочу спросить API карт Google v3, и Google, похоже, не нравятся эти символы.Пример:h...

2 ответа

Regex - справочник по свойствам Юникода и примеры

Я чувствую себя потерянным из-за свойств Regex Unicode, представленных RegexBuddy, я не могу различить любое из свойств Number, и свойство символа Math только кажется, что оно совпадает+ но нет-, *, /, ^ например. Свойства Unicode RegexBuddy ...

3 ответа

http://idiosyncratic-ruby.com/30-regex-with-class.html

сно сдокументация Онигурума [http://www.geocities.jp/kosako3/oniguruma/doc/RE.txt],\d тип символов соответствует: десятичная цифра Unicode: General_Category - Decimal_Number Тем не менее, сканирование для\d в строке со всеми символами ...

4 ответа

Regex и Unicode

У меня есть сценарий, который анализирует имена эпизодов телевидения (например, show.name.s01e02.avi), извлекает название эпизода (из API www.thetvdb.com) и автоматически переименовывает их во что-то более приятное (Показать имя - [01x02 ] ...

2 ответа

, если поддерживается, обнаруживать все, что есть (или нет, конечно), из языка, который использует любой из блоков Unicode Latin.

я есть некоторые документы, которые прошли конвертацию из PDF в HTML. Из-за этого у них было много случайных знаков препинания в юникоде, где конвертер испортился (то есть, elipses и т. Д.). У них также правильно есть набор неанглоязычных, но все ...