Вертикальная черта (|) Замена Юникода

Мы используем вертикальную черту| (|) символ как разделитель полей в одном из наших модулей. поэтому пользователи не должны использовать этот символ в заголовке.

Если они его используют, я бы хотел заменить его похожим символом.

Есть ли для него замена Юникодом? Единственный найденный мной персонаж, похожий на него, это разбитая вертикальная черта¦ (¦).

 tchrist13 мая 2012 г., 18:01
Что вообще такое "Анси"? Похоже, еще один сбивающий с толку и бессмысленный обман Microsoft. Это не имеет никакого смысла. Пожалуйста, используйте стандартный язык, а не собственный жаргон.
 ZigiZ13 мая 2012 г., 17:03
@ MattBall, я имел в виду замену Unicode для Ansi '|' полукокса, предложенный Юозасом Домаркасом. Я не могу использовать побег для этого (в течение ограниченного времени), но я знаю, что это должен был быть правильный путь.
 Matt Ball13 мая 2012 г., 18:02
@ tchrist Я думаю, ты хотел@ZigiZ, но в любом случае, «ANSI» - это неправильное название в мире Windows, используемое как синоним «Windows-1252».
 tchrist13 мая 2012 г., 18:03
@ MattBall Да, я исправил бит @ ZigiZ, но ты слишком быстр в розыгрыше. :)
 Matt Ball13 мая 2012 г., 16:48
| - это Юникод. Как насчет побега набрал| вместо?

Ответы на вопрос(2)

Решение Вопроса

что тебе действительно нужно. Вам нужно изменить последовательность разделителей на что-то гарантированно не существующее в наборе данных?

Если так, то именно для этого и предназначены 66 «не символьных» кодовых точек Unicode. Вы можете использовать их в качестве внутренних стражей, зная, что они не могут присутствовать в действительных данных.

Если вы просто ищете визуальный аналог, это совсем другое. Я бы не советовал, потому что есть много смущающих. Вот лишь некоторые из них:

U+0007C ‭ |  GC=Sm SC=Common       VERTICAL LINE
U+000A6 ‭ ¦  GC=So SC=Common       BROKEN BAR
U+002C8 ‭ ˈ  GC=Lm SC=Common       MODIFIER LETTER VERTICAL LINE
U+002CC ‭ ˌ  GC=Lm SC=Common       MODIFIER LETTER LOW VERTICAL LINE
U+02016 ‭ ‖  GC=Po SC=Common       DOUBLE VERTICAL LINE
U+023D0 ‭ ⏐  GC=So SC=Common       VERTICAL LINE EXTENSION
U+02758 ‭ ❘  GC=So SC=Common       LIGHT VERTICAL BAR
U+02759 ‭ ❙  GC=So SC=Common       MEDIUM VERTICAL BAR
U+0275A ‭ ❚  GC=So SC=Common       HEAVY VERTICAL BAR
U+02AF4 ‭ ⫴  GC=Sm SC=Common       TRIPLE VERTICAL BAR BINARY RELATION
U+02AF5 ‭ ⫵  GC=Sm SC=Common       TRIPLE VERTICAL BAR WITH HORIZONTAL STROKE
U+02AFC ‭ ⫼  GC=Sm SC=Common       LARGE TRIPLE VERTICAL BAR OPERATOR
U+02AFE ‭ ⫾  GC=Sm SC=Common       WHITE VERTICAL BAR
U+02AFF ‭ ⫿  GC=Sm SC=Common       N-ARY WHITE VERTICAL BAR
U+0FF5C ‭ | GC=Sm SC=Common       FULLWIDTH VERTICAL LINE
U+0FFE4 ‭ ¦ GC=So SC=Common       FULLWIDTH BROKEN BAR
 ZigiZ13 мая 2012 г., 19:01
То, что я прыгал, былоvisual lookalike. Я не должен был упоминать разделительную часть в моем вопросе - мой плохой. (разделитель не используется ни в csv, ни в xml, ни в качестве разделителя полей - это слишком сложно объяснить, поэтому я не буду ...). но так как вы упомянули 66 не символьных кодовых точек, было бы неплохо узнать, какой блок Unicode они содержат.
 tchrist13 мая 2012 г., 19:32
@ ZigiZ 66 не символьных кодовых точек - это «32 между U + FDD0 и U + FDEF, а 34 кодовых точки U + FFFE, U + FFFF, U + 1FFFE, U + 1FFFF, ... U + 10FFFE , U + 10FFFF. Некоторые люди ошибочно полагают, что это «незаконно», но это не так. Приложение или набор приложений могут на законных основаниях использовать их по своему усмотрению; но эти кодовые точки «недопустимы для открытого обмена».

'легкая вертикальная черта' в Юникоде: ❘, кодовая точка U + 2758

 user125489313 мая 2012 г., 17:07
И это, друг мой, поэтому мы используем escape-символы.
 ZigiZ13 мая 2012 г., 17:06
Это хороший ответ, однако есть большое ограничение для шрифтов, которые поддерживают этот символ :( Я пробовал ❘) в IE9, и он показывает некрасивый квадрат.

Ваш ответ на вопрос