_Actual_ Twitter формат для хэштегов? Не ваше регулярное выражение, не его код - настоящий?
Я потратил то, что считаю неоправданным количеством времени, пытаясь найтифактический формат для хэштегов.
Насколько мой поиск может сказать - Twitter не опубликовал ни одного.
Я знаю, что многие люди придумали регулярные выражения для их анализа, однако регулярное выражение вашей библиотеки не является регулярным выражением моей библиотеки, и, возможно, вам все равно не нравится ваше.
Поэтому я спрашиваю - есть ли официальные спецификации? Я не хочу регулярного ответа, я хочу BNF или что-то подобное. Или минимально - полный список разделителей.
Дополнительные очки сложности- также важно захватить их из случайных текстов сообщений в юникоде (не на английском языке).
Примечание: я хорошо осведомлен о сущностях, и они не применимы к моему делу (месяцы сообщений в Твиттере, хранящихся в БД).