_Actual_ Twitter формат для хэштегов? Не ваше регулярное выражение, не его код - настоящий?

Обновление: используйте сущности Твиттера, если можете - они выяснили это для вас так же, как и другие предметы. Мой случай таков, что у меня просто твит без сущностей и всех дополнительных метаданных

Я потратил то, что считаю неоправданным количеством времени, пытаясь найтифактический формат для хэштегов.

Насколько мой поиск может сказать - Twitter не опубликовал ни одного.

Я знаю, что многие люди придумали регулярные выражения для их анализа, однако регулярное выражение вашей библиотеки не является регулярным выражением моей библиотеки, и, возможно, вам все равно не нравится ваше.

Поэтому я спрашиваю - есть ли официальные спецификации? Я не хочу регулярного ответа, я хочу BNF или что-то подобное. Или минимально - полный список разделителей.

Дополнительные очки сложности- также важно захватить их из случайных текстов сообщений в юникоде (не на английском языке).

Примечание: я хорошо осведомлен о сущностях, и они не применимы к моему делу (месяцы сообщений в Твиттере, хранящихся в БД).

Ответы на вопрос(6)

Ваш ответ на вопрос