_Actual_ ¿Formato de Twitter para hashtags? ¿No es su expresión regular, no su código, el verdadero?

Update: use las entidades de Twitter si puede, lo descubrieron por usted y otros elementos. Mi caso es que solo tengo el tweet sin entidades y todos los metadatos adicionales

He pasado lo que considero una cantidad de tiempo irracional tratando de encontrar elrea formato para hashtags.

Por lo que mi búsqueda puede decir, Twitter no ha publicado uno.

Sé que muchas personas han ideado expresiones regulares para analizarlas, sin embargo, la expresión regular de su lib no es la expresión regular de mi lib y tal vez no me guste la suya de todos modos.

Así que pregunto, ¿hay alguna especificación oficial real? No quiero una respuesta regex, quiero un BNF o algo similar. O, como mínimo, una lista completa de delimitadores.

Puntos de dificultad adicionales - también es importante tomarlos de mensajes aleatorios de texto unicode (que no están en inglés).

Nota: conozco bastante las entidades y no son aplicables a mi caso (meses de mensajes de Twitter almacenados en una base de datos).

Respuestas a la pregunta(12)

Su respuesta a la pregunta