Corrección en regex
Tengo un contenido que tiene contenido junto con etiquetas HTML dentro del contenido. Estoy tratando de identificar<ins></ins>
y<del></del>
con las condiciones mencionadas en la imagen
http://i.stack.imgur.com/8iNWl.png
La expresión regular eshttps://regex101.com/r/cE4mE3/30
Solo falla en un solo caso, es decir, cuando hay una etiqueta HTML o un carácter especial dentro<ins></ins>
no se identifica correctamente. En la expresión regular anterior hay un</ins></ins>
dentro de otro<ins></ins>
y por lo tanto se está rompiendo antes del inicio de abrir<ins>
etiqueta. La identificación de expresiones regulares debe detenerse solo cuando hay una parada completa o una coma o espacio entre un<ins></ins>
. Pero si hay alguna etiqueta HTML u otra<ins></ins>
etiquetarse dentro de otro<ins></ins>
La identificación debe continuar.
En la expresión regular anterior, los grupos que se seleccionarán son
1. <ins class="ins">ff</ins><del class="del">C</del>om<del class="del"> </del><ins class="ins"><ins class="ins">g</ins></ins><del class="del"> g</del>gp<del class="del">a</del>n<del class="del">y</del>
y
2. test<del class="del">test</del><ins class="ins">tik</ins><del class="del">peop</del>man<del class="del"> </del></i><del class="del"> g</del>gp<del class="del">a</del>n<del class="del">y</del>
Pero como hay etiquetas HTML entre la identificación, se detiene cerca de la etiqueta HTML en 1 y 2 grupos.