Estrategias para manejar un archivo con múltiples formatos fijos

Esta pregunta esno Perl-específico, (aunque elunpack la función probablemente figurará en mi implementación).

Tengo que lidiar con archivos donde existen múltiples formatos para desglosar jerárquicamente los datos en secciones significativas. Lo que me gustaría poder hacer es analizar los datos del archivo en una estructura de datos adecuada.

Aquí hay un ejemplo (comentario sobre RHS):

                                       # | Format | Level | Comment
                                       # +--------+-------+---------
**DEVICE 109523.69142                  #        1       1   file-specific
  .981    561A                         #        2       1
10/MAY/2010    24.15.30,13.45.03       #        3       2   group of records
05:03:01   AB23X  15.67   101325.72    #        4       3   part of single record
*           14  31.30474 13        0   #        5       3   part of single record
05:03:15   CR22X  16.72   101325.42    #        4       3   new record
*           14  29.16264 11        0   #        5       3
06:23:51   AW41X  15.67    101323.9    #        4       3
*           14  31.26493219        0   #        5       3
11/MAY/2010    24.07.13,13.44.63       #        3       2   group of new records
15:57:14   AB23X  15.67   101327.23    #        4       3   part of single record
*           14  31.30474 13        0   #        5       3   part of single record
15:59:59   CR22X  16.72   101331.88    #        4       3   new record
*           14  29.16264 11        0   #        5

La lógica que tengo en este momento es frágil:

Sé, por ejemplo, que un Formato 2 siempre viene después de un Formato 1, y que solo abarcan 2 líneas.También sé que los Formatos 4 y 5 siempre vienen en pares, ya que corresponden a un solo registro. El número de registros puede ser variable.Estoy usando expresiones regulares para inferir el formato de cada línea. Sin embargo, esto es arriesgado y no se presta a flexibilidad en el futuro (cuando alguien decide cambiar el formato de la salida).

La gran pregunta aquí es acerca de qué estrategias puedo emplear para determinar qué formato debe usarse para qué línea. Me interesaría saber si otros se han enfrentado a situaciones similares y qué han hecho para abordarlo.

Respuestas a la pregunta(6)

Su respuesta a la pregunta