Analizowanie nagłówków podobnych do wiadomości e-mail (podobnych do RFC822)

Problem / pytanie

Tam jestbaza danych informacji o botach które chciałbym przeanalizować. Mówi się, że tak jestpodobny do komunikatów RFC822.

Zanim ponownie wymyśliłem koło i napisałem własny parser, pomyślałem, że zobaczę, czy coś innego jest już dostępne. Natknąłem sięimap_rfc822_parse_headers(), który wydaje się robić dokładnie to, czego chcę. Niestety rozszerzenie IMAP nie jest dostępne w moim środowisku.

Widziałem wiele alternatyw online i na temat przepełnienia stosu. Niestety wszystkie są zbudowane na potrzeby poczty e-mail i robią więcej niż potrzebuję ... często parsuję całą pocztę elektroniczną i obsługuję nagłówki w specjalny sposób. Chcę po prostu przeanalizować te nagłówki w użytecznym obiekcie lub tablicy.

Czy istnieje prosta wersja PHPimap_rfc822_parse_headers() dostępne lub coś równoważnego, które będą analizować takie dane? Jeśli nie, napiszę własną.

Przykładowe dane
robot-id: abcdatos
robot-name: ABCdatos BotLink
robot-from: no
robot-useragent: ABCdatos BotLink/1.0.2 (test links)
robot-language: basic
robot-description: This robot is used to verify availability of the ABCdatos
                   directory entries (http://www.abcdatos.com), checking
                   HTTP HEAD. Robot runs twice a week. Under HTTP 5xx
                   error responses or unable to connect, it repeats
                   verification some hours later, verifiying if that was a
                   temporary situation.
robot-history: This robot was developed by ABCdatos team to help
               working in the directory maintenance.
robot-environment: commercial
modified-date: Thu, 29 May 2003 01:00:00 GMT
modified-by: ABCdatos

robot-id:                       acme-spider
robot-name:                     Acme.Spider
robot-cover-url:                http://www.acme.com/java/software/Acme.Spider.html
robot-exclusion:                yes
robot-exclusion-useragent:      Due to a deficiency in Java it's not currently possible to set the User-Agent.
robot-noindex:                  no
robot-host:                     *
robot-language:                 java
robot-description:              A Java utility class for writing your own robots.
robot-history:                  
robot-environment:              
modified-date:                  Wed, 04 Dec 1996 21:30:11 GMT
modified-by:                    Jef Poskanzer

...

questionAnswers(2)

yourAnswerToTheQuestion