Training Tagger mit benutzerdefinierten Tags in NLTK

Ich habe ein Dokument mit gekennzeichneten Daten im FormatHi here's my [KEYWORD phone number], let me know when you wanna hangout: [PHONE 7802708523]. I live in a [PROP_TYPE condo] in [CITY New York]. Ich möchte ein Modell anhand eines Satzes dieser Art von markierten Dokumenten trainieren und dann mein Modell zum Markieren neuer Dokumente verwenden. Ist das in NLTK möglich? Ich habe @ angescha chunking und NLTK-Trainer -Skripte, aber diese haben einen eingeschränkten Satz von Tags und Korpora, während mein Dataset benutzerdefinierte Tags hat.