Extração de TLD de URLs e classificação de domínios e subdomínios para cada arquivo de TLD

Tenho uma lista de milhões de URLs. Preciso extrair o TLD de cada URL e criar vários arquivos para cada TLD. Por exemplo, colete todos os URLs com .com como tld e despeje em 1 arquivo, outro arquivo para .edu tld e assim por diante. Além disso, dentro de cada arquivo, tenho que classificá-lo em ordem alfabética por domínios e depois por subdomínios etc.

Alguém pode me dar uma vantagem para implementar isso em per

questionAnswers(1)

yourAnswerToTheQuestion