Python urlparse - extrae el nombre de dominio sin subdominio

Question

Jan 18, 2013, 08:33 PM

Python urlparse - extrae el nombre de dominio sin subdominio

Necesita una forma de extraer un nombre de dominio sin el subdominio de una url usando Python urlparse.

Por ejemplo, me gustaría extraer"google.com" de una url completa como"http://www.google.com".

Lo más cerca que parece que puedo venir conurlparse es elnetloc atributo, pero eso incluye el subdominio, que en este ejemplo seríawww.google.com.

Sé que es posible escribir alguna manipulación de cadena personalizada para convertir www.google.com en google.com, pero quiero evitar las transformaciones de cadenas o expresiones regulares a mano en esta tarea. (La razón de esto es que no estoy lo suficientemente familiarizado con las reglas de formación de url para sentirme seguro de que podría considerar cada caso límite requerido al escribir una función de análisis personalizada).

O siurlparse no puedo hacer lo que necesito, ¿alguien sabe alguna otra biblioteca de análisis de URL de Python que lo haría?