Python urlparse - extrae el nombre de dominio sin subdominio
Necesita una forma de extraer un nombre de dominio sin el subdominio de una url usando Python urlparse.
Por ejemplo, me gustaría extraer"google.com"
de una url completa como"http://www.google.com"
.
Lo más cerca que parece que puedo venir conurlparse
es elnetloc
atributo, pero eso incluye el subdominio, que en este ejemplo seríawww.google.com
.
Sé que es posible escribir alguna manipulación de cadena personalizada para convertir www.google.com en google.com, pero quiero evitar las transformaciones de cadenas o expresiones regulares a mano en esta tarea. (La razón de esto es que no estoy lo suficientemente familiarizado con las reglas de formación de url para sentirme seguro de que podría considerar cada caso límite requerido al escribir una función de análisis personalizada).
O siurlparse
no puedo hacer lo que necesito, ¿alguien sabe alguna otra biblioteca de análisis de URL de Python que lo haría?