Extraer nombres de dominio de una lista de URL en Excel

  • Compartir Este
Michael Brown

Algunos trucos y consejos le ayudarán a obtener nombres de dominio de una lista de URL utilizando fórmulas de Excel. Dos variaciones de la fórmula le permiten extraer los nombres de dominio con y sin www. independientemente del protocolo de la URL (se admiten http, https, ftp, etc.). La solución funciona en todas las versiones modernas de Excel, desde 2010 hasta 2016.

Si te dedicas a promocionar tu sitio web (como yo) o a hacer SEO a nivel profesional promocionando sitios web de clientes por dinero, a menudo tienes que procesar y analizar enormes listas de URLs: informes de Google Analytics sobre adquisición de tráfico, informes de Webmaster Tools sobre nuevos enlaces, informes sobre backlinks a los sitios web de tus competidores (que contienen una gran cantidad de datos interesantes ;) ), etc.y así sucesivamente.

Para procesar este tipo de listas, de diez a un millón de enlaces, Microsoft Excel es una herramienta ideal. Es potente, ágil, ampliable y le permite enviar un informe a su cliente directamente desde una hoja Excel.

"¿Por qué este rango, de 10 a 1.000.000?", me preguntarás. Porque definitivamente no necesitas una herramienta para procesar menos de 10 enlaces; y casi no necesitarás ninguna si tienes más de un millón de enlaces entrantes. Apostaría a que en este caso ya habrás hecho desarrollar algún software a medida especialmente para ti, con una lógica de negocio específicamente adaptada a tus necesidades. Y sería yo quien se pusiera a revisarsus artículos y no al revés :)

Al analizar una lista de URL, a menudo es necesario realizar las siguientes tareas: obtener nombres de dominio para su posterior procesamiento, agrupar URL por dominio, eliminar enlaces de dominios ya procesados, comparar y fusionar dos tablas por nombres de dominio, etc.

    5 sencillos pasos para extraer nombres de dominio de la lista de URL

    Como ejemplo, tomemos un fragmento del informe de backlinks de ablebits.com generado por las Herramientas para webmasters de Google.

    Consejo: Te recomiendo que utilices ahrefs.com para detectar puntualmente nuevos enlaces a tu sitio web y a los de la competencia.

    1. Añade el " Dominio "al final de la tabla.

      Hemos exportado los datos de un CSV pulse Ctrl + T para convertirlos en una tabla de Excel, ya que es mucho más cómodo trabajar con ella.

    2. En la primera celda del campo " Dominio "(B2), introduzca la fórmula para extraer un nombre de dominio:
      • Extraer el dominio con www. si está presente en una URL:

    =MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)

  • Omita www. y obtenga un nombre de dominio puro:
  • =IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7,FIND("/",A2,9)-FIND(":",A2,4)-7))

    La segunda fórmula puede parecer demasiado larga y compleja, pero sólo si no has visto fórmulas realmente largas. No en vano Microsoft ha aumentado la longitud máxima de las fórmulas hasta 8192 caracteres en las nuevas versiones de Excel :)

    Lo bueno es que no tenemos que utilizar ni una columna adicional ni una macro VBA. De hecho, utilizar macros VBA para automatizar tus tareas en Excel no es tan difícil como puede parecer, ver un artículo muy bueno - cómo crear y utilizar macros VBA. Pero en este caso concreto, en realidad no las necesitamos, es más rápido y sencillo recurrir a una fórmula.

    Nota: Técnicamente, www es el dominio de 3er nivel, aunque en todos los sitios web normales www. es sólo un alias del dominio principal. En los primeros días de Internet, podías decir "doble u, doble u, doble u nuestro nombre guay punto com" por teléfono o en un anuncio de radio, y todo el mundo entendía perfectamente y recordaba dónde buscarte, por supuesto a menos que tu nombre guay fuera algo comowww.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)

    Tienes que dejar todos los demás nombres de dominio del 3er nivel, de lo contrario estropearías los enlaces desde diferentes sitios, por ejemplo, con dominio "co.uk" o desde diferentes cuentas en blogspot.com, etc.

  • Como tenemos una tabla completa, Excel copia automáticamente la fórmula en todas las celdas de la columna.

    Ya tenemos una columna con los nombres de dominio extraídos.

    En la siguiente sección aprenderá cómo puede procesar una lista de URLs basándose en la columna Dominio.

    Sugerencia: Si más adelante necesita editar los nombres de dominio manualmente o copiar los resultados en otra hoja de cálculo de Excel, sustituya los resultados de la fórmula por valores. Para ello, siga los pasos que se indican a continuación:

    • Haz clic en cualquier celda de la columna Dominio y pulsa Ctrl+Espacio para seleccionar todas las celdas de esa columna.
    • Pulse Ctrl + C para copiar los datos en el Portapapeles y, a continuación, vaya a la pantalla Inicio haga clic en " Pegar "y seleccione " Valor " en el menú desplegable.
  • Procesamiento de una lista de URL mediante la columna Nombre de dominio

    Aquí encontrará algunos consejos sobre el tratamiento posterior de la lista de URL, basados en mi propia experiencia.

    Agrupar URL por dominio

    1. Haga clic en cualquier celda del Dominio columna.
    2. Ordene su tabla por Dominio: vaya a la pestaña Datos y haga clic en A-Z botón.
    3. Convierta su tabla de nuevo en un rango: haga clic en cualquier celda de la tabla, vaya a la opción Diseño y haga clic en " Convertir al rango ".
    4. Ir a la Datos y haga clic en " Subtotal ".
    5. En el cuadro de diálogo "Subtotal", seleccione las siguientes opciones: En cada cambio de : "Dominio" función de uso Contar y Añadir subtotal a Dominio.

  • Haga clic en Aceptar.
  • Excel ha creado un esquema de sus datos en la parte izquierda de la pantalla. Hay 3 niveles del esquema y lo que ve ahora es la vista expandida, o vista de nivel 3. Haga clic en el número 2 en la esquina superior izquierda para mostrar los datos finales por dominios y, a continuación, puede hacer clic en los signos más y menos (+ / -) para expandir / contraer los detalles de cada dominio.

    Resalte la segunda URL y todas las posteriores del mismo dominio

    En nuestra sección anterior mostramos cómo agrupar URLs por dominio. En lugar de agrupar, puede colorear rápidamente las entradas duplicadas del mismo nombre de dominio en sus URLs.

    Para más detalles, consulte cómo resaltar duplicados en Excel.

    Compare sus URL de diferentes tablas por columna de dominio

    Puede que tengas una o varias hojas de cálculo de Excel separadas en las que guardas una lista de nombres de dominio. Puede que tus tablas contengan enlaces con los que no quieres trabajar, como spam o los dominios que ya has procesado. También puede que necesites guardar una lista de dominios con enlaces interesantes y eliminar todos los demás.

    Por ejemplo, mi tarea es colorear en rojo todos los dominios que están en mi lista negra de spammer:

    Para no perder mucho tiempo, puedes comparar tus tablas para eliminar los enlaces innecesarios. Para más detalles, lee Cómo comparar dos columnas de Excel y eliminar duplicados

    La mejor manera es fusionar dos tablas por nombre de dominio

    Esta es la forma más avanzada y la que personalmente prefiero.

    Supongamos que tienes una hoja de Excel con datos de referencia para cada dominio con el que has trabajado. Esta hoja guarda los contactos de los webmasters para el intercambio de enlaces y la fecha en la que tu sitio web fue mencionado en este dominio. También puede haber tipos/subtipos de sitios web y una columna separada con tus comentarios, como en la captura de pantalla de abajo.

    En cuanto obtengas una nueva lista de enlaces, puedes cotejar dos tablas por nombre de dominio y fusionar la información de la tabla de búsqueda de dominios y tu nueva hoja de URLs en sólo dos minutos.

    Esto le permitirá ver las URL de la lista que debe eliminar y las que debe procesar.

    Emparejar dos tablas por nombre de dominio y fusionar datos:

    1. Descargue e instale la última versión de Merge Tables Wizard para Microsoft Excel

      Esta ingeniosa herramienta emparejará y combinará dos hojas de cálculo de Excel 2013-2003 en un instante. Puede utilizar una o varias columnas como identificador único, actualizar las columnas existentes en la hoja de cálculo maestra o añadir nuevas desde la tabla de consulta. No dude en leer más sobre el Asistente para combinar tablas en nuestro sitio web.

    2. Abra su lista de URL en Excel y extraiga los nombres de dominio como se ha descrito anteriormente.
    3. Seleccione cualquier celda de su tabla. A continuación, vaya a la opción Datos de Ablebits y haga clic en Fusionar dos tablas para ejecutar el complemento.
    4. Pulse el botón Siguiente dos veces y seleccione su hoja de cálculo con la información de los dominios como el Tabla de consulta .
    5. Marque la casilla situada junto a Dominio para identificarlo como el columna correspondiente .
    6. Selecciona qué información sobre el dominio quieres añadir a la lista de URLs y pulsa Siguiente.
    7. Pulse el botón Acabado Cuando finalice el proceso, el complemento le mostrará un mensaje con los detalles de la fusión.

    En unos segundos obtendrá toda la información sobre cada nombre de dominio de un vistazo.

    Puede descargar el Asistente para combinar tablas para Excel, ejecutarlo con sus datos y comprobar lo útil que puede resultar.

    Si está interesado en obtener un complemento gratuito para extraer nombres de dominio y subcarpetas del dominio raíz (.com, .edu, .us, etc.) de la lista de URL, simplemente envíenos un comentario. Al hacerlo, especifique su versión de Excel, por ejemplo, Excel 2010 de 64 bits, e introduzca su dirección de correo electrónico en el campo correspondiente (no se preocupe, no se mostrará públicamente). Si tenemos un número decente de votos, haremos lo siguientecrear un complemento de este tipo y te informo. ¡Gracias de antemano!

    Michael Brown es un entusiasta de la tecnología dedicado y apasionado por simplificar procesos complejos utilizando herramientas de software. Con más de una década de experiencia en la industria de la tecnología, ha perfeccionado sus habilidades en Microsoft Excel y Outlook, así como en Google Sheets y Docs. El blog de Michael está dedicado a compartir su conocimiento y experiencia con otros, brindando consejos y tutoriales fáciles de seguir para mejorar la productividad y la eficiencia. Ya sea un profesional experimentado o un principiante, el blog de Michael ofrece información valiosa y consejos prácticos para aprovechar al máximo estas herramientas de software esenciales.