Extraire les noms de domaine d'une liste d'URL dans Excel

  • Partage Ça
Michael Brown

Quelques astuces et conseils vous aideront à extraire les noms de domaine d'une liste d'URL à l'aide de formules Excel. Deux variantes de la formule vous permettent d'extraire les noms de domaine avec et sans www. indépendamment du protocole de l'URL (http, https, ftp etc. sont pris en charge). La solution fonctionne dans toutes les versions modernes d'Excel, de 2010 à 2016.

Si vous vous occupez de la promotion de votre site web (comme moi) ou si vous faites du référencement au niveau professionnel en promouvant les sites web de vos clients pour de l'argent, vous devez souvent traiter et analyser d'énormes listes d'URL : les rapports Google Analytics sur l'acquisition de trafic, les rapports Webmaster tools sur les nouveaux liens, les rapports sur les liens retour vers les sites web de vos concurrents (qui contiennent un grand nombre de faits intéressants ;) ) et ainsi de suite.et ainsi de suite.

Pour traiter de telles listes, de dix à un million de liens, Microsoft Excel est l'outil idéal. Il est puissant, agile, extensible et vous permet d'envoyer un rapport à votre client directement à partir d'une feuille Excel.

"Pourquoi cette fourchette, de 10 à 1.000.000 ?" me direz-vous. Parce que vous n'avez certainement pas besoin d'un outil pour traiter moins de 10 liens ; et vous n'en aurez pratiquement pas besoin si vous avez plus d'un million de liens entrants. Je parierais que dans ce cas, vous avez déjà fait développer un logiciel sur mesure spécialement pour vous, avec une logique d'entreprise spécifiquement adaptée à vos besoins. Et c'est moi qui parcourraivos articles et non l'inverse :)

Lorsque vous analysez une liste d'URL, vous devez souvent effectuer les tâches suivantes : obtenir les noms de domaine pour un traitement ultérieur, regrouper les URL par domaine, supprimer les liens des domaines déjà traités, comparer et fusionner deux tableaux par noms de domaine, etc.

    5 étapes faciles pour extraire les noms de domaine de la liste des URLs

    À titre d'exemple, prenons un extrait du rapport sur les backlinks de ablebits.com généré par Google Webmaster Tools.

    Conseil : je vous recommande d'utiliser ahrefs.com pour repérer rapidement les nouveaux liens vers votre site et ceux de vos concurrents.

    1. Ajouter le " Domaine "à la fin de votre tableau.

      Nous avons exporté les données d'un CSV C'est pourquoi, en termes d'Excel, nos données se trouvent dans une simple plage. Appuyez sur Ctrl + T pour les convertir en un tableau Excel, car c'est beaucoup plus pratique pour travailler.

    2. Dans la première cellule du " Domaine Dans la colonne " (B2) ", entrez la formule pour extraire un nom de domaine :
      • Extraire le domaine avec www. s'il est présent dans une URL :

    =MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)

  • Omettez www. et obtenez un nom de domaine pur :
  • =IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(" :",A2,4)+3,FIND("/",A2,9)-FIND(" :",A2,4)-3), MID(A2,FIND(" :",A2,4)+7,FIND("/",A2,9)-FIND(" :",A2,4)-7))

    La deuxième formule peut sembler trop longue et complexe, mais seulement si vous n'avez pas vu de formules vraiment longues. Ce n'est pas sans raison que Microsoft a augmenté la longueur maximale des formules jusqu'à 8192 caractères dans les nouvelles versions d'Excel :)

    La bonne nouvelle est que nous n'avons pas besoin d'utiliser une colonne supplémentaire ou une macro VBA. En fait, l'utilisation de macros VBA pour automatiser vos tâches Excel n'est pas aussi difficile qu'il n'y paraît, voir un très bon article - comment créer et utiliser des macros VBA. Mais dans ce cas particulier, nous n'en avons pas vraiment besoin, il est plus rapide et plus facile d'utiliser une formule.

    Note : Techniquement, www Au début de l'Internet, vous pouviez dire "double u, double u, double u our cool name dot com" au téléphone ou dans une publicité à la radio, et tout le monde comprenait parfaitement et se souvenait de l'endroit où vous chercher, bien sûr à moins que votre nom cool soit quelque chose commewww.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)

    Vous devez laisser tous les autres noms de domaine de troisième niveau, sinon vous risquez de perturber les liens provenant de différents sites, par exemple avec le domaine "co.uk" ou à partir de différents comptes sur blogspot.com, etc.

  • Comme nous avons un tableau à part entière, Excel copie automatiquement la formule dans toutes les cellules de la colonne.

    Voilà, nous avons une colonne avec les noms de domaine extraits.

    Dans la section suivante, vous apprendrez comment traiter une liste d'URLs basée sur la colonne Domaine.

    Conseil : si vous devez modifier les noms de domaine manuellement ultérieurement ou copier les résultats dans une autre feuille de calcul Excel, remplacez les résultats de la formule par des valeurs. Pour ce faire, procédez comme suit :

    • Cliquez sur une cellule de la colonne Domaine et appuyez sur Ctrl+Espace pour sélectionner toutes les cellules de cette colonne.
    • Appuyez sur Ctrl + C pour copier les données dans le Presse-papiers, puis allez dans la section Accueil cliquez sur l'onglet " Pâte "et sélectionnez " Valeur "dans le menu déroulant.
  • Traitement d'une liste d'URL à l'aide de la colonne Nom de domaine

    Vous trouverez ici quelques conseils sur le traitement ultérieur de la liste des URL, tirés de ma propre expérience.

    Regrouper les URL par domaine

    1. Cliquez sur n'importe quelle cellule du tableau Domaine colonne.
    2. Triez votre tableau par domaine : allez dans le Données et cliquez sur l'onglet A-Z bouton.
    3. Reconvertissez votre tableau en une plage : cliquez sur n'importe quelle cellule du tableau, allez dans la rubrique Design et cliquez sur l'onglet " Convertir dans l'intervalle bouton ".
    4. Allez à la Données et cliquez sur l'onglet " Sous-total icône ".
    5. Dans la boîte de dialogue "Sous-total", sélectionnez les options suivantes : A chaque changement de : "Domaine" fonction d'utilisation Compter et Ajouter le sous-total à Domaine.

  • Cliquez sur OK.
  • Excel a créé un schéma de vos données sur le côté gauche de l'écran. Il y a 3 niveaux de schéma et ce que vous voyez maintenant est la vue étendue, ou vue de niveau 3. Cliquez sur le numéro 2 dans le coin supérieur gauche pour afficher les données finales par domaines, et ensuite vous pouvez cliquer sur les signes plus et moins (+ / -) afin d'étendre / réduire les détails pour chaque domaine.

    Mettez en évidence la deuxième URL et toutes les URL suivantes dans le même domaine.

    Dans la section précédente, nous avons montré comment regrouper les URL par domaine. Au lieu de regrouper, vous pouvez rapidement colorier les entrées en double du même nom de domaine dans vos URL.

    Pour plus de détails, voir comment mettre en évidence les doublons dans Excel.

    Comparez vos URL de différentes tables par colonne de domaine

    Vous avez peut-être une ou plusieurs feuilles de calcul Excel séparées où vous conservez une liste de noms de domaine. Vos tableaux peuvent contenir des liens avec lesquels vous ne voulez pas travailler, comme le spam ou les domaines que vous avez déjà traités. Vous pouvez également avoir besoin de conserver une liste de domaines avec des liens intéressants et de supprimer tous les autres.

    Par exemple, ma tâche consiste à colorer en rouge tous les domaines qui figurent sur ma liste noire de spammeurs :

    Pour ne pas perdre de temps, vous pouvez comparer vos tableaux pour supprimer les liens inutiles. Pour plus de détails, veuillez lire Comment comparer deux colonnes Excel et supprimer les doublons.

    Le meilleur moyen est de fusionner deux tables par nom de domaine

    C'est la méthode la plus avancée et celle que je préfère personnellement.

    Supposons que vous ayez une feuille de calcul Excel séparée avec des données de référence pour chaque domaine avec lequel vous avez travaillé. Ce cahier de travail conserve les contacts des webmestres pour l'échange de liens et la date à laquelle votre site Web a été mentionné dans ce domaine. Il peut également y avoir des types/sous-types de sites Web et une colonne séparée avec vos commentaires comme sur la capture d'écran ci-dessous.

    Dès que vous obtenez une nouvelle liste de liens, vous pouvez faire correspondre deux tables par nom de domaine et fusionner les informations de la table de consultation des domaines et de votre nouvelle feuille d'URL en deux minutes seulement.

    Vous obtiendrez ainsi le nom de domaine ainsi que la catégorie du site et vos commentaires, ce qui vous permettra de voir les URL de la liste que vous devez supprimer et celles que vous devez traiter.

    Faites correspondre deux tables par nom de domaine et fusionnez les données :

    1. Téléchargez et installez la dernière version de l'assistant de fusion de tableaux pour Microsoft Excel.

      Cet outil astucieux permet de faire correspondre et de fusionner deux feuilles de calcul Excel 2013-2003 en un clin d'œil. Vous pouvez utiliser une ou plusieurs colonnes comme identifiant unique, mettre à jour les colonnes existantes dans la feuille de calcul principale ou en ajouter de nouvelles à partir de la table de consultation. N'hésitez pas à en savoir plus sur l'assistant de fusion de tableaux sur notre site Web.

    2. Ouvrez votre liste d'URLs dans Excel et extrayez les noms de domaine comme décrit ci-dessus.
    3. Sélectionnez n'importe quelle cellule de votre tableau, puis allez dans l'onglet Ablebits Data et cliquez sur l'onglet Fusionner deux tables pour exécuter le module complémentaire.
    4. Appuyez sur le bouton Suivant deux fois et sélectionnez votre feuille de calcul avec les informations sur les domaines en tant qu'objet de l'enquête. Table de consultation .
    5. Cochez la case située à côté de Domaine pour l'identifier comme étant le colonne correspondante .
    6. Sélectionnez les informations sur le domaine que vous voulez ajouter à la liste des URL et cliquez sur Suivant.
    7. Appuyez sur le bouton Finition Lorsque le traitement est terminé, le module d'extension affiche un message contenant les détails de la fusion.

    Quelques secondes seulement - et vous obtenez toutes les informations sur chaque nom de domaine en un coup d'œil.

    Vous pouvez télécharger l'Assistant Tableaux de fusion pour Excel, l'exécuter sur vos données et voir à quel point il peut être utile.

    Si vous êtes intéressé par l'obtention d'un module complémentaire gratuit permettant d'extraire les noms de domaine et les sous-dossiers du domaine racine (.com, .edu, .us etc.) de la liste des URL, il vous suffit de nous envoyer un commentaire. Pour ce faire, veuillez préciser votre version d'Excel, par exemple Excel 2010 64-bit, et saisir votre adresse électronique dans le champ correspondant (ne vous inquiétez pas, elle ne sera pas affichée publiquement). Si nous obtenons un nombre suffisant de votes, nouscréer un tel add-in et je vous le ferai savoir. Merci d'avance !

    Michael Brown est un passionné de technologie passionné par la simplification de processus complexes à l'aide d'outils logiciels. Avec plus d'une décennie d'expérience dans l'industrie de la technologie, il a perfectionné ses compétences dans Microsoft Excel et Outlook, ainsi que dans Google Sheets et Docs. Le blog de Michael est dédié au partage de ses connaissances et de son expertise avec les autres, en fournissant des conseils et des tutoriels faciles à suivre pour améliorer la productivité et l'efficacité. Que vous soyez un professionnel chevronné ou un débutant, le blog de Michael offre des informations précieuses et des conseils pratiques pour tirer le meilleur parti de ces outils logiciels essentiels.