Domeinnamen uit een URL-lijst halen in Excel

  • Deel Dit
Michael Brown

Met een paar tips en adviezen kunt u domeinnamen uit een lijst met URL's halen met behulp van Excel-formules. Met twee variaties van de formule kunt u de domeinnamen met en zonder www. extraheren, ongeacht het URL-protocol (http, https, ftp enz. worden ondersteund). De oplossing werkt in alle moderne versies van Excel, van 2010 tot en met 2016.

Als je je bezighoudt met het promoten van je website (zoals ik) of als je op professioneel niveau aan SEO doet om de websites van klanten voor geld te promoten, moet je vaak enorme lijsten met URL's verwerken en analyseren: Google Analytics-rapporten over het aantrekken van verkeer, Webmaster tools-rapporten over nieuwe links, rapporten over backlinks naar de websites van je concurrenten (die een heleboel interessante feiten bevatten ;) ) en zoenzovoort.

Voor het verwerken van dergelijke lijsten, van tien tot een miljoen koppelingen, is Microsoft Excel een ideaal hulpmiddel. Het is krachtig, wendbaar, uitbreidbaar, en u kunt een rapport rechtstreeks vanuit een Excel-blad naar uw klant sturen.

"Waarom dit bereik, van 10 tot 1.000.000?" zult u mij vragen. Omdat u beslist geen tool nodig hebt om minder dan 10 links te verwerken; en u zult er nauwelijks een nodig hebben als u meer dan een miljoen inkomende links hebt. Ik durf te wedden dat u in dit geval al speciaal voor u op maat gemaakte software hebt laten ontwikkelen, met een bedrijfslogica die specifiek is afgestemd op uw behoeften. En ik zou het zijn die het volgende zou bekijkenuw artikelen en niet andersom :)

Bij het analyseren van een lijst met URL's moet u vaak de volgende taken uitvoeren: domeinnamen ophalen voor verdere verwerking, URL's groeperen per domein, links verwijderen van reeds verwerkte domeinen, twee tabellen vergelijken en samenvoegen op domeinnamen, enz.

    5 eenvoudige stappen om domeinnamen uit de lijst met URL's te halen

    Als voorbeeld nemen we een fragment van het backlinks-rapport van ablebits.com, gegenereerd door Google Webmaster Tools.

    Tip: Ik raad u aan ahrefs.com te gebruiken om tijdig nieuwe links naar uw eigen site en die van uw concurrenten te spotten.

    1. Voeg de " Domein " kolom aan het einde van uw tabel.

      Wij hebben de gegevens geëxporteerd van een CSV Daarom staan onze gegevens in Excel in een eenvoudig bereik. Druk op Ctrl + T om ze om te zetten in een Excel-tabel, omdat dat veel handiger is om mee te werken.

    2. In de eerste cel van de " Domein " kolom (B2), voert u de formule in om een domeinnaam te extraheren:
      • Extraheer het domein met www. als het aanwezig is in een URL:

    =MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)

  • Laat www. weg en krijg een zuivere domeinnaam:
  • =IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7,FIND("/",A2,9)-FIND(":",A2,4)-7).

    De tweede formule lijkt misschien te lang en te complex, maar alleen als u geen echt lange formules heeft gezien. Niet voor niets heeft Microsoft de maximale lengte van formules in nieuwe versies van Excel verhoogd tot 8192 tekens :)

    Het goede is dat we geen extra kolom of VBA-macro hoeven te gebruiken. In feite is het gebruik van VBA-macro's om uw Excel-taken te automatiseren niet zo moeilijk als het lijkt, zie een zeer goed artikel - hoe VBA-macro's te maken en te gebruiken. Maar in dit specifieke geval hebben we ze eigenlijk niet nodig, het is sneller en gemakkelijker om met een formule te werken.

    Opmerking: Technisch gezien, www is het domein van het derde niveau, hoewel bij alle normale websites www. slechts een alias is van het primaire domein. In de begindagen van het internet kon je aan de telefoon of in een radioreclame zeggen "double u, double u, double u our cool name dot com", en iedereen begreep het volkomen en wist waar je moest zoeken, natuurlijk tenzij je coole naam iets was alswww.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)

    U moet alle andere domeinnamen van het 3e niveau laten, anders zou u links van verschillende sites verknoeien, bv. met "co.uk" domein of van verschillende accounts op blogspot.com enz.

  • Aangezien we een volwaardige tabel hebben, kopieert Excel de formule automatisch over alle cellen in de kolom.

    Klaar! We hebben een kolom met geëxtraheerde domeinnamen.

    In het volgende deel leert u hoe u een lijst van URL's kunt verwerken op basis van de kolom Domein.

    Tip: Als u op een later tijdstip de domeinnamen handmatig moet bewerken of de resultaten naar een ander Excel-werkblad moet kopiëren, vervangt u de formule-uitkomsten door waarden. Ga hiervoor als volgt te werk:

    • Klik op een cel in de kolom Domein en druk op Ctrl+Spatie om alle cellen in die kolom te selecteren.
    • Druk op Ctrl + C om de gegevens naar het klembord te kopiëren, en ga dan naar het Home tabblad, klik op de " Plakken " knop en selecteer " Waarde " uit het keuzemenu.
  • Een lijst van URL's verwerken met behulp van de kolom Domeinnaam

    Hier vindt u enkele tips voor de verdere verwerking van de URL-lijst, uit eigen ervaring.

    URL's groeperen per domein

    1. Klik op een cel in de Domein column.
    2. Sorteer uw tabel per domein: ga naar de Gegevens tabblad en klik op de A-Z knop.
    3. Zet uw tabel terug naar een bereik: klik op een willekeurige cel in de tabel, ga naar het Ontwerp tabblad en klik op de " Converteer naar het bereik " knop.
    4. Ga naar de Gegevens tabblad en klik op de " Subtotaal " icoontje.
    5. In het dialoogvenster "Subtotaal" selecteert u de volgende opties: Bij elke verandering in : "Domein" gebruik functie Tellen en Subtotaal toevoegen aan Domein.

  • Klik op OK.
  • Excel heeft een overzicht van uw gegevens gemaakt aan de linkerkant van het scherm. Er zijn 3 niveaus van het overzicht en wat u nu ziet is de uitgebreide weergave, of niveau 3. Klik op nummer 2 in de linkerbovenhoek om de definitieve gegevens per domein weer te geven, en dan kunt u op de plus- en mintekens (+ / -) klikken om de details voor elk domein uit te vouwen / in te klappen.

    Markeer de tweede en alle volgende URL's in hetzelfde domein

    In ons vorige hoofdstuk hebben we laten zien hoe u URL's kunt groeperen per domein. In plaats van te groeperen, kunt u snel dubbele vermeldingen van dezelfde domeinnaam in uw URL's kleuren.

    Zie voor meer details hoe u duplicaten markeert in Excel.

    Vergelijk uw URL's uit verschillende tabellen per domeinkolom

    Mogelijk hebt u een of meer afzonderlijke Excel-werkbladen waarin u een lijst met domeinnamen bijhoudt. Uw tabellen kunnen links bevatten waarmee u niet wilt werken, zoals spam of de domeinen die u al hebt verwerkt. Mogelijk moet u ook een lijst met domeinen met interessante links bijhouden en alle andere verwijderen.

    Mijn taak is bijvoorbeeld om alle domeinen die op mijn spammer blacklist staan rood te kleuren:

    Om niet veel tijd te verliezen, kunt u uw tabellen vergelijken om de overbodige koppelingen te verwijderen. Voor volledige details, lees Hoe twee Excel kolommen te vergelijken en duplicaten te verwijderen

    De beste manier is het samenvoegen van twee tabellen op domeinnaam

    Dit is de meest geavanceerde manier, die ik persoonlijk verkies.

    Stel, u hebt een apart Excel-werkblad met referentiegegevens voor elk domein waarmee u ooit hebt gewerkt. Dit werkboek houdt webmastercontacten bij voor linkuitwisseling en de datum waarop uw website in dit domein werd vermeld. Er kunnen ook types/subtypes websites zijn en een aparte kolom met uw opmerkingen zoals op de schermafbeelding hieronder.

    Zodra u een nieuwe lijst met links krijgt, kunt u twee tabellen matchen op domeinnaam en de informatie uit de domeinopzoektabel en uw nieuwe URLsheet in slechts twee minuten samenvoegen.

    Als resultaat krijgt u de domeinnaam en de website categorie en uw commentaar. Zo kunt u zien welke URL's uit de lijst u moet verwijderen en welke u moet verwerken.

    Match twee tabellen op domeinnaam en voeg gegevens samen:

    1. Download en installeer de nieuwste versie van Wizard Tabellen samenvoegen voor Microsoft Excel

      Deze handige tool voegt twee Excel 2013-2003 werkbladen in een handomdraai samen. U kunt één of meerdere kolommen als unieke identificatie gebruiken, bestaande kolommen in het hoofdwerkblad bijwerken of nieuwe toevoegen vanuit de opzoektabel. Lees gerust meer over Wizard Samenvoegen van tabellen op onze website.

    2. Open uw lijst met URL's in Excel en extraheer de domeinnamen zoals hierboven beschreven.
    3. Selecteer een willekeurige cel in uw tabel. Ga dan naar de Ablebits gegevens tabblad en klik op de Twee tabellen samenvoegen pictogram om de invoegtoepassing uit te voeren.
    4. Druk op de Volgende knop tweemaal en selecteer uw werkblad met de domeininformatie als de Opzoektabel .
    5. Vink het vakje naast Domein aan om het te identificeren als de passende kolom .
    6. Selecteer welke informatie over het domein u wilt toevoegen aan de lijst met URL's en klik op Volgende.
    7. Druk op de Afwerking Wanneer de verwerking is voltooid, toont de invoegtoepassing een bericht met de details van de samenvoeging.

    Een paar seconden - en u krijgt alle informatie over elke domeinnaam in één oogopslag.

    U kunt Samenvoegtabellen Wizard voor Excel downloaden, het op uw gegevens uitvoeren en zien hoe nuttig het kan zijn.

    Als u geïnteresseerd bent in een gratis add-in voor het extraheren van domeinnamen en submappen van het hoofddomein (.com, .edu, .us etc.) uit de URL-lijst, stuur ons dan een reactie. Geef daarbij uw Excel-versie aan, bijv. Excel 2010 64-bit, en voer uw e-mailadres in het betreffende veld in (maakt u zich geen zorgen, het wordt niet openbaar gemaakt). Als we een behoorlijk aantal stemmen krijgen, zullen wemaak zo'n add-in en ik laat het je weten. Alvast bedankt!

    Michael Brown is een toegewijde technologieliefhebber met een passie voor het vereenvoudigen van complexe processen met behulp van softwaretools. Met meer dan tien jaar ervaring in de technische industrie heeft hij zijn vaardigheden in Microsoft Excel en Outlook, evenals Google Spreadsheets en Documenten aangescherpt. Michael's blog is gewijd aan het delen van zijn kennis en expertise met anderen, met eenvoudig te volgen tips en tutorials voor het verbeteren van de productiviteit en efficiëntie. Of je nu een doorgewinterde professional of een beginner bent, Michaels blog biedt waardevolle inzichten en praktisch advies om het meeste uit deze essentiële softwaretools te halen.