Extrahieren von Domainnamen aus einer URL-Liste in Excel

  • Teile Das
Michael Brown

Einige Tipps und Ratschläge helfen Ihnen dabei, Domainnamen aus einer Liste von URLs mit Hilfe von Excel-Formeln zu extrahieren. Zwei Varianten der Formel ermöglichen es Ihnen, die Domainnamen mit und ohne www. zu extrahieren, unabhängig vom URL-Protokoll (http, https, ftp usw. werden unterstützt). Die Lösung funktioniert in allen modernen Versionen von Excel, von 2010 bis 2016.

Wenn Sie sich mit der Förderung Ihrer Website beschäftigen (so wie ich) oder auf professioneller Ebene SEO betreiben, indem Sie die Websites von Kunden gegen Geld fördern, müssen Sie oft riesige Listen von URLs verarbeiten und analysieren: Google Analytics-Berichte über die Traffic-Akquisition, Webmaster-Tools-Berichte über neue Links, Berichte über Backlinks zu den Websites Ihrer Konkurrenten (die eine Menge interessanter Fakten enthalten ;) ) und so weiteran, und so weiter.

Für die Bearbeitung solcher Listen, die von zehn bis zu einer Million Links reichen, ist Microsoft Excel ein ideales Werkzeug: Es ist leistungsstark, flexibel, erweiterbar und ermöglicht es Ihnen, einen Bericht direkt aus einem Excel-Blatt an Ihren Kunden zu senden.

"Warum diese Spanne von 10 bis 1.000.000?", werden Sie mich vielleicht fragen. Weil Sie definitiv kein Tool brauchen, um weniger als 10 Links zu verarbeiten; und Sie werden kaum eines brauchen, wenn Sie mehr als eine Million eingehende Links haben. Ich würde wetten, dass Sie in diesem Fall bereits eine maßgeschneiderte Software speziell für Sie entwickelt haben, mit einer Geschäftslogik, die speziell auf Ihre Bedürfnisse zugeschnitten ist. Und ich wäre es, der sich mitIhre Artikel und nicht andersherum :)

Bei der Analyse einer Liste von URLs müssen Sie häufig folgende Aufgaben durchführen: Domainnamen für die weitere Verarbeitung ermitteln, URLs nach Domains gruppieren, Links von bereits verarbeiteten Domains entfernen, zwei Tabellen nach Domainnamen vergleichen und zusammenführen usw.

    5 einfache Schritte zum Extrahieren von Domänennamen aus der Liste der URLs

    Nehmen wir als Beispiel einen Ausschnitt aus dem Backlink-Bericht von ablebits.com, der von Google Webmaster Tools erstellt wurde.

    Tipp: Ich empfehle die Nutzung von ahrefs.com, um neue Links zu Ihrer eigenen Website und den Websites Ihrer Konkurrenten rechtzeitig zu erkennen.

    1. Fügen Sie die " Bereich "Spalte an das Ende Ihrer Tabelle.

      Wir haben die Daten aus einer CSV Drücken Sie Strg + T, um die Daten in eine Excel-Tabelle zu konvertieren, denn das ist viel bequemer zu handhaben.

    2. In der ersten Zelle der Tabelle " Bereich "Spalte (B2) die Formel zum Extrahieren eines Domänennamens ein:
      • Extrahieren Sie die Domäne mit www., wenn sie in einer URL vorhanden ist:

    =MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)

  • Lassen Sie www. weg und erhalten Sie einen reinen Domänennamen:
  • =IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7,FIND("/",A2,9)-FIND(":",A2,4)-7))

    Die zweite Formel mag zu lang und kompliziert erscheinen, aber nur, wenn Sie noch nie wirklich lange Formeln gesehen haben. Nicht umsonst hat Microsoft die maximale Länge von Formeln in neuen Versionen von Excel auf bis zu 8192 Zeichen erhöht :)

    Das Gute daran ist, dass wir weder eine zusätzliche Spalte noch ein VBA-Makro verwenden müssen. Tatsächlich ist die Verwendung von VBA-Makros zur Automatisierung Ihrer Excel-Aufgaben nicht so schwierig, wie es scheinen mag, siehe einen sehr guten Artikel - Erstellen und Verwenden von VBA-Makros. Aber in diesem speziellen Fall brauchen wir sie eigentlich nicht, es ist schneller und einfacher, eine Formel zu verwenden.

    Anmerkung: Technisch gesehen, www ist die Domäne der 3. Ebene, obwohl www. bei allen normalen Websites nur ein Alias der primären Domäne ist. In den frühen Tagen des Internets konnte man am Telefon oder in einer Radiowerbung "double u, double u, double u unser cooler Name dot com" sagen, und jeder verstand und erinnerte sich, wo man zu finden war, natürlich nur, wenn der coole Name so etwas wiewww.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)

    Sie müssen alle anderen Domänennamen der 3. Ebene belassen, sonst würden Sie Links von verschiedenen Seiten durcheinanderbringen, z. B. mit einer "co.uk"-Domäne oder von verschiedenen Konten auf blogspot.com usw.

  • Da es sich um eine vollwertige Tabelle handelt, kopiert Excel die Formel automatisch in alle Zellen der Spalte.

    Fertig! Wir haben eine Spalte mit extrahierten Domänennamen.

    Im nächsten Abschnitt erfahren Sie, wie Sie eine Liste von URLs auf der Grundlage der Spalte Domain bearbeiten können.

    Tipp: Wenn Sie die Domänennamen zu einem späteren Zeitpunkt manuell bearbeiten oder die Ergebnisse in ein anderes Excel-Arbeitsblatt kopieren möchten, ersetzen Sie die Formelergebnisse durch Werte:

    • Klicken Sie auf eine beliebige Zelle in der Domänenspalte und drücken Sie die Tastenkombination Strg+Leertaste, um alle Zellen in dieser Spalte auszuwählen.
    • Drücken Sie Strg + C, um die Daten in die Zwischenablage zu kopieren, und gehen Sie dann zum Menü Startseite klicken Sie auf die Registerkarte " Kleister " und wählen Sie " Wert " aus dem Dropdown-Menü.
  • Verarbeitung einer Liste von URLs unter Verwendung der Spalte Domänenname

    Hier finden Sie ein paar Tipps zur Weiterverarbeitung der URL-Liste, die auf meinen eigenen Erfahrungen beruhen.

    URLs nach Domäne gruppieren

    1. Klicken Sie auf eine beliebige Zelle in der Tabelle Bereich Spalte.
    2. Sortieren Sie Ihre Tabelle nach Domäne: Gehen Sie auf die Seite Daten und klicken Sie auf die Registerkarte A-Z Taste.
    3. Konvertieren Sie Ihre Tabelle wieder in einen Bereich: Klicken Sie auf eine beliebige Zelle in der Tabelle, gehen Sie zum Fenster Gestaltung und klicken Sie auf das Feld " In den Bereich umrechnen Schaltfläche ".
    4. Gehen Sie zum Daten und klicken Sie auf das Feld " Zwischensumme Symbol ".
    5. Wählen Sie im Dialogfeld "Zwischensumme" die folgenden Optionen: Bei jeder Änderung der : "Bereich" Gebrauchsfunktion Zählen und Zwischensumme hinzufügen zu Bereich.

  • Klicken Sie auf OK.
  • Excel hat eine Gliederung Ihrer Daten auf der linken Seite des Bildschirms erstellt. Die Gliederung besteht aus drei Ebenen, und was Sie jetzt sehen, ist die erweiterte Ansicht oder die Ansicht der Ebene 3. Klicken Sie auf die Nummer 2 in der oberen linken Ecke, um die endgültigen Daten nach Domänen anzuzeigen, und klicken Sie dann auf die Plus- und Minuszeichen (+ / -), um die Details für jede Domäne zu erweitern oder zu reduzieren.

    Markieren Sie die zweite und alle folgenden URLs in derselben Domäne

    Im vorigen Abschnitt haben wir gezeigt, wie Sie URLs nach Domänen gruppieren können. Anstelle der Gruppierung können Sie doppelte Einträge desselben Domänennamens in Ihren URLs schnell einfärben.

    Weitere Einzelheiten finden Sie unter Markieren von Duplikaten in Excel.

    Vergleichen Sie Ihre URLs aus verschiedenen Tabellen nach Domänenspalte

    Möglicherweise haben Sie ein oder mehrere separate Excel-Arbeitsblätter, in denen Sie eine Liste von Domänennamen führen. Ihre Tabellen können Links enthalten, mit denen Sie nicht arbeiten möchten, wie z. B. Spam oder Domänen, die Sie bereits bearbeitet haben. Möglicherweise müssen Sie auch eine Liste von Domänen mit interessanten Links führen und alle anderen löschen.

    Meine Aufgabe besteht zum Beispiel darin, alle Domänen, die auf meiner schwarzen Liste für Spammer stehen, rot einzufärben:

    Um nicht viel Zeit zu verschwenden, können Sie Ihre Tabellen vergleichen, um die unnötigen Verknüpfungen zu löschen. Für weitere Informationen lesen Sie bitte Wie man zwei Excel-Spalten vergleicht und Duplikate löscht

    Am besten ist es, zwei Tabellen nach Domänennamen zusammenzufassen

    Dies ist die am weitesten fortgeschrittene Methode, die ich persönlich bevorzuge.

    Nehmen wir an, Sie haben ein separates Excel-Arbeitsblatt mit Referenzdaten für jede Domain, mit der Sie jemals gearbeitet haben. Dieses Arbeitsblatt enthält Webmaster-Kontakte für den Linktausch und das Datum, an dem Ihre Website in dieser Domain erwähnt wurde. Es kann auch Typen/Untertypen von Websites und eine separate Spalte mit Ihren Kommentaren enthalten, wie auf dem Screenshot unten.

    Sobald Sie eine neue Liste von Links erhalten, können Sie zwei Tabellen nach Domänennamen abgleichen und die Informationen aus der Domänennachschlagetabelle und Ihrem neuen URLs-Blatt in nur zwei Minuten zusammenführen.

    Als Ergebnis erhalten Sie den Domänennamen sowie die Website-Kategorie und Ihre Kommentare. So können Sie sehen, welche URLs aus der Liste Sie löschen und welche Sie bearbeiten müssen.

    Zwei Tabellen nach Domänennamen abgleichen und Daten zusammenführen:

    1. Laden Sie die neueste Version von Merge Tables Wizard für Microsoft Excel herunter und installieren Sie sie

      Mit diesem raffinierten Tool lassen sich zwei Excel 2013-2003-Arbeitsblätter blitzschnell abgleichen und zusammenführen. Sie können eine oder mehrere Spalten als eindeutige Kennung verwenden, vorhandene Spalten im Master-Arbeitsblatt aktualisieren oder neue aus der Nachschlagetabelle hinzufügen. Lesen Sie mehr über den Assistenten zum Zusammenführen von Tabellen auf unserer Website.

    2. Öffnen Sie Ihre URLs-Liste in Excel und extrahieren Sie die Domänennamen wie oben beschrieben.
    3. Markieren Sie eine beliebige Zelle in Ihrer Tabelle und gehen Sie dann auf die Schaltfläche Ablebits Daten und klicken Sie auf die Registerkarte Zwei Tabellen zusammenführen um das Add-In auszuführen.
    4. Drücken Sie die Weiter zweimal und wählen Sie Ihr Arbeitsblatt mit den Domäneninformationen als Nachschlagetabelle .
    5. Aktivieren Sie das Kontrollkästchen neben Domain, um es als die passende Spalte .
    6. Wählen Sie aus, welche Informationen über die Domäne Sie der URL-Liste hinzufügen möchten, und klicken Sie auf Weiter.
    7. Drücken Sie die Oberfläche Wenn die Verarbeitung abgeschlossen ist, zeigt das Add-In eine Meldung mit den Details der Zusammenführung an.

    Nur wenige Sekunden - und Sie erhalten alle Informationen zu jedem Domainnamen auf einen Blick.

    Sie können den Merge Tables Wizard für Excel herunterladen, ihn auf Ihre Daten anwenden und sehen, wie nützlich er sein kann.

    Wenn Sie daran interessiert sind, ein kostenloses Add-in zum Extrahieren von Domainnamen und Unterordnern der Root-Domain (.com, .edu, .us usw.) aus der URL-Liste zu erhalten, schreiben Sie uns einfach einen Kommentar. Geben Sie dabei bitte Ihre Excel-Version an, z. B. Excel 2010 64-bit, und tragen Sie Ihre E-Mail-Adresse in das entsprechende Feld ein (keine Sorge, sie wird nicht öffentlich angezeigt). Wenn wir eine anständige Anzahl von Stimmen erhalten, werden wirerstellen Sie ein solches Add-In und ich lasse es Sie wissen. Vielen Dank im Voraus!

    Michael Brown ist ein begeisterter Technologie-Enthusiast mit einer Leidenschaft für die Vereinfachung komplexer Prozesse mithilfe von Softwaretools. Mit mehr als einem Jahrzehnt Erfahrung in der Technologiebranche hat er seine Fähigkeiten in Microsoft Excel und Outlook sowie Google Sheets und Docs verfeinert. Michaels Blog widmet sich dem Teilen seines Wissens und seiner Expertise mit anderen und bietet leicht verständliche Tipps und Tutorials zur Verbesserung von Produktivität und Effizienz. Egal, ob Sie ein erfahrener Profi oder ein Anfänger sind, Michaels Blog bietet wertvolle Einblicke und praktische Ratschläge, wie Sie diese wichtigen Softwaretools optimal nutzen können.