Extragerea numelor de domenii dintr-o listă de URL-uri în Excel

  • Imparte Asta
Michael Brown

Câteva ponturi și sfaturi vă vor ajuta să obțineți nume de domenii dintr-o listă de URL-uri folosind formule Excel. Două variante ale formulei vă permit să extrageți numele de domenii cu și fără www. indiferent de protocolul URL (sunt acceptate http, https, ftp etc.). Soluția funcționează în toate versiunile moderne de Excel, de la 2010 până la 2016.

Dacă ești preocupat de promovarea site-ului tău (cum sunt eu) sau dacă faci SEO la nivel profesional, promovând site-urile clienților pe bani, de multe ori trebuie să procesezi și să analizezi liste uriașe de URL-uri: rapoarte Google Analytics despre achiziția de trafic, rapoarte Webmaster tools despre link-uri noi, rapoarte despre backlink-urile către site-urile competitorilor (care conțin o mulțime de informații interesante ;) ) și așa mai departe.și așa mai departe.

Pentru a procesa astfel de liste, de la zece până la un milion de linkuri, Microsoft Excel este un instrument ideal. Este puternic, agil, extensibil și vă permite să trimiteți un raport clientului direct dintr-o foaie Excel.

"De ce este acest interval, de la 10 la 1.000.000?", poate mă veți întreba. Pentru că, în mod sigur, nu aveți nevoie de un instrument care să proceseze mai puțin de 10 link-uri; și aproape că nu veți avea nevoie de niciunul dacă aveți peste un milion de link-uri inbound. Aș paria că, în acest caz, ați avut deja un software personalizat, dezvoltat special pentru dumneavoastră, cu o logică de business adaptată special pentru nevoile dumneavoastră. Și aș fi eu cel care ar parcurgearticolele tale și nu invers :)

Atunci când analizați o listă de adrese URL, deseori trebuie să efectuați următoarele sarcini: să obțineți nume de domenii pentru procesarea ulterioară, să grupați adresele URL în funcție de domeniu, să eliminați legăturile din domeniile deja procesate, să comparați și să unificați două tabele în funcție de nume de domenii etc.

    5 pași simpli pentru a extrage nume de domenii din lista de URL-uri

    Ca exemplu, să luăm un fragment din raportul de backlinks al ablebits.com generat de Google Webmaster Tools.

    Sfat: Vă recomand să folosiți ahrefs.com pentru a găsi în timp util noi link-uri către site-ul dvs. și către site-urile concurenților.

    1. Adăugați " Domeniu " la sfârșitul tabelului dumneavoastră.

      Am exportat datele dintr-un fișier CSV De aceea, în ceea ce privește Excel, datele noastre se află într-un interval simplu. Apăsați Ctrl + T pentru a le converti într-un tabel Excel, deoarece este mult mai comod de lucrat cu acesta.

    2. În prima celulă a tabelului " Domeniu "(B2), introduceți formula pentru a extrage un nume de domeniu:
      • Extrageți domeniul cu www. dacă acesta este prezent într-un URL:

    =MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)

  • Omiteți www. și obțineți un nume de domeniu pur:
  • =IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7,FIND("/",A2,9)-FIND(":",A2,4)-7)))

    A doua formulă poate părea prea lungă și complexă, dar numai dacă nu ați văzut formule cu adevărat lungi. Nu degeaba Microsoft a mărit lungimea maximă a formulelor până la 8192 de caractere în noile versiuni de Excel :)

    Partea bună este că nu trebuie să folosim nici o coloană suplimentară, nici o macro VBA. De fapt, utilizarea macrourilor VBA pentru a automatiza sarcinile Excel nu este atât de dificilă pe cât pare, vezi un articol foarte bun - cum să creezi și să folosești macrouri VBA. Dar în acest caz particular, nu avem nevoie de ele, este mai rapid și mai simplu să mergem cu o formulă.

    Notă: Din punct de vedere tehnic, www este domeniul de al treilea nivel, deși, în cazul tuturor site-urilor web normale, www. este doar un alias al domeniului principal. În primele zile ale internetului, puteai spune "double u, double u, double u, double u our cool name dot com" la telefon sau într-o reclamă la radio, și toată lumea înțelegea perfect și își amintea unde să te caute, desigur, cu excepția cazului în care numele tău cool era ceva de genulwww.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)

    Trebuie să lăsați toate celelalte nume de domenii de nivelul 3, altfel veți încurca legăturile de pe diferite site-uri, de exemplu, cu domeniul "co.uk" sau de pe diferite conturi de pe blogspot.com etc.

  • Deoarece avem un tabel cu drepturi depline, Excel copiază automat formula în toate celulele din coloană.

    Gata! Avem o coloană cu nume de domenii extrase.

    În secțiunea următoare veți afla cum puteți procesa o listă de URL-uri pe baza coloanei Domeniu.

    Sfat: Dacă este posibil să aveți nevoie să editați manual numele de domeniu ulterior sau să copiați rezultatele într-o altă foaie de calcul Excel, înlocuiți rezultatele formulei cu valori. Pentru a face acest lucru, urmați pașii de mai jos:

    • Faceți clic pe orice celulă din coloana Domain și apăsați Ctrl+Space pentru a selecta toate celulele din coloana respectivă.
    • Apăsați Ctrl + C pentru a copia datele în Clipboard, apoi mergeți la Acasă fila, faceți clic pe butonul " Paste " și selectați " Valoare " din meniul derulant.
  • Prelucrarea unei liste de URL-uri utilizând coloana Nume domeniu

    Aici veți găsi câteva sfaturi privind procesarea ulterioară a listei de URL-uri, din experiența mea proprie.

    Gruparea URL-urilor după domeniu

    1. Faceți clic pe orice celulă din Domeniu coloană.
    2. Sortați tabelul în funcție de domeniu: mergeți la Date și faceți clic pe butonul A-Z buton.
    3. Convertiți tabelul înapoi într-un interval: faceți clic pe orice celulă din tabel, mergeți la fereastra Design și faceți clic pe butonul " Conversia în intervalul ".
    4. Mergeți la Date și faceți clic pe butonul " Subtotal ".
    5. În caseta de dialog "Subtotal", selectați următoarele opțiuni: La fiecare modificare a : "Domeniu" funcția de utilizare Numărați și Se adaugă subtotalul la Domeniu.

  • Faceți clic pe OK.
  • Excel a creat o schiță a datelor dvs. în partea stângă a ecranului. Există 3 niveluri ale schiței, iar ceea ce vedeți acum este vizualizarea extinsă, sau vizualizarea de nivel 3. Faceți clic pe numărul 2 din colțul din stânga sus pentru a afișa datele finale pe domenii, apoi puteți face clic pe semnele plus și minus (+ / -) pentru a extinde / reduce detaliile pentru fiecare domeniu.

    Evidențiați al doilea și toate URL-urile ulterioare din același domeniu

    În secțiunea precedentă am arătat cum să grupați URL-urile în funcție de domeniu. În loc să grupați, puteți colora rapid intrările duplicate ale aceluiași nume de domeniu în URL-urile dvs.

    Pentru mai multe detalii, consultați cum să evidențiați duplicatele în Excel.

    Comparați URL-urile din diferite tabele după coloana de domeniu

    Este posibil să aveți una sau mai multe foi de calcul Excel separate în care păstrați o listă de nume de domenii. Tabelele dvs. pot conține link-uri cu care nu doriți să lucrați, cum ar fi spam-ul sau domeniile pe care le-ați procesat deja. De asemenea, este posibil să aveți nevoie să păstrați o listă de domenii cu link-uri interesante și să le ștergeți pe toate celelalte.

    De exemplu, sarcina mea este de a colora în roșu toate domeniile care se află pe lista mea neagră de spammer:

    Pentru a nu pierde mult timp, puteți compara tabelele pentru a șterge legăturile inutile. Pentru detalii complete, citiți Cum să comparați două coloane Excel și să ștergeți duplicatele

    Cel mai bun mod este să unificați două tabele după numele de domeniu

    Acesta este cel mai avansat mod și cel pe care eu personal îl prefer.

    Să presupunem că aveți o foaie de lucru Excel separată cu date de referință pentru fiecare domeniu cu care ați lucrat vreodată. Această foaie de lucru păstrează contactele webmasterilor pentru schimbul de linkuri și data la care site-ul dvs. a fost menționat în acest domeniu. De asemenea, pot exista tipuri/subtipuri de site-uri web și o coloană separată cu comentariile dvs., ca în imaginea de mai jos.

    De îndată ce obțineți o nouă listă de linkuri, puteți să potriviți două tabele după numele de domeniu și să unificați informațiile din tabelul de căutare a domeniului și noua foaie de URL-uri în doar două minute.

    Ca rezultat, veți obține numele domeniului, precum și categoria site-ului web și comentariile dvs. Acest lucru vă va permite să vedeți URL-urile din listă pe care trebuie să le ștergeți și pe cele pe care trebuie să le procesați.

    Potriviți două tabele după numele de domeniu și îmbinați datele:

    1. Descărcați și instalați cea mai recentă versiune de Merge Tables Wizard pentru Microsoft Excel

      Acest instrument ingenios va potrivi și fuziona două foi de calcul Excel 2013-2003 într-o clipă. Puteți utiliza una sau mai multe coloane ca identificator unic, puteți actualiza coloanele existente în foaia de calcul principală sau adăuga altele noi din tabelul de căutare. Nu ezitați să citiți mai multe despre Merge Tables Wizard pe site-ul nostru.

    2. Deschideți lista de adrese URL în Excel și extrageți numele de domenii așa cum s-a descris mai sus.
    3. Selectați orice celulă din tabelul dvs. Apoi mergeți la butonul Date Ablebits și faceți clic pe butonul Îmbinarea a două tabele pentru a rula add-in-ul.
    4. Apăsați butonul Următorul de două ori și selectați foaia de calcul cu informațiile despre domenii ca fiind foaia de calcul Tabel de căutare .
    5. Bifați caseta de selectare de lângă Domain pentru a-l identifica ca fiind domeniul coloana de corespondență .
    6. Selectați informațiile despre domeniu pe care doriți să le adăugați la lista de URL-uri și faceți clic pe Next (Următorul).
    7. Apăsați butonul Finisaj Când procesarea se termină, add-in-ul vă va afișa un mesaj cu detaliile fuziunii.

    Doar câteva secunde și veți obține toate informațiile despre fiecare nume de domeniu dintr-o privire.

    Puteți descărca Merge Tables Wizard for Excel, îl puteți rula pe datele dvs. și puteți vedea cât de util poate fi.

    Dacă sunteți interesat să obțineți un add-in gratuit pentru extragerea numelor de domenii și a subfolderelor din domeniul rădăcină (.com, .edu, .us etc.) din lista de URL-uri, trimiteți-ne un comentariu. Când faceți acest lucru, vă rugăm să specificați versiunea Excel, de exemplu Excel 2010 pe 64 de biți, și să introduceți adresa dvs. de e-mail în câmpul corespunzător (nu vă faceți griji, nu va fi afișată public). Dacă vom avea un număr decent de voturi, vomcreați un astfel de add-in și vă anunț. Vă mulțumesc anticipat!

    Michael Brown este un pasionat de tehnologie dedicat, cu o pasiune pentru simplificarea proceselor complexe folosind instrumente software. Cu mai mult de un deceniu de experiență în industria tehnologiei, el și-a perfecționat abilitățile în Microsoft Excel și Outlook, precum și în Google Sheets și Docs. Blogul lui Michael este dedicat împărtășirii cunoștințelor și experienței sale cu alții, oferind sfaturi și tutoriale ușor de urmat pentru îmbunătățirea productivității și eficienței. Indiferent dacă sunteți un profesionist experimentat sau un începător, blogul lui Michael oferă informații valoroase și sfaturi practice pentru a profita la maximum de aceste instrumente software esențiale.