Obsah
Několik tipů a rad vám pomůže získat názvy domén ze seznamu adres URL pomocí vzorců aplikace Excel. Dvě varianty vzorce umožňují extrahovat názvy domén s www a bez www bez ohledu na protokol URL (podporovány jsou http, https, ftp atd.). Řešení funguje ve všech moderních verzích aplikace Excel, od 2010 do 2016.
Pokud se zabýváte propagací svých webových stránek (jako já) nebo děláte SEO na profesionální úrovni a propagujete webové stránky svých klientů za peníze, musíte často zpracovávat a analyzovat obrovské seznamy URL: reporty Google Analytics o získávání návštěvnosti, reporty Webmaster tools o nových odkazech, reporty o zpětných odkazech na webové stránky vašich konkurentů (které obsahují spoustu zajímavých faktů ;) ) a tak dále.a tak dále.
Pro zpracování takových seznamů, od deseti až po milion odkazů, je Microsoft Excel ideálním nástrojem. Je výkonný, agilní, rozšiřitelný a umožňuje odeslat zprávu klientovi přímo z listu Excelu.
"Proč zrovna toto rozmezí, od 10 do 1 000 000?" možná se mě zeptáte. Protože rozhodně nepotřebujete nástroj na zpracování méně než 10 odkazů; a pokud máte více než milion příchozích odkazů, nebudete potřebovat téměř žádný. Vsadil bych se, že v takovém případě jste si už nechali speciálně pro vás vyvinout nějaký software na míru, s obchodní logikou speciálně přizpůsobenou vašim potřebám. A byl bych to já, kdo by si prošelvaše články a ne naopak :)
Při analýze seznamu adres URL často potřebujete provést následující úlohy: získat názvy domén pro další zpracování, seskupit adresy URL podle domén, odstranit odkazy z již zpracovaných domén, porovnat a sloučit dvě tabulky podle názvů domén atd.
5 snadných kroků k extrakci názvů domén ze seznamu adres URL
Jako příklad uveďme výňatek ze zprávy o zpětných odkazech webu ablebits.com, kterou vygenerovaly nástroje Google Webmaster Tools.
Tip: Doporučuji používat ahrefs.com, abyste včas zjistili nové odkazy na své vlastní stránky a stránky konkurence.
- Přidejte " Doména " na konec tabulky.
Exportovali jsme data z CSV souboru, proto jsou z hlediska Excelu naše data v jednoduchém rozsahu. Stisknutím kláves Ctrl + T je převedete na tabulku Excelu, protože práce s ní je mnohem pohodlnější.
- V první buňce pole " Doména " (B2) zadejte vzorec pro extrakci názvu domény:
- Vyjměte doménu s www., pokud je v adrese URL přítomna:
=MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)
=IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7,FIND("/",A2,9)-FIND(":",A2,4)-7)).
Druhý vzorec se může zdát příliš dlouhý a složitý, ale to jen v případě, že jste se nesetkali s opravdu dlouhými vzorci. Ne nadarmo Microsoft v nových verzích Excelu zvýšil maximální délku vzorců až na 8192 znaků :) V tomto případě se jedná o velmi dlouhý vzorec.
Dobré je, že nemusíme používat ani další sloupec, ani makro VBA. Ve skutečnosti není použití maker VBA k automatizaci úloh v Excelu tak složité, jak by se mohlo zdát, viz velmi dobrý článek - jak vytvořit a používat makra VBA. V tomto konkrétním případě je ale vlastně nepotřebujeme, rychlejší a jednodušší je vystačit si se vzorcem.
Poznámka: Technicky vzato, www je doména 3. úrovně, ačkoli u všech běžných webových stránek je www. pouze alias primární domény. V počátcích internetu jste mohli do telefonu nebo v rozhlasové reklamě říct "double u, double u, double u, naše cool jméno tečka com" a všichni vám dokonale rozuměli a pamatovali si, kde vás mají hledat, samozřejmě pokud vaše cool jméno nebylo něco jakowww.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)
Musíte ponechat všechny ostatní názvy domén 3. úrovně, jinak byste zaneřádili odkazy z různých webů, např. s doménou "co.uk" nebo z různých účtů na blogspot.com atd.
Hotovo! Máme sloupec s extrahovanými názvy domén.
V další části se dozvíte, jak můžete zpracovat seznam adres URL na základě sloupce Doména.
Tip: Pokud budete později potřebovat názvy domén upravit ručně nebo zkopírovat výsledky do jiného listu aplikace Excel, nahraďte výsledky vzorce hodnotami. Za tímto účelem postupujte podle následujících kroků:
- Kliknutím na libovolnou buňku ve sloupci Doména a stisknutím klávesové zkratky Ctrl+Mezerník vyberte všechny buňky v tomto sloupci.
- Stisknutím klávesové zkratky Ctrl + C zkopírujte data do schránky a poté přejděte na stránku Home klikněte na kartu " Vložit " a vyberte možnost " Hodnota " z rozevírací nabídky.
Zpracování seznamu adres URL pomocí sloupce Název domény
Zde najdete několik tipů pro další zpracování seznamu URL, které vycházejí z mých vlastních zkušeností.
Seskupení adres URL podle domény
- Klikněte na libovolnou buňku v Doména sloupec.
- Seřaďte tabulku podle domény: přejděte na stránku Data a klikněte na kartu A-Z tlačítko.
- Převeďte tabulku zpět na rozsah: klikněte na libovolnou buňku v tabulce, přejděte do části Design a klikněte na kartu " Převést na rozsah ".
- Přejděte na Data a klikněte na kartu " Mezisoučet ".
- V dialogovém okně "Mezisoučet" vyberte následující možnosti: Při každé změně : "Doména" použít funkci Počítejte a Přidejte mezisoučet k Doména.
Excel vytvořil na levé straně obrazovky osnovu vašich dat. Existují 3 úrovně osnovy a to, co nyní vidíte, je rozšířené zobrazení neboli zobrazení úrovně 3. Kliknutím na číslo 2 v levém horním rohu zobrazíte konečná data podle domén a poté můžete kliknutím na znaménka plus a minus (+ / -) rozbalit / sbalit podrobnosti pro každou doménu.
Zvýraznění druhé a všech následujících adres URL ve stejné doméně
V předchozí části jsme si ukázali, jak seskupovat adresy URL podle domén. Místo seskupování můžete duplicitní položky stejného názvu domény v adresách URL rychle obarvit.
Další podrobnosti naleznete v části Jak zvýraznit duplicity v aplikaci Excel.
Porovnání adres URL z různých tabulek podle sloupce domény
Možná máte jeden nebo několik samostatných tabulek aplikace Excel, kde uchováváte seznam názvů domén. Vaše tabulky mohou obsahovat odkazy, se kterými nechcete pracovat, například spam nebo domény, které jste již zpracovali. Možná také budete potřebovat uchovávat seznam domén se zajímavými odkazy a všechny ostatní odstranit.
Mým úkolem je například obarvit červeně všechny domény, které jsou na černé listině spammerů:
Abyste neztráceli mnoho času, můžete porovnat své tabulky a odstranit nepotřebné odkazy. Podrobné informace naleznete v článku Jak porovnat dva sloupce aplikace Excel a odstranit duplicity.
Nejlepší způsob je sloučit dvě tabulky podle názvu domény.
Tento způsob je nejpokročilejší a já osobně mu dávám přednost.
Předpokládejme, že pro každou doménu, se kterou jste kdy pracovali, máte samostatný sešit Excelu s referenčními údaji. V tomto sešitě jsou uloženy kontakty na webmastery pro výměnu odkazů a datum, kdy byl váš web v této doméně zmíněn. Mohou zde být také typy/podtypy webů a samostatný sloupec s vašimi komentáři, jako na obrázku níže.
Jakmile získáte nový seznam odkazů, můžete porovnat dvě tabulky podle názvu domény a během dvou minut sloučit informace z tabulky pro vyhledávání domén a z nového listu URL.
Výsledkem bude název domény a také kategorie webových stránek a vaše komentáře. Díky tomu uvidíte adresy URL ze seznamu, které je třeba odstranit, a ty, které je třeba zpracovat.
Srovnejte dvě tabulky podle názvu domény a sloučte data:
- Stáhněte a nainstalujte nejnovější verzi Průvodce sloučením tabulek pro Microsoft Excel
Tento šikovný nástroj bleskově porovná a sloučí dva pracovní listy aplikace Excel 2013-2003. Jako jedinečný identifikátor můžete použít jeden nebo několik sloupců, aktualizovat stávající sloupce v hlavním pracovním listu nebo přidat nové z vyhledávací tabulky. Neváhejte a přečtěte si více o Průvodci sloučením tabulek na našich webových stránkách.
- Otevřete seznam adres URL v aplikaci Excel a vyjměte názvy domén, jak je popsáno výše.
- Vyberte libovolnou buňku v tabulce. Poté přejděte na položku Data Ablebits a klikněte na kartu Sloučení dvou tabulek spustit doplněk.
- Stiskněte tlačítko Další a vyberte svůj pracovní list s informacemi o doménách jako. Vyhledávací tabulka .
- Zaškrtněte políčko vedle Doména, abyste ji identifikovali jako odpovídající sloupec .
- Vyberte informace o doméně, které chcete přidat do seznamu adres URL, a klikněte na tlačítko Další.
- Stiskněte tlačítko Dokončení Po dokončení zpracování zobrazí doplněk zprávu s podrobnostmi o sloučení.
Stačí pár vteřin a na první pohled získáte všechny informace o každém názvu domény.
Můžete si stáhnout Průvodce sloučením tabulek pro Excel, spustit jej na svých datech a vyzkoušet, jak užitečný může být.
Pokud máte zájem získat bezplatný doplněk pro extrakci názvů domén a podsložek kořenové domény (.com, .edu, .us atd.) ze seznamu URL, jednoduše nám napište komentář. Přitom prosím uveďte verzi Excelu, např. Excel 2010 64-bit, a do příslušného pole zadejte svou e-mailovou adresu (nebojte se, nebude veřejně zobrazena). Pokud budeme mít slušný počet hlasů, budemevytvořit takový doplněk a dám vám vědět. Děkuji předem!