Извличане на имена на домейни от списък с URL адреси в Excel

  • Споделя Това
Michael Brown

Няколко съвета и препоръки ще ви помогнат да извлечете имената на домейни от списък с URL адреси с помощта на формули на Excel. Два варианта на формулата ви позволяват да извлечете имената на домейни с и без www. независимо от протокола на URL адреса (поддържат се http, https, ftp и т.н.). Решението работи във всички съвременни версии на Excel, от 2010 до 2016 г.

Ако се занимавате с популяризиране на вашия уебсайт (както аз) или се занимавате със SEO на професионално ниво, като популяризирате уебсайтове на клиенти за пари, често ви се налага да обработвате и анализирате огромни списъци с URL адреси: отчети на Google Analytics за трафика, отчети на Webmaster tools за новите връзки, отчети за обратните връзки към уебсайтовете на вашите конкуренти (които съдържат много интересни факти ;) ) и т.н.и т.н.

За обработката на такива списъци - от десет до един милион връзки - Microsoft Excel е идеален инструмент. Той е мощен, гъвкав, разширяем и позволява да изпратите отчет на клиента си директно от лист на Excel.

"Защо е този диапазон - от 10 до 1 000 000?" - може би ще ме попитате. Защото определено нямате нужда от инструмент, който да обработва по-малко от 10 връзки; а едва ли ще имате нужда от такъв, ако имате над един милион входящи връзки. Бих се обзаложил, че в този случай вече сте имали разработен по поръчка софтуер специално за вас, с бизнес логика, специално съобразена с вашите нужди.вашите статии, а не обратното :)

Когато анализирате списък с URL адреси, често се налага да изпълнявате следните задачи: получаване на имена на домейни за по-нататъшна обработка, групиране на URL адреси по домейни, премахване на връзки от вече обработени домейни, сравняване и обединяване на две таблици по имена на домейни и др.

    5 лесни стъпки за извличане на имена на домейни от списъка с URL адреси

    Като пример нека вземем фрагмент от отчета за обратните връзки на ablebits.com, генериран от Google Webmaster Tools.

    Съвет: Препоръчвам ви да използвате сайта ahrefs.com, за да откривате своевременно нови връзки към собствения си сайт и към уебсайтовете на конкурентите си.

    1. Добавете " Домейн " в края на таблицата.

      Експортирахме данните от CSV файл, поради което от гледна точка на Excel данните ни са в обикновен диапазон. Натиснете Ctrl + T, за да ги преобразувате в таблица на Excel, защото така е много по-удобно да се работи с тях.

    2. В първата клетка на " Домейн " (B2), въведете формулата за извличане на име на домейн:
      • Извличане на домейна с www., ако той присъства в URL адреса:

    =MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)

  • Пропуснете www. и получете чисто име на домейн:
  • =IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7,FIND("/",A2,9)-FIND(":",A2,4)-7))

    Втората формула може да ви се стори твърде дълга и сложна, но само ако не сте виждали наистина дълги формули. Не без основание Microsoft увеличи максималната дължина на формулите до 8192 знака в новите версии на Excel :)

    Хубавото е, че не е необходимо да използваме нито допълнителна колона, нито макрос VBA. Всъщност използването на макроси VBA за автоматизиране на задачите в Excel не е толкова трудно, колкото изглежда, вижте една много добра статия - как да създаваме и използваме макроси VBA. Но в този конкретен случай всъщност нямаме нужда от тях, по-бързо и по-лесно е да се справим с формула.

    Забележка: Технически, www е домейнът от трето ниво, въпреки че при всички нормални уебсайтове www. е просто псевдоним на основния домейн. В първите дни на интернет можеше да кажете "double u, double u, double u нашето готино име dot com" по телефона или в радиореклама и всички отлично разбираха и помнеха къде да ви търсят, разбира се, ако готиното ви име не беше нещо катоwww.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)

    Трябва да оставите всички други имена на домейни от трето ниво, в противен случай ще объркате връзките от различни сайтове, например с домейн "co.uk" или от различни акаунти в blogspot.com и т.н.

  • Тъй като имаме пълноценна таблица, Excel автоматично копира формулата във всички клетки в колоната.

    Готово! Имаме колона с извлечени имена на домейни.

    В следващия раздел ще научите как можете да обработвате списък с URL адреси въз основа на колоната Domain.

    Съвет: Ако по-късно ви се наложи да редактирате имената на домейни ръчно или да копирате резултатите в друг работен лист на Excel, заменете резултатите от формулата със стойности. За да направите това, продължете със следните стъпки:

    • Щракнете върху която и да е клетка в колоната Domain и натиснете Ctrl+Space, за да изберете всички клетки в тази колона.
    • Натиснете Ctrl + C, за да копирате данните в клипборда, след което отидете в Начало щракнете върху " Паста " бутон и изберете " Стойност " от падащото меню.
  • Обработка на списък с URL адреси чрез колоната Име на домейн

    Тук ще намерите няколко съвета за по-нататъшна обработка на списъка с URL адреси, основани на собствения ми опит.

    Групиране на URL адреси по домейн

    1. Щракнете върху която и да е клетка в Домейн колона.
    2. Сортирайте таблицата по домейн: отидете в Данни и щракнете върху ОТ А ДО Я бутон.
    3. Конвертиране на таблицата обратно в диапазон: щракнете върху която и да е клетка в таблицата, отидете в Дизайн и щракнете върху " Преобразуване в диапазона " бутон.
    4. Отидете в Данни и щракнете върху " Междинна сума " икона.
    5. В диалоговия прозорец "Междинна сума" изберете следните опции: При всяка промяна в : "Домейн" използване на функция Преброяване и Добавяне на междинна сума към Домейн.

  • Щракнете върху OK.
  • Excel е създал контур на вашите данни в лявата част на екрана. Контурът има 3 нива и това, което виждате сега, е разширеният изглед или изгледът от ниво 3. Щракнете върху номер 2 в горния ляв ъгъл, за да се покажат окончателните данни по домейни, след което можете да щракнете върху знаците плюс и минус (+ / -), за да разширите / сгънете подробностите за всеки домейн.

    Подчертаване на втория и всички следващи URL адреси в същия домейн

    В предишния раздел показахме как да групирате URL адреси по домейн. Вместо да групирате, можете бързо да оцветите дублиращите се записи на едно и също име на домейн във вашите URL адреси.

    За повече информация вижте как да подчертаете дубликатите в Excel.

    Сравняване на URL адреси от различни таблици по колона за домейн

    Възможно е да имате една или няколко отделни работни таблици в Excel, в които да съхранявате списък с имена на домейни. Таблиците ви може да съдържат връзки, с които не искате да работите, като спам или вече обработени домейни. Може също така да се наложи да запазите списък с домейни с интересни връзки и да изтриете всички останали.

    Например моята задача е да оцветя в червено всички домейни, които са в черния ми списък със спамъри:

    За да не губите много време, можете да сравните таблиците си, за да изтриете ненужните връзки. За повече информация прочетете Как да сравним две колони в Excel и да изтрием дубликатите

    Най-добрият начин е да се обединят две таблици по име на домейн

    Това е най-усъвършенстваният начин, който аз лично предпочитам.

    Да предположим, че имате отделен работен лист в Excel със справочни данни за всеки домейн, с който сте работили някога. В този работен лист се съхраняват контактите на уебмастърите за обмен на връзки и датата, на която вашият уебсайт е бил споменат в този домейн. Може да има и типове/подтипове уебсайтове и отделна колона с вашите коментари, както е на снимката по-долу.

    Щом получите нов списък с връзки, можете да съпоставите две таблици по име на домейн и да обедините информацията от таблицата за търсене на домейни и новия лист с URL адреси само за две минути.

    В резултат на това ще получите името на домейна, както и категорията на уебсайта и вашите коментари. Това ще ви позволи да видите URL адресите от списъка, които трябва да изтриете, и тези, които трябва да обработите.

    Съпоставете две таблици по име на домейн и слейте данните:

    1. Изтеглете и инсталирайте най-новата версия на съветника за сливане на таблици за Microsoft Excel

      Този елегантен инструмент ще съчетае и слее за миг два работни листа на Excel 2013-2003 г. Можете да използвате една или няколко колони като уникален идентификатор, да актуализирате съществуващите колони в главния работен лист или да добавите нови от таблицата за търсене. Не се колебайте да прочетете повече за съветника за сливане на таблици на нашия уебсайт.

    2. Отворете списъка с URL адреси в Excel и извлечете имената на домейни, както е описано по-горе.
    3. Изберете която и да е клетка в таблицата. След това отидете в Данни от Ablebits и щракнете върху Обединяване на две таблици икона, за да стартирате добавката.
    4. Натиснете бутона Следваща и изберете работния си лист с информацията за домейните като Таблица за търсене .
    5. Поставете отметка в квадратчето за отметка до Домейн, за да го идентифицирате като съответстваща колона .
    6. Изберете каква информация за домейна искате да добавите към списъка с URL адреси и щракнете върху Напред.
    7. Натиснете бутона Завършете Когато обработката приключи, добавката ще ви покаже съобщение с подробностите за сливането.

    Само няколко секунди - и ще получите цялата информация за всяко име на домейн с един поглед.

    Можете да изтеглите съветника за сливане на таблици за Excel, да го стартирате с вашите данни и да видите колко полезен може да бъде той.

    Ако се интересувате да получите безплатна добавка за извличане на имена на домейни и подпапки на основния домейн (.com, .edu, .us и т.н.) от списъка с URL адреси, просто ни изпратете коментар. Когато правите това, моля, посочете версията на Excel, напр. Excel 2010 64-bit, и въведете имейл адреса си в съответното поле (не се притеснявайте, той няма да бъде показван публично). Ако получим приличен брой гласове, щесъздайте такава добавка и ви уведомявам. Благодаря ви предварително!

    Майкъл Браун е отдаден технологичен ентусиаст със страст към опростяване на сложни процеси с помощта на софтуерни инструменти. С повече от десетилетие опит в технологичната индустрия, той е усъвършенствал уменията си в Microsoft Excel и Outlook, както и в Google Sheets и Docs. Блогът на Майкъл е посветен на споделянето на неговите знания и опит с други, предоставяйки лесни за следване съвети и уроци за подобряване на продуктивността и ефективността. Независимо дали сте опитен професионалист или начинаещ, блогът на Michael предлага ценни прозрения и практически съвети за извличане на максимума от тези основни софтуерни инструменти.