Витяг доменних імен зі списку URL-адрес в Excel

  • Поділитися Цим
Michael Brown

Кілька порад і рекомендацій допоможуть вам отримати доменні імена зі списку URL-адрес за допомогою формул Excel. Дві варіації формули дозволяють витягти доменні імена з www і без www. незалежно від протоколу URL-адреси (підтримуються http, https, ftp і т.д.). Рішення працює у всіх сучасних версіях Excel, починаючи з 2010 і закінчуючи 2016 роками.

Якщо ви займаєтеся просуванням свого сайту (як я) або ж на професійному рівні займаєтеся SEO, просуваючи сайти клієнтів за гроші, вам часто доводиться обробляти та аналізувати величезні списки URL-адрес: звіти Google Analytics про залучення трафіку, звіти інструментів для веб-майстрів про нові посилання, звіти про зворотні посилання на сайти конкурентів (які містять дуже багато цікавого ;) ) і так даліі так далі, і тому подібне.

Для обробки таких списків, від десяти до мільйона посилань, ідеальним інструментом є Microsoft Excel - потужний, гнучкий, розширюваний інструмент, який дозволяє надсилати звіт клієнту безпосередньо з аркуша Excel.

"Чому саме такий діапазон - від 10 до 1 000 000?" - запитаєте ви. Тому що вам точно не потрібен інструмент для обробки менше 10 посилань, і навряд чи знадобиться, якщо у вас більше мільйона вхідних посилань. Готовий посперечатися, що в цьому випадку у вас вже було розроблено спеціальне програмне забезпечення, з бізнес-логікою, адаптованою під ваші потреби. І саме я буду вивчативаші статті, а не навпаки :)

При аналізі списку URL-адрес часто потрібно виконати такі завдання: отримати доменні імена для подальшої обробки, згрупувати URL-адреси за доменами, видалити посилання з уже оброблених доменів, порівняти і об'єднати дві таблиці за доменними іменами тощо.

    5 простих кроків для вилучення доменних імен зі списку URL-адрес

    Для прикладу наведемо фрагмент звіту про зворотні посилання сайту ablebits.com, який генерує Google Webmaster Tools.

    Порада: рекомендую використовувати ahrefs.com для своєчасного виявлення нових посилань на власний сайт та сайти конкурентів.

    1. Додайте " Домен " в кінці вашої таблиці.

      Ми експортували дані з CSV тому з точки зору Excel наші дані знаходяться в простому діапазоні. Щоб перетворити їх в таблицю Excel, натисніть Ctrl + T, адже з нею набагато зручніше працювати.

    2. У першій комірці " Домен " колонки (B2) введіть формулу для вилучення доменного імені:
      • Витягніть домен з www. якщо він присутній в URL-адресі:

    =MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)

  • Опускаємо www. і отримуємо чисте доменне ім'я:
  • =IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2.4)+3,FIND("/",A2.9)-FIND(":",A2.4)-3), MID(A2,FIND(":",A2.4)+7,FIND("/",A2.9)-FIND(":",A2.4)-7))

    Друга формула може здатися занадто довгою і складною, але тільки якщо ви не бачили по-справжньому довгих формул. Недарма в нових версіях Excel Microsoft збільшила максимальну довжину формул до 8192 символів :)

    Добре те, що нам не доведеться використовувати ні додатковий стовпець, ні макрос VBA. Насправді, використовувати макроси VBA для автоматизації ваших завдань в Excel не так складно, як може здатися, див. дуже хорошу статтю - як створювати і використовувати макроси VBA. Але в даному конкретному випадку вони нам фактично не потрібні, швидше і простіше обійтися формулою.

    Примітка: Формально, www це домен 3-го рівня, хоча для всіх нормальних сайтів www. є лише псевдонімом основного домену. На початку зародження Інтернету можна було сказати "double u, double u, double u наше круте ім'я dot com" по телефону або в радіорекламі, і всі прекрасно розуміли і запам'ятовували, де вас шукати, звичайно, якщо тільки ваше круте ім'я не було чимось на кшталтwww.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)

    Всі інші доменні імена 3-го рівня потрібно залишити, інакше можна переплутати посилання з різних сайтів, наприклад, з доменом "co.uk" або з різних акаунтів на blogspot.com і т.д.

  • Оскільки ми маємо повноцінну таблицю, Excel автоматично копіює формулу по всіх комірках стовпця.

    Готово! Маємо стовпчик з витягнутими доменними іменами.

    У наступному розділі ви дізнаєтеся, як можна обробити список URL-адрес на основі стовпця Домен.

    Порада: Якщо згодом вам знадобиться відредагувати доменні імена вручну або скопіювати результати на інший аркуш Excel, замініть результати формули значеннями. Для цього виконайте наступні дії:

    • Клацніть по будь-якій комірці в стовпчику Домен і натисніть клавіші Ctrl+Пробіл, щоб виділити всі комірки в цьому стовпчику.
    • Натисніть Ctrl + C, щоб скопіювати дані в буфер обміну, потім перейдіть в меню Головна сторінка на вкладці "Вкладка" натисніть кнопку " Паста " і виберіть " Значення " у випадаючому меню.
  • Обробка списку URL-адрес за допомогою стовпця Доменне ім'я

    Тут ви знайдете кілька порад щодо подальшого опрацювання списку URL-адрес з мого власного досвіду.

    Групування URL-адрес за доменами

    1. Клацніть по будь-якій комірці у вікні Домен колонка.
    2. Відсортуйте таблицю по Домену: перейдіть в розділ Дані та натисніть на вкладку A-Z кнопку.
    3. Перетворіть таблицю назад в діапазон: клацніть по будь-якій комірці таблиці, перейдіть в меню Дизайн і натисніть на вкладку " Перевести в діапазон "Кнопка".
    4. Перейдіть на сторінку Дані і натисніть на вкладку " Підсумок "значок.
    5. У діалоговому вікні "Проміжні підсумки" виберіть наступні опції: При кожній зміні в : "Домен" функція використання Підрахуйте і Додайте проміжний підсумок до Домен.

  • Натисни ОК.
  • Excel створив контур ваших даних у лівій частині екрана. Існує 3 рівні контуру, і те, що ви бачите зараз, є розширеним поданням, або поданням 3-го рівня. Клацніть цифру 2 у верхньому лівому куті, щоб відобразити остаточні дані за доменами, а потім ви можете натиснути знаки плюс і мінус (+ / -), щоб розширити / згорнути деталі для кожного домену.

    Виділіть другий і всі наступні URL-адреси в одному домені

    У попередньому розділі ми показали, як групувати URL-адреси за доменами. Замість групування можна швидко розфарбувати повторювані записи одного і того ж доменного імені в URL-адресах.

    Детальніше про те, як виділити дублікати в Excel, дивіться в розділі "Виділення дублікатів".

    Порівняйте свої URL-адреси з різних таблиць по колонці домену

    У вас може бути один або кілька окремих таблиць Excel, де ви зберігаєте список доменних імен. Ваші таблиці можуть містити посилання, з якими ви не хочете працювати, наприклад, спам або домени, які ви вже обробили. Вам також може знадобитися зберегти список доменів з цікавими посиланнями і видалити всі інші.

    Наприклад, моє завдання - пофарбувати в червоний колір всі домени, які знаходяться в моєму чорному списку спамерів:

    Щоб не витрачати багато часу, ви можете порівняти ваші таблиці, щоб видалити зайві посилання. Для більш детальної інформації, будь ласка, прочитайте статтю Як порівняти два стовпці Excel і видалити дублікати

    Найкращий спосіб - об'єднати дві таблиці за доменними іменами

    Це найбільш прогресивний шлях і той, якому я особисто віддаю перевагу.

    Припустимо, у вас є окрема таблиця Excel з довідковими даними по кожному домену, з яким ви коли-небудь працювали. У цій таблиці зберігаються контакти веб-майстрів для обміну посиланнями і дата, коли ваш сайт згадувався в цьому домені. Також можуть бути вказані типи/підтипи сайтів і окрема колонка з вашими коментарями, як на скріншоті нижче.

    Як тільки ви отримаєте новий список посилань, ви зможете зіставити дві таблиці за доменними іменами і об'єднати інформацію з таблиці пошуку доменів і вашого нового листа URL-адрес всього за дві хвилини.

    В результаті ви отримаєте доменне ім'я, а також категорію веб-сайту і ваші коментарі. Це дозволить вам побачити URL-адреси зі списку, які потрібно видалити, і ті, які потрібно обробити.

    Зіставити дві таблиці за доменним ім'ям та об'єднати дані:

    1. Завантажте та встановіть останню версію Майстра злиття таблиць для Microsoft Excel

      Цей чудовий інструмент миттєво зіставляє та об'єднує два аркуші Excel 2013-2003. Ви можете використовувати один або кілька стовпців як унікальний ідентифікатор, оновити існуючі стовпці на головному аркуші або додати нові з таблиці пошуку. Не соромтеся прочитати більше про майстер злиття таблиць на нашому веб-сайті.

    2. Відкрийте список URL-адрес в Excel і витягніть доменні імена, як описано вище.
    3. Виділіть будь-яку комірку в таблиці і перейдіть на вкладку Дані про абіти та натисніть на вкладку Об'єднання двох таблиць для запуску доповнення.
    4. Натисніть кнопку Далі двічі і виберіть свій робочий аркуш з інформацією про домени в якості Таблиця пошуку .
    5. Встановіть галочку навпроти Домену, щоб визначити його як відповідний стовпець .
    6. Виберіть, яку інформацію про домен ви хочете додати до списку URL-адрес, і натисніть Далі.
    7. Натисніть кнопку Фініш Після завершення обробки доповнення покаже вам повідомлення з деталями об'єднання.

    Всього кілька секунд - і ви отримуєте всю інформацію про кожне доменне ім'я як на долоні.

    Ви можете завантажити Merge Tables Wizard for Excel, запустити його на своїх даних і побачити, наскільки він може бути корисним.

    Якщо ви зацікавлені в отриманні безкоштовного доповнення для вилучення доменних імен і підпапок кореневого домену (.com, .edu, .us і т.д.) зі списку URL-адрес, просто напишіть нам коментар. При цьому, будь ласка, вкажіть вашу версію Excel, наприклад, Excel 2010 64-bit, і введіть свою електронну адресу у відповідне поле (не хвилюйтеся, вона не буде відображатися публічно). Якщо ми наберемо пристойну кількість голосів, мистворіть такий і доповнення і я дам Вам знати. Заздалегідь дякую!

    Майкл Браун — відданий ентузіаст технологій із пристрастю до спрощення складних процесів за допомогою програмних засобів. Маючи понад десятирічний досвід роботи в технологічній індустрії, він відточив свої навички роботи з Microsoft Excel і Outlook, а також із Google Таблицями та Документами. Блог Майкла присвячений тому, щоб поділитися своїми знаннями та досвідом з іншими, надаючи прості поради та навчальні посібники для підвищення продуктивності та ефективності. Незалежно від того, чи є ви досвідченим професіоналом чи початківцем, блог Майкла пропонує цінну інформацію та практичні поради щодо отримання максимальної користі від цих основних програмних інструментів.