Зміст
Кілька порад і рекомендацій допоможуть вам отримати доменні імена зі списку URL-адрес за допомогою формул Excel. Дві варіації формули дозволяють витягти доменні імена з www і без www. незалежно від протоколу URL-адреси (підтримуються http, https, ftp і т.д.). Рішення працює у всіх сучасних версіях Excel, починаючи з 2010 і закінчуючи 2016 роками.
Якщо ви займаєтеся просуванням свого сайту (як я) або ж на професійному рівні займаєтеся SEO, просуваючи сайти клієнтів за гроші, вам часто доводиться обробляти та аналізувати величезні списки URL-адрес: звіти Google Analytics про залучення трафіку, звіти інструментів для веб-майстрів про нові посилання, звіти про зворотні посилання на сайти конкурентів (які містять дуже багато цікавого ;) ) і так даліі так далі, і тому подібне.
Для обробки таких списків, від десяти до мільйона посилань, ідеальним інструментом є Microsoft Excel - потужний, гнучкий, розширюваний інструмент, який дозволяє надсилати звіт клієнту безпосередньо з аркуша Excel.
"Чому саме такий діапазон - від 10 до 1 000 000?" - запитаєте ви. Тому що вам точно не потрібен інструмент для обробки менше 10 посилань, і навряд чи знадобиться, якщо у вас більше мільйона вхідних посилань. Готовий посперечатися, що в цьому випадку у вас вже було розроблено спеціальне програмне забезпечення, з бізнес-логікою, адаптованою під ваші потреби. І саме я буду вивчативаші статті, а не навпаки :)
При аналізі списку URL-адрес часто потрібно виконати такі завдання: отримати доменні імена для подальшої обробки, згрупувати URL-адреси за доменами, видалити посилання з уже оброблених доменів, порівняти і об'єднати дві таблиці за доменними іменами тощо.
5 простих кроків для вилучення доменних імен зі списку URL-адрес
Для прикладу наведемо фрагмент звіту про зворотні посилання сайту ablebits.com, який генерує Google Webmaster Tools.
Порада: рекомендую використовувати ahrefs.com для своєчасного виявлення нових посилань на власний сайт та сайти конкурентів.
- Додайте " Домен " в кінці вашої таблиці.
Ми експортували дані з CSV тому з точки зору Excel наші дані знаходяться в простому діапазоні. Щоб перетворити їх в таблицю Excel, натисніть Ctrl + T, адже з нею набагато зручніше працювати.
- У першій комірці " Домен " колонки (B2) введіть формулу для вилучення доменного імені:
- Витягніть домен з www. якщо він присутній в URL-адресі:
=MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)
=IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2.4)+3,FIND("/",A2.9)-FIND(":",A2.4)-3), MID(A2,FIND(":",A2.4)+7,FIND("/",A2.9)-FIND(":",A2.4)-7))
Друга формула може здатися занадто довгою і складною, але тільки якщо ви не бачили по-справжньому довгих формул. Недарма в нових версіях Excel Microsoft збільшила максимальну довжину формул до 8192 символів :)
Добре те, що нам не доведеться використовувати ні додатковий стовпець, ні макрос VBA. Насправді, використовувати макроси VBA для автоматизації ваших завдань в Excel не так складно, як може здатися, див. дуже хорошу статтю - як створювати і використовувати макроси VBA. Але в даному конкретному випадку вони нам фактично не потрібні, швидше і простіше обійтися формулою.
Примітка: Формально, www це домен 3-го рівня, хоча для всіх нормальних сайтів www. є лише псевдонімом основного домену. На початку зародження Інтернету можна було сказати "double u, double u, double u наше круте ім'я dot com" по телефону або в радіорекламі, і всі прекрасно розуміли і запам'ятовували, де вас шукати, звичайно, якщо тільки ваше круте ім'я не було чимось на кшталтwww.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)
Всі інші доменні імена 3-го рівня потрібно залишити, інакше можна переплутати посилання з різних сайтів, наприклад, з доменом "co.uk" або з різних акаунтів на blogspot.com і т.д.
Готово! Маємо стовпчик з витягнутими доменними іменами.
У наступному розділі ви дізнаєтеся, як можна обробити список URL-адрес на основі стовпця Домен.
Порада: Якщо згодом вам знадобиться відредагувати доменні імена вручну або скопіювати результати на інший аркуш Excel, замініть результати формули значеннями. Для цього виконайте наступні дії:
- Клацніть по будь-якій комірці в стовпчику Домен і натисніть клавіші Ctrl+Пробіл, щоб виділити всі комірки в цьому стовпчику.
- Натисніть Ctrl + C, щоб скопіювати дані в буфер обміну, потім перейдіть в меню Головна сторінка на вкладці "Вкладка" натисніть кнопку " Паста " і виберіть " Значення " у випадаючому меню.
Обробка списку URL-адрес за допомогою стовпця Доменне ім'я
Тут ви знайдете кілька порад щодо подальшого опрацювання списку URL-адрес з мого власного досвіду.
Групування URL-адрес за доменами
- Клацніть по будь-якій комірці у вікні Домен колонка.
- Відсортуйте таблицю по Домену: перейдіть в розділ Дані та натисніть на вкладку A-Z кнопку.
- Перетворіть таблицю назад в діапазон: клацніть по будь-якій комірці таблиці, перейдіть в меню Дизайн і натисніть на вкладку " Перевести в діапазон "Кнопка".
- Перейдіть на сторінку Дані і натисніть на вкладку " Підсумок "значок.
- У діалоговому вікні "Проміжні підсумки" виберіть наступні опції: При кожній зміні в : "Домен" функція використання Підрахуйте і Додайте проміжний підсумок до Домен.
Excel створив контур ваших даних у лівій частині екрана. Існує 3 рівні контуру, і те, що ви бачите зараз, є розширеним поданням, або поданням 3-го рівня. Клацніть цифру 2 у верхньому лівому куті, щоб відобразити остаточні дані за доменами, а потім ви можете натиснути знаки плюс і мінус (+ / -), щоб розширити / згорнути деталі для кожного домену.
Виділіть другий і всі наступні URL-адреси в одному домені
У попередньому розділі ми показали, як групувати URL-адреси за доменами. Замість групування можна швидко розфарбувати повторювані записи одного і того ж доменного імені в URL-адресах.
Детальніше про те, як виділити дублікати в Excel, дивіться в розділі "Виділення дублікатів".
Порівняйте свої URL-адреси з різних таблиць по колонці домену
У вас може бути один або кілька окремих таблиць Excel, де ви зберігаєте список доменних імен. Ваші таблиці можуть містити посилання, з якими ви не хочете працювати, наприклад, спам або домени, які ви вже обробили. Вам також може знадобитися зберегти список доменів з цікавими посиланнями і видалити всі інші.
Наприклад, моє завдання - пофарбувати в червоний колір всі домени, які знаходяться в моєму чорному списку спамерів:
Щоб не витрачати багато часу, ви можете порівняти ваші таблиці, щоб видалити зайві посилання. Для більш детальної інформації, будь ласка, прочитайте статтю Як порівняти два стовпці Excel і видалити дублікати
Найкращий спосіб - об'єднати дві таблиці за доменними іменами
Це найбільш прогресивний шлях і той, якому я особисто віддаю перевагу.
Припустимо, у вас є окрема таблиця Excel з довідковими даними по кожному домену, з яким ви коли-небудь працювали. У цій таблиці зберігаються контакти веб-майстрів для обміну посиланнями і дата, коли ваш сайт згадувався в цьому домені. Також можуть бути вказані типи/підтипи сайтів і окрема колонка з вашими коментарями, як на скріншоті нижче.
Як тільки ви отримаєте новий список посилань, ви зможете зіставити дві таблиці за доменними іменами і об'єднати інформацію з таблиці пошуку доменів і вашого нового листа URL-адрес всього за дві хвилини.
В результаті ви отримаєте доменне ім'я, а також категорію веб-сайту і ваші коментарі. Це дозволить вам побачити URL-адреси зі списку, які потрібно видалити, і ті, які потрібно обробити.
Зіставити дві таблиці за доменним ім'ям та об'єднати дані:
- Завантажте та встановіть останню версію Майстра злиття таблиць для Microsoft Excel
Цей чудовий інструмент миттєво зіставляє та об'єднує два аркуші Excel 2013-2003. Ви можете використовувати один або кілька стовпців як унікальний ідентифікатор, оновити існуючі стовпці на головному аркуші або додати нові з таблиці пошуку. Не соромтеся прочитати більше про майстер злиття таблиць на нашому веб-сайті.
- Відкрийте список URL-адрес в Excel і витягніть доменні імена, як описано вище.
- Виділіть будь-яку комірку в таблиці і перейдіть на вкладку Дані про абіти та натисніть на вкладку Об'єднання двох таблиць для запуску доповнення.
- Натисніть кнопку Далі двічі і виберіть свій робочий аркуш з інформацією про домени в якості Таблиця пошуку .
- Встановіть галочку навпроти Домену, щоб визначити його як відповідний стовпець .
- Виберіть, яку інформацію про домен ви хочете додати до списку URL-адрес, і натисніть Далі.
- Натисніть кнопку Фініш Після завершення обробки доповнення покаже вам повідомлення з деталями об'єднання.
Всього кілька секунд - і ви отримуєте всю інформацію про кожне доменне ім'я як на долоні.
Ви можете завантажити Merge Tables Wizard for Excel, запустити його на своїх даних і побачити, наскільки він може бути корисним.
Якщо ви зацікавлені в отриманні безкоштовного доповнення для вилучення доменних імен і підпапок кореневого домену (.com, .edu, .us і т.д.) зі списку URL-адрес, просто напишіть нам коментар. При цьому, будь ласка, вкажіть вашу версію Excel, наприклад, Excel 2010 64-bit, і введіть свою електронну адресу у відповідне поле (не хвилюйтеся, вона не буде відображатися публічно). Якщо ми наберемо пристойну кількість голосів, мистворіть такий і доповнення і я дам Вам знати. Заздалегідь дякую!