Извлечете имиња на домени од списокот со URL во Excel

  • Споделете Го Ова
Michael Brown

Неколку совети и совети ќе ви помогнат да добиете имиња на домени од список со URL-адреси користејќи формули на Excel. Две варијации на формулата ви дозволуваат да ги извлечете имињата на домени со и без www. без оглед на протоколот за URL (поддржани се http, https, ftp итн.). Решението функционира во сите модерни верзии на Excel, од 2010 до 2016 година.

Ако сте загрижени за промовирање на вашата веб-страница (како што сум јас) или правите оптимизација на професионално ниво, промовирајќи ја веб-страницата на клиентите -страници за пари, честопати треба да обработувате и анализирате огромни списоци со URL-адреси: извештаи на Google Analytics за стекнување сообраќај, извештаи од алатките на веб-администраторите за нови врски, извештаи за линкови до веб-страниците на вашите конкуренти (кои содржат многу интересни факти ;) ) и така натаму, и така натаму.

За обработка на такви списоци, од десет до милион врски, Microsoft Excel прави идеална алатка. Тој е моќен, агилен, може да се прошири и ви овозможува да испратите извештај до вашиот клиент директно од лист на Excel.

„Зошто е овој опсег, од 10 до 1.000.000? може да ме прашате. Затоа што дефинитивно не ви треба алатка за обработка на помалку од 10 врски; и тешко дека ќе ви требаат ако имате над милион влезни врски. Јас би се обложил дека во овој случај веќе сте имале прилагоден софтвер развиен специјално за вас, со деловна логика специјално прилагодена за вашите потреби. И јас би бил тој што би ги разгледувал твоите написи, а необратно :)

Кога анализирате список на URL-адреси, честопати треба да ги извршите следните задачи: да добиете имиња на домени за понатамошна обработка, да групирате URL-адреси по домен, да отстраните врски од веќе обработените домени, да споредите и споите два табели по имиња на домени итн.

5 лесни чекори за извлекување имиња на домени од списокот со URL-адреси

Како пример, да земеме дел од извештајот за повратни врски на ablebits.com генерирани од Google Webmaster Tools.

Совет: Би препорачал да го користите ahrefs.com за навремено да забележите нови врски до вашиот сопствен сајт и веб-страниците на вашите конкуренти.

  1. Додајте го „ доменот " колона до крајот на вашата табела.

    Ги извезовме податоците од датотека CSV , поради што во однос на Excel нашите податоци се во едноставен опсег. Притиснете Ctrl + T за да ги претворите во табела на Excel бидејќи е многу поудобно за работа.

  2. Во првата ќелија од колоната „ Домен “ (B2), внесете ја формулата за извлекување име на домен:
    • Извадете го доменот со www. ако е присутен во URL:

=MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)

  • Испушти www. и добијте чисто име на домен:
  • =IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7,FIND("/",A2,9)-FIND(":",A2,4)-7))

    Втората формула може да изгледа премногу долга и сложена, но само ако не сте виделе навистина долги формули. Не е без причина што Мајкрософт ја зголеми максималната должина на формулите до 8192 знаци во новите верзии на Excel :)

    Доброто е што не мора да користиме ниту едендополнителна колона или VBA макро. Всушност, користењето VBA макроа за автоматизирање на вашите задачи во Excel не е толку тешко како што може да изгледа, видете многу добра статија - како да креирате и користите VBA макроа. Но, во овој конкретен случај, тие всушност не ни се потребни, побрзо и полесно е да се оди со формула.

    Забелешка: Технички, www е домен од трето ниво, иако со сите нормални веб-страници www. е само алијас на примарниот домен. Во раните денови на интернетот, можевте да кажете „double u, double u, double u our cool name dot com“ на телефон или во оглас на радио, и сите совршено разбраа и се сетија каде да ве бараат, се разбира освен ако не твоето кул име беше нешто како www.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)

    Треба да ги оставиш сите други имиња на домени од 3-то ниво, инаку ќе ги расипуваш линковите од различни сајтови, на пр. со домен „co.uk“ или од различни сметки на blogspot.com итн.

  • Бидејќи имаме целосна табела, Excel автоматски ја копира формулата низ сите ќелии во колоната.

    Готово! Имаме колона со извлечени имиња на домени.

    Во следниот дел ќе научите како можете да обработувате листа на URL-адреси врз основа на колоната домен.

    Совет: ако можеби ќе треба да ги уредувате имињата на домените рачно подоцна или копирајте ги резултатите во друг работен лист на Excel, заменете ги резултатите од формулата со вредности. Да направишова, продолжете со следните чекори:

    • Кликнете на која било ќелија во колоната Домен и притиснете Ctrl+Space за да ги изберете сите ќелии во таа колона.
    • Притиснете Ctrl + C за да копирајте ги податоците во таблата со исечоци, потоа одете во табулаторот Почетна , кликнете на копчето „ Вметни “ и изберете „ Вредност “ од паѓачкото мени.
  • Обработка на листа на URL-адреси користејќи ја колоната Име на домен

    Тука ќе најдете неколку совети за понатамошна обработка на списокот со URL-адреси, од според моето искуство.

    Групирајте URL-адреси по домен

    1. Кликнете на која било ќелија во колоната Домен .
    2. Подредете ја вашата табела по домен : одете во картичката Податоци и кликнете на копчето A-Z .
    3. Конвертирајте ја вашата табела назад во опсег: кликнете на која било ќелија во табелата, одете на Јазичето Дизајн и кликнете на копчето „ Конвертирај во опсег “.
    4. Одете во картичката Податоци и кликнете на „ Подвкупно " икона.
    5. Во дијалог прозорецот „Subtotal“, изберете ги следните опции: При секоја промена во : „Домен“ користете ја функцијата Број и Додајте потзбир во домен.

  • Кликнете на ОК.
  • Excel создаде преглед на вашите податоци на левата страна на екранот. Има 3 нивоа на прегледот и она што го гледате сега е проширениот приказ или приказот на ниво 3. Кликнете на бројот 2 во горниот лев агол за да ги прикажете конечните податоци по домени, а потоа можете да кликнете на знаците плус и минус (+ / -) восо цел да се прошират / колапсираат деталите за секој домен.

    Означете ја втората и сите последователни URL-адреси во истиот домен

    Во нашиот претходен дел покажавме како да ги групирате URL-адресите по домен. Наместо да групирате, можете брзо да обоите дупликат записи од исто име на домен во вашите URL-адреси.

    За повеќе детали, погледнете како да ги означите дупликатите во Excel.

    Споредете ги вашите URL-адреси од различни табели по колона домен

    Може да имате еден или неколку посебни работни листови на Excel каде што чувате листа на имиња на домени. Вашите табели може да содржат врски со кои не сакате да работите, како спам или домени што веќе сте ги обработиле. Можеби ќе треба да водите листа на домени со интересни врски и да ги избришете сите други.

    На пример, мојата задача е да ги обои црвено сите домени кои се во мојата црна листа за спамери:

    За да не губите многу време, можете да ги споредите вашите табели за да ги избришете непотребните врски. За целосни детали, прочитајте Како да споредите две колони на Excel и да избришете дупликати

    Најдобар начин е да се спојат две табели по име на домен

    Ова е најнапредниот начин и оној што јас лично го претпочитам .

    Да претпоставиме дека имате посебен работен лист на Excel со референтни податоци за секој домен со кој некогаш сте работеле. Оваа работна книга ги задржува контактите на веб-администраторот за размена на врски и датумот кога вашата веб-локација била спомната во овој домен. Може да има и типови/подвидови навеб-страници и посебна колона со вашите коментари како на сликата од екранот подолу.

    Штом ќе добиете нова листа на врски, можете да поклопите две табели по име на домен и да ги споите информациите од табелата за пребарување на домен и вашиот нов лист со URL за само две минути.

    Како што е како резултат ќе го добиете името на доменот, како и категоријата на веб-локацијата и вашите коментари. Ова ќе ви овозможи да ги видите URL-адресите од списокот што треба да ги избришете и оние што треба да ги обработите.

    Соклопете две табели по име на домен и спојувајте податоци:

    1. Преземете и инсталирајте ја најновата верзија на Волшебникот за спојување табели за Microsoft Excel

      Оваа извонредна алатка ќе одговара и спои два работни листови на Excel 2013-2003 во блиц. Можете да користите една или неколку колони како единствен идентификатор, да ги ажурирате постоечките колони во главниот работен лист или да додадете нови од табелата за пребарување. Слободно можете да прочитате повеќе за Волшебникот за спојување табели на нашата веб-локација.

    2. Отворете го списокот со URL-адреси во Excel и извлечете имиња на домени како што е опишано погоре.
    3. Изберете која било ќелија во вашата табела. Потоа одете во табулаторот Ablebits Data и кликнете на иконата Merge Two Tables за да го извршите додатокот.
    4. Притиснете го копчето Следно двапати и изберете го вашиот работен лист со информации за домени како Табела за пребарување .
    5. Штиклирајте го полето за избор веднаш до Домен за да го идентификувате како колона што одговара .
    6. Изберете какви информации за доменотсакате да го додадете во списокот со URL-адреси и кликнете Next.
    7. Притиснете го копчето Заврши . Кога обработката ќе заврши, додатокот ќе ви покаже порака со деталите за спојувањето.

    Само неколку секунди - и на прв поглед ги добивате сите информации за секое име на домен.

    Можете да го преземете Merge Tables Wizard за Excel, да го извршите на вашите податоци и да видите колку може да биде корисно.

    Ако сте заинтересирани да добиете бесплатен додаток за извлекување имиња на домени и подпапки на коренскиот домен (.com, .edu, .us итн.) од списокот со URL, едноставно испратете ни коментар. Кога го правите ова, ве молиме наведете ја вашата верзија на Excel, на пр. Excel 2010 64-битен и внесете ја вашата е-адреса во соодветното поле (не грижете се, нема да се прикаже јавно). Ако имаме пристоен број на гласови, ќе создадеме такви и додатоци и ќе ве известам. Однапред ви благодариме!

    Мајкл Браун е посветен технолошки ентузијаст со страст за поедноставување на сложените процеси користејќи софтверски алатки. Со повеќе од една деценија искуство во технолошката индустрија, тој ги усоврши своите вештини во Microsoft Excel и Outlook, како и Google Sheets и Docs. Блогот на Мајкл е посветен на споделување на своето знаење и експертиза со другите, обезбедувајќи лесни за следење совети и упатства за подобрување на продуктивноста и ефикасноста. Без разлика дали сте искусен професионалец или почетник, блогот на Мајкл нуди вредни сознанија и практични совети за да го извлечете максимумот од овие основни софтверски алатки.