Excel의 URL 목록에서 도메인 이름 추출

  • 이 공유
Michael Brown

몇 가지 팁과 조언은 Excel 수식을 사용하여 URL 목록에서 도메인 이름을 얻는 데 도움이 됩니다. 공식의 두 가지 변형을 통해 www가 있거나 없는 도메인 이름을 추출할 수 있습니다. URL 프로토콜에 관계없이(http, https, ftp 등 지원). 이 솔루션은 2010년부터 2016년까지 모든 최신 버전의 Excel에서 작동합니다.

귀하의 웹사이트 홍보에 관심이 있거나(저처럼) 고객의 웹을 홍보하는 전문가 수준에서 SEO를 수행하는 경우 - 돈을 벌기 위해 사이트를 운영하는 경우 종종 엄청난 양의 URL 목록을 처리하고 분석해야 합니다. Google Analytics는 트래픽 획득에 대해 보고하고, 웹마스터 도구는 새 링크에 대해 보고하고, 경쟁업체의 웹사이트에 대한 백링크에 대해 보고합니다. 사실 ;) ) 등등.

10에서 100만 링크에 이르는 이러한 목록을 처리하려면 Microsoft Excel이 이상적인 도구입니다. 강력하고 민첩하며 확장 가능하며 Excel 시트에서 직접 고객에게 보고서를 보낼 수 있습니다.

"10에서 1,000,000 사이의 범위인 이유는 무엇입니까?" 당신은 나에게 물어볼 수 있습니다. 10개 미만의 링크를 처리하는 데 도구가 필요하지 않기 때문입니다. 백만 개가 넘는 인바운드 링크가 있는 경우 거의 필요하지 않습니다. 이 경우에는 귀하의 필요에 맞게 특별히 조정된 비즈니스 논리와 함께 귀하를 위해 특별히 개발된 일부 사용자 정의 소프트웨어가 이미 있다고 장담합니다. 그리고 당신의 기사를 정독하는 것은 나일 것입니다.반대 :)

URL 목록을 분석할 때 종종 다음 작업을 수행해야 합니다. 추가 처리를 위해 도메인 이름 가져오기, 도메인별로 URL 그룹화, 이미 처리된 도메인에서 링크 제거, 두 비교 및 ​​병합 도메인 이름 등으로 표를 만들 수 있습니다.

URL 목록에서 도메인 이름을 추출하는 쉬운 5단계

예를 들어,ablebits.com의 백링크 보고서 스니펫을 살펴보겠습니다. Google 웹마스터 도구에서 생성됩니다.

팁: ahrefs.com을 사용하여 자신의 사이트와 경쟁업체의 웹사이트에 대한 새 링크를 시기 적절하게 찾는 것이 좋습니다.

  1. " 도메인<추가 13>' 열을 표 끝에 추가합니다.

    CSV 파일에서 데이터를 내보냈기 때문에 Excel에서 데이터가 간단한 범위에 있습니다. 작업하기가 훨씬 더 편리하기 때문에 Ctrl + T를 눌러 Excel 표로 변환하십시오.

  2. " 도메인 " 열(B2)의 첫 번째 셀에 다음 수식을 입력하여 도메인 이름 추출:
    • 도메인 추출 www와 함께 URL에 있는 경우:

=MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)

  • www를 생략합니다. 순수한 도메인 이름을 얻습니다.
  • =IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7,FIND("/",A2,9)-FIND(":",A2,4)-7))

    두 번째 수식은 너무 길고 복잡해 보일 수 있지만 정말 긴 수식을 보지 못한 경우에만 가능합니다. Microsoft가 새 버전의 Excel에서 수식의 최대 길이를 최대 8192자로 늘린 것은 이유가 없습니다. :)

    좋은 점은추가 열 또는 VBA 매크로. 실제로 VBA 매크로를 사용하여 Excel 작업을 자동화하는 것은 보기보다 어렵지 않습니다. VBA 매크로를 만들고 사용하는 방법이라는 아주 좋은 기사를 참조하십시오. 하지만 이 특별한 경우에는 실제로 필요하지 않으며 수식을 사용하는 것이 더 빠르고 쉽습니다.

    참고: 기술적으로 www 는 3단계 도메인이지만 웹사이트 www. 기본 도메인의 별칭일 뿐입니다. 인터넷 초창기에는 전화나 라디오 광고에서 "double u, double u, double u 우리의 멋진 이름 dot com"이라고 말할 수 있었고 모든 사람들이 당신을 찾을 위치를 완벽하게 이해하고 기억했습니다. 멋진 이름은 www.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com과 같았습니다 :)

    3단계의 다른 모든 도메인 이름을 그대로 두어야 합니다. "co.uk" 도메인 또는 blogspot.com 등의 다른 계정에서.

  • 완벽한 테이블이 있으므로 Excel은 자동으로 열의 모든 셀에 수식을 복사합니다.

    완료! 추출된 도메인 이름이 있는 열이 있습니다.

    다음 섹션에서는 도메인 열을 기반으로 URL 목록을 처리하는 방법에 대해 알아봅니다.

    팁: 나중에 도메인 이름을 수동으로 편집해야 하거나 결과를 다른 Excel 워크시트로 복사하고 수식 결과를 값으로 바꿉니다. 할 것이를 위해 다음 단계를 진행합니다.

    • 도메인 열의 아무 셀이나 클릭하고 Ctrl+Space를 눌러 해당 열의 모든 셀을 선택합니다.
    • Ctrl + C를 눌러 데이터를 클립보드에 복사한 다음 탭으로 이동하여 " 붙여넣기 " 버튼을 클릭하고 드롭다운 메뉴에서 " "을 선택합니다.
  • 도메인 이름 열을 사용하여 URL 목록 처리

    여기에서 URL 목록의 추가 처리에 대한 몇 가지 팁을 찾을 수 있습니다. 내 경험상.

    도메인별로 URL 그룹화

    1. 도메인 열의 셀을 클릭합니다.
    2. 도메인별로 표를 정렬합니다. : 데이터 탭으로 이동하여 A-Z 버튼을 클릭합니다.
    3. 표를 다시 범위로 변환: 표의 아무 셀이나 클릭하고 디자인 탭에서 " 범위로 변환 " 버튼을 클릭합니다.
    4. 데이터 탭으로 이동하여 " 소계 " 아이콘.
    5. "소계" 대화 상자에서 다음 옵션을 선택합니다. 변경할 때마다 : "도메인" 함수 사용 개수 및 도메인에 소계를 추가합니다.

  • 확인을 클릭합니다.
  • Excel에서 화면 왼쪽에 데이터 개요를 만들었습니다. 개요에는 3개 수준이 있으며 지금 표시되는 것은 확장된 보기 또는 수준 3 보기입니다. 왼쪽 상단의 숫자 2를 클릭하여 도메인별 최종 데이터를 표시한 다음 더하기 및 빼기 부호(+ / -)를 클릭할 수 있습니다.각 도메인의 세부 정보를 확장/축소합니다.

    동일한 도메인의 두 번째 및 모든 후속 URL 강조 표시

    이전 섹션에서는 URL을 도메인별로 그룹화하는 방법을 보여 주었습니다. 그룹화하는 대신 URL에서 동일한 도메인 이름의 중복 항목에 빠르게 색상을 지정할 수 있습니다.

    자세한 내용은 Excel에서 중복 항목을 강조 표시하는 방법을 참조하세요.

    도메인 열별로 다른 테이블의 URL 비교

    도메인 이름 목록을 보관하는 별도의 Excel 워크시트가 하나 이상 있을 수 있습니다. 테이블에는 스팸 또는 이미 처리한 도메인과 같이 작업하고 싶지 않은 링크가 포함될 수 있습니다. 흥미로운 링크가 있는 도메인 목록을 유지하고 다른 모든 링크를 삭제해야 할 수도 있습니다.

    예를 들어, 제 작업은 스패머 블랙리스트에 있는 모든 도메인을 빨간색으로 표시하는 것입니다:

    많은 시간을 낭비하지 않으려면 테이블을 비교하여 불필요한 링크를 삭제할 수 있습니다. 자세한 내용은 두 개의 Excel 열을 비교하고 중복 항목을 삭제하는 방법을 참조하세요

    가장 좋은 방법은 도메인 이름으로 두 개의 테이블을 병합하는 것입니다

    이것은 가장 진보된 방법이며 개인적으로 선호하는 방법입니다 .

    작업한 각 도메인에 대한 참조 데이터가 포함된 별도의 Excel 워크시트가 있다고 가정합니다. 이 워크북은 링크 교환을 위한 웹마스터 연락처와 이 도메인에서 귀하의 웹사이트가 언급된 날짜를 보관합니다. 의 유형/하위 유형도 있을 수 있습니다.웹사이트 및 아래 스크린샷과 같은 의견이 포함된 별도의 열입니다.

    새 링크 목록을 받자마자 도메인 이름별로 두 개의 테이블을 일치시키고 도메인 조회 테이블의 정보와 새 URL 시트를 단 2분 만에 병합할 수 있습니다.

    다음과 같이 그 결과 도메인 이름과 웹사이트 카테고리 및 댓글이 표시됩니다. 이렇게 하면 목록에서 삭제해야 하는 URL과 처리해야 하는 URL을 볼 수 있습니다.

    도메인 이름으로 두 테이블 일치 및 데이터 병합:

    1. Microsoft Excel용 표 병합 마법사의 최신 버전을 다운로드하여 설치합니다.

      이 유용한 도구는 두 개의 Excel 2013-2003 워크시트를 순식간에 일치시키고 병합합니다. 하나 이상의 열을 고유 식별자로 사용하거나 마스터 워크시트의 기존 열을 업데이트하거나 조회 테이블에서 새 열을 추가할 수 있습니다. 당사 웹사이트에서 테이블 병합 마법사에 대해 자세히 읽어보십시오.

    2. Excel에서 URL 목록을 열고 위에서 설명한 대로 도메인 이름을 추출합니다.
    3. 테이블에서 셀을 선택합니다. 그런 다음 Ablebits Data 탭으로 이동하고 Merge Two Tables 아이콘을 클릭하여 추가 기능을 실행합니다.
    4. 다음 버튼을 두 번 누르고 도메인 정보가 있는 워크시트를 조회표 로 선택합니다.
    5. 도메인 옆의 확인란을 선택하여 일치하는 열 로 식별합니다.
    6. 도메인에 대한 정보 선택URL 목록에 추가하고 다음을 클릭합니다.
    7. 마침 버튼을 누르세요. 처리가 끝나면 추가 기능에서 병합 세부 정보가 포함된 메시지를 표시합니다.

    몇 초만 있으면 각 도메인 이름에 대한 모든 정보를 한 눈에 볼 수 있습니다.

    Merge Tables Wizard for Excel을 다운로드하여 데이터에서 실행하고 얼마나 유용한지 확인할 수 있습니다.

    도메인 이름 및 URL 목록에서 루트 도메인의 하위 폴더(.com, .edu, .us 등)를 찾으려면 댓글을 남겨주세요. 이때 Excel 버전을 지정하십시오. Excel 2010 64비트에서 해당 필드에 이메일 주소를 입력합니다(공개적으로 표시되지 않으므로 걱정하지 마세요). 적절한 수의 투표가 있으면 추가 기능을 만들고 알려 드리겠습니다. 미리 감사드립니다!

    Michael Brown은 소프트웨어 도구를 사용하여 복잡한 프로세스를 단순화하려는 열정을 가진 열성적인 기술 애호가입니다. 기술 산업에서 10년 이상의 경험을 쌓은 그는 Microsoft Excel 및 Outlook은 물론 Google 스프레드시트 및 문서 도구에 대한 기술을 연마했습니다. Michael의 블로그는 자신의 지식과 전문 지식을 다른 사람과 공유하는 데 전념하며 따라하기 쉬운 팁과 생산성 및 효율성 향상을 위한 자습서를 제공합니다. 노련한 전문가이든 초보자이든 Michael의 블로그는 이러한 필수 소프트웨어 도구를 최대한 활용하기 위한 귀중한 통찰력과 실용적인 조언을 제공합니다.