Trích xuất tên miền từ danh sách URL trong Excel

  • Chia Sẻ Cái Này
Michael Brown

Một số mẹo và lời khuyên sẽ giúp bạn lấy tên miền từ danh sách URL bằng cách sử dụng công thức Excel. Hai biến thể của công thức cho phép bạn trích xuất các tên miền có và không có www. bất kể giao thức URL (http, https, ftp, v.v. đều được hỗ trợ). Giải pháp hoạt động trong tất cả các phiên bản Excel hiện đại, từ 2010 đến 2016.

Nếu bạn quan tâm đến việc quảng bá trang web của mình (như tôi) hoặc làm SEO ở cấp độ chuyên nghiệp thì quảng cáo trang web của khách hàng -các trang web kiếm tiền, bạn thường phải xử lý và phân tích danh sách URL khổng lồ: Google Analytics báo cáo về lưu lượng truy cập, Công cụ quản trị trang web báo cáo về các liên kết mới, báo cáo về các liên kết ngược đến trang web của đối thủ cạnh tranh của bạn (chứa rất nhiều điều thú vị sự kiện ;) ), v.v., v.v.

Để xử lý các danh sách như vậy, từ mười đến một triệu liên kết, Microsoft Excel là một công cụ lý tưởng. Nó mạnh mẽ, nhanh nhẹn, có thể mở rộng và cho phép bạn gửi báo cáo cho khách hàng của mình trực tiếp từ trang tính Excel.

"Tại sao lại là phạm vi này, từ 10 đến 1.000.000?" bạn có thể hỏi tôi. Bởi vì bạn chắc chắn không cần một công cụ để xử lý ít hơn 10 liên kết; và bạn sẽ hầu như không cần bất kỳ thứ gì nếu bạn có hơn một triệu liên kết đến. Tôi cá rằng trong trường hợp này, bạn đã có sẵn một số phần mềm tùy chỉnh được phát triển riêng cho mình, với logic nghiệp vụ được thiết kế riêng cho nhu cầu của bạn. Và chính tôi là người sẽ đọc các bài viết của bạn chứ không phảingược lại :)

Khi phân tích danh sách URL, bạn thường cần thực hiện các tác vụ sau: lấy tên miền để xử lý thêm, nhóm URL theo miền, xóa liên kết khỏi miền đã xử lý, so sánh và hợp nhất hai miền bảng theo tên miền, v.v.

5 bước đơn giản để trích xuất tên miền từ danh sách URL

Ví dụ: hãy lấy một đoạn báo cáo liên kết ngược củaablebits.com được tạo bởi Công cụ quản trị trang web của Google.

Mẹo: Tôi khuyên bạn nên sử dụng ahrefs.com để phát hiện kịp thời các liên kết mới đến trang web của riêng bạn và trang web của đối thủ cạnh tranh.

  1. Thêm " Miền " vào cuối bảng của bạn.

    Chúng tôi đã xuất dữ liệu từ tệp CSV , đó là lý do tại sao về mặt Excel, dữ liệu của chúng tôi nằm trong một phạm vi đơn giản. Nhấn Ctrl + T để chuyển đổi chúng thành bảng Excel vì nó thuận tiện hơn nhiều khi làm việc.

  2. Trong ô đầu tiên của cột " Miền " (B2), hãy nhập công thức để trích xuất tên miền:
    • Trích xuất tên miền với www. nếu nó có trong một URL:

=MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3)

  • Bỏ qua www. và nhận một tên miền thuần túy:
  • =IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7,FIND("/",A2,9)-FIND(":",A2,4)-7))

    Công thức thứ hai có vẻ quá dài và phức tạp, nhưng chỉ khi bạn không thấy các công thức thực sự dài. Không phải vô cớ mà Microsoft đã tăng độ dài tối đa của công thức lên tới 8192 ký tự trong các phiên bản Excel mới :)

    Điều tốt là chúng ta không phải sử dụng một trong haicột bổ sung hoặc macro VBA. Trên thực tế, việc sử dụng macro VBA để tự động hóa các tác vụ Excel của bạn không quá khó như vẻ ngoài của nó, hãy xem một bài viết rất hay - cách tạo và sử dụng macro VBA. Tuy nhiên, trong trường hợp cụ thể này, chúng tôi không thực sự cần đến chúng, sẽ nhanh hơn và dễ dàng hơn khi sử dụng công thức.

    Lưu ý: Về mặt kỹ thuật, www là miền cấp 3, mặc dù với mọi thứ bình thường các trang web www. chỉ là bí danh của miền chính. Trong những ngày đầu của Internet, bạn có thể nói "double u, double u, double u cái tên thú vị của chúng tôi là dot com" trên điện thoại hoặc trong một quảng cáo trên đài phát thanh, và tất cả mọi người đều hiểu rõ và nhớ nơi để tìm bạn, tất nhiên là trừ khi tên hay ho của bạn đại loại như www.llanfairpwllgwyngyllgogerychwyrndrobwyll-llantysiliogogogoch.com :)

    Bạn cần bỏ tất cả các tên miền cấp 3 khác, nếu không bạn sẽ làm rối các liên kết từ các trang web khác nhau, ví dụ: với tên miền "co.uk" hoặc từ các tài khoản khác nhau trên blogspot.com, v.v.

  • Vì chúng ta có một bảng chính thức nên Excel sẽ tự động sao chép công thức trên tất cả các ô trong cột.

    Xong! Chúng tôi có một cột với các tên miền được trích xuất.

    Trong phần tiếp theo, bạn sẽ tìm hiểu cách có thể xử lý danh sách URL dựa trên cột Miền.

    Mẹo: Nếu sau này bạn có thể cần chỉnh sửa tên miền theo cách thủ công hoặc sao chép kết quả sang một trang tính Excel khác, thay thế kết quả công thức bằng các giá trị. Làmnày, hãy tiến hành theo các bước sau:

    • Nhấp vào bất kỳ ô nào trong cột Miền và nhấn Ctrl+Space để chọn tất cả các ô trong cột đó.
    • Nhấn Ctrl + C để sao chép dữ liệu vào Clipboard, sau đó chuyển đến tab Trang chủ , nhấp vào nút " Dán " và chọn " Giá trị " từ trình đơn thả xuống.
  • Xử lý danh sách URL bằng cột Tên miền

    Tại đây, bạn sẽ tìm thấy một số mẹo về cách xử lý thêm danh sách URL, từ theo kinh nghiệm của riêng tôi.

    Nhóm các URL theo miền

    1. Nhấp vào bất kỳ ô nào trong cột Miền .
    2. Sắp xếp bảng của bạn theo Miền : chuyển đến tab Dữ liệu và nhấp vào nút A-Z .
    3. Chuyển đổi bảng của bạn trở lại một phạm vi: nhấp vào bất kỳ ô nào trong bảng, chuyển đến tab Thiết kế và nhấp vào nút " Chuyển đổi sang phạm vi ".
    4. Chuyển đến tab Dữ liệu và nhấp vào " Tổng phụ ".
    5. Trong hộp thoại "Tổng phụ", hãy chọn các tùy chọn sau: Tại mỗi thay đổi trong : "Miền" sử dụng chức năng Đếm và Thêm tổng phụ vào Tên miền.

  • Nhấp vào OK.
  • Excel đã tạo đường viền cho dữ liệu của bạn ở bên trái màn hình. Có 3 cấp độ của đường viền và những gì bạn thấy bây giờ là dạng xem mở rộng hoặc dạng xem cấp 3. Nhấp vào số 2 ở góc trên bên trái để hiển thị dữ liệu cuối cùng theo tên miền, sau đó bạn có thể nhấp vào dấu cộng và dấu trừ (+ / -) trongđể mở rộng/thu gọn chi tiết cho từng miền.

    Đánh dấu URL thứ hai và tất cả các URL tiếp theo trong cùng một miền

    Trong phần trước, chúng tôi đã chỉ ra cách nhóm các URL theo miền. Thay vì nhóm, bạn có thể nhanh chóng tô màu các mục trùng lặp có cùng tên miền trong URL của mình.

    Để biết thêm chi tiết, vui lòng xem cách đánh dấu các mục trùng lặp trong Excel.

    So sánh URL của bạn từ các bảng khác nhau theo cột tên miền

    Bạn có thể có một hoặc một số trang tính Excel riêng biệt nơi bạn lưu giữ danh sách tên miền. Các bảng của bạn có thể chứa các liên kết mà bạn không muốn làm việc, chẳng hạn như thư rác hoặc các miền mà bạn đã xử lý. Bạn cũng có thể cần giữ một danh sách các miền có liên kết thú vị và xóa tất cả các miền khác.

    Ví dụ: nhiệm vụ của tôi là tô màu đỏ cho tất cả các miền nằm trong danh sách đen người gửi thư rác của tôi:

    Để không lãng phí nhiều thời gian, bạn có thể so sánh các bảng của mình để xóa các liên kết không cần thiết. Để biết đầy đủ chi tiết, vui lòng đọc Cách so sánh hai cột Excel và xóa các cột trùng lặp

    Cách tốt nhất là hợp nhất hai bảng theo tên miền

    Đây là cách tiên tiến nhất và là cách cá nhân tôi thích hơn .

    Giả sử bạn có một trang tính Excel riêng với dữ liệu tham chiếu cho từng miền mà bạn từng làm việc. Sổ làm việc này lưu giữ địa chỉ liên hệ của quản trị viên web để trao đổi liên kết và ngày trang web của bạn được đề cập trong miền này. Cũng có thể có các loại/loại phụ củacác trang web và một cột riêng biệt với nhận xét của bạn như trên ảnh chụp màn hình bên dưới.

    Ngay khi nhận được danh sách liên kết mới, bạn có thể khớp hai bảng theo tên miền và hợp nhất thông tin từ bảng tra cứu miền và trang tính URL mới của bạn chỉ trong hai phút.

    Như kết quả bạn sẽ nhận được tên miền cũng như danh mục trang web và nhận xét của bạn. Thao tác này sẽ cho phép bạn xem các URL trong danh sách bạn cần xóa và những URL bạn cần xử lý.

    Ghép hai bảng theo tên miền và hợp nhất dữ liệu:

    1. Tải xuống và cài đặt phiên bản mới nhất của Trình hướng dẫn Hợp nhất Bảng cho Microsoft Excel

      Công cụ tiện lợi này sẽ khớp và hợp nhất hai trang tính Excel 2013-2003 trong nháy mắt. Bạn có thể sử dụng một hoặc một số cột làm mã định danh duy nhất, cập nhật các cột hiện có trong trang tính chính hoặc thêm cột mới từ bảng tra cứu. Vui lòng đọc thêm về Trình hướng dẫn Hợp nhất Bảng trên trang web của chúng tôi.

    2. Mở danh sách URL của bạn trong Excel và trích xuất các tên miền như được mô tả ở trên.
    3. Chọn bất kỳ ô nào trong bảng của bạn. Sau đó chuyển đến tab Dữ liệu Ablebits và nhấp vào biểu tượng Hợp nhất hai bảng để chạy bổ trợ.
    4. Nhấn nút Tiếp theo hai lần và chọn trang tính của bạn với thông tin tên miền dưới dạng Bảng tra cứu .
    5. Đánh dấu vào hộp kiểm bên cạnh Miền để xác định miền đó là cột phù hợp .
    6. Chọn thông tin nào về miềnbạn muốn thêm vào danh sách URL và nhấp vào Tiếp theo.
    7. Nhấn nút Hoàn tất . Khi quá trình xử lý kết thúc, phần bổ trợ sẽ hiển thị cho bạn một thông báo có chi tiết về quá trình hợp nhất.

    Chỉ vài giây - và bạn có được tất cả thông tin về từng tên miền trong nháy mắt.

    Bạn có thể tải xuống Trình hướng dẫn hợp nhất bảng cho Excel, chạy nó trên dữ liệu của bạn và xem nó có thể hữu ích như thế nào.

    Nếu bạn muốn nhận một phần bổ trợ miễn phí để trích xuất tên miền và thư mục con của tên miền gốc (.com, .edu, .us, v.v.) khỏi danh sách URL, chỉ cần gửi nhận xét cho chúng tôi. Khi thực hiện việc này, vui lòng chỉ định phiên bản Excel của bạn, ví dụ: Excel 2010 64-bit và nhập địa chỉ email của bạn vào trường tương ứng (đừng lo lắng, nó sẽ không được hiển thị công khai). Nếu chúng tôi có số lượng phiếu bầu kha khá, chúng tôi sẽ tạo bổ trợ đó và tôi sẽ cho bạn biết. Cảm ơn bạn trước!

    Michael Brown là một người đam mê công nghệ chuyên dụng với niềm đam mê đơn giản hóa các quy trình phức tạp bằng các công cụ phần mềm. Với hơn một thập kỷ kinh nghiệm trong ngành công nghệ, anh ấy đã trau dồi kỹ năng của mình trong Microsoft Excel và Outlook, cũng như Google Trang tính và Tài liệu. Blog của Michael dành để chia sẻ kiến ​​thức và chuyên môn của anh ấy với những người khác, cung cấp các mẹo và hướng dẫn dễ thực hiện để cải thiện năng suất và hiệu quả. Cho dù bạn là một chuyên gia dày dạn kinh nghiệm hay người mới bắt đầu, blog của Michael đều cung cấp những hiểu biết có giá trị và lời khuyên thiết thực để tận dụng tối đa những công cụ phần mềm thiết yếu này.