So sánh hai cột và loại bỏ các cột trùng lặp trong Excel

  • Chia Sẻ Cái Này
Michael Brown

Bạn sẽ mất khoảng 10 phút để đọc bài viết này và trong 5 phút tiếp theo (hoặc thậm chí nhanh hơn nếu bạn chọn giải pháp thứ 2 được mô tả trong bài viết), bạn sẽ dễ dàng so sánh hai cột Excel để tìm các cột trùng lặp và loại bỏ hoặc làm nổi bật các bản sao được tìm thấy. Được rồi, quá trình đếm ngược đã bắt đầu!

Excel là một ứng dụng rất mạnh mẽ và thực sự thú vị để tạo và xử lý các mảng dữ liệu lớn. Giờ đây, bạn có nhiều sổ làm việc với một nhóm dữ liệu hoặc có thể chỉ là một bảng lớn, bạn có thể muốn so sánh 2 cột để tìm các mục trùng lặp và sau đó thực hiện điều gì đó với các mục tìm thấy, chẳng hạn như xóa các hàng trùng lặp, sao chép màu hoặc xóa nội dung của tế bào nhân bản. Hai cột này có thể nằm trong một bảng, liền kề hoặc không liền kề hoặc chúng có thể nằm trong 2 trang tính khác nhau hoặc thậm chí là sổ làm việc.

Giả sử bạn có 2 cột có tên người - 5 tên trong cột A và 3 tên ở cột B, và bạn muốn so sánh dữ liệu giữa 2 cột này để tìm trùng lặp. Như bạn hiểu, đây là dữ liệu không có thật chỉ là một ví dụ nhanh; trong các trang tính thực, bạn thường có hàng nghìn và hàng chục nghìn mục nhập.

Biến thể A : Cả hai cột nằm trên một trang tính, trong một bảng duy nhất: Cột A Cột B

Biến thể B : Hai cột nằm trên các trang tính khác nhau: Cột A trong Trang tính 2 Cột A trong Trang tính 3

Tính năng Xóa trùng lặp tích hợp sẵncông cụ có sẵn trong Excel 2016, Excel 2013 và 2010 không thể xử lý tình huống này vì không thể so sánh dữ liệu giữa 2 cột. Hơn nữa, nó chỉ có thể loại bỏ các bản sao, không có lựa chọn nào khác như đánh dấu hoặc tô màu, than ôi :-(.

Hơn nữa, tôi sẽ mô tả 2 cách khả thi để so sánh hai cột Excel cho phép bạn tìm thấy và xóa các mục trùng lặp:

So sánh 2 cột để tìm các mục trùng lặp bằng công thức Excel

Biến thể A: cả hai cột đều nằm trong cùng một danh sách

  1. Trong ô trống đầu tiên, trong ví dụ của chúng tôi, đây là Ô C1, hãy viết công thức sau:

    =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)),"Unique","Duplicate")

    Trong công thức của chúng tôi, A1 là ô đầu tiên của cột đầu tiên chúng tôi muốn sử dụng để so sánh. $B$1 $B$10000 là địa chỉ của ô đầu tiên và ô cuối cùng của cột thứ 2 mà bạn muốn so sánh. Hãy chú ý đến tham chiếu ô tuyệt đối - ký hiệu đô la ($) trước các chữ cái của cột và số hàng. Tôi cố ý sử dụng tham chiếu tuyệt đối để địa chỉ ô không thay đổi khi sao chép công thức.

    Nếu bạn muốn tìm các bản sao trong Cột B, hoán đổi cột để công thức có dạng như sau:

    =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)),"Unique","Duplicate")

    Thay vì " Duy nhất "/" Duplicate ", bạn có thể viết nhãn của riêng mình, ví dụ. " Không tìm thấy "/" Đã tìm thấy ", hoặc chỉ để lại " Duplicate " và nhập "" thay vì "Unique". Trong trường hợp sau, bạn sẽ cócác ô trống bên cạnh các ô không tìm thấy bản sao, tôi tin rằng cách trình bày như vậy sẽ thuận tiện hơn cho việc phân tích dữ liệu.

  2. Bây giờ, hãy sao chép công thức vào tất cả các ô của cột C , cho đến hàng cuối cùng chứa dữ liệu trong cột A. Để thực hiện việc này, hãy đặt con trỏ tới góc dưới bên phải của ô C1 , và con trỏ sẽ chuyển thành dấu thập màu đen, như thể hiện trong hình bên dưới:

    Nhấp và giữ nút chuột trái kéo đường viền xuống dưới chọn tất cả các ô mà bạn muốn sao chép công thức. Khi tất cả các ô cần thiết được chọn, hãy thả nút chuột trái:

    Mẹo: Trong các bảng lớn, sao chép công thức bằng phím tắt sẽ nhanh hơn. Bấm vào ô C1 để chọn nó và nhấn Ctrl + C (để sao chép công thức vào khay nhớ tạm), sau đó nhấn Ctrl + Shift + End (để chọn tất cả các ô không trống trong Cột C), và cuối cùng nhấn Ctrl + V (để dán công thức vào tất cả các ô đã chọn).

  3. Tuyệt vời, tất cả các ô trùng lặp đều được gắn cờ là "Trùng lặp":

Biến thể B: hai cột nằm trên các trang tính khác nhau (sổ làm việc)

  1. Trong ô đầu tiên của cột trống đầu tiên trong Trang tính 2 (trong trường hợp của chúng tôi là cột B), hãy viết công thức:

    =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),"","Duplicate")

    Trong đó Sheet3 là tên của trang tính chứa cột thứ 2 và $A$1:$A$10000 là địa chỉ của ô đầu tiên và ô cuối cùng của cột thứ 2 đó.

  2. Tương tự như Biến thể A.
  3. Chúng tôicó kết quả như sau:

Nhấp để tải xuống bảng tính với các ví dụ trên và công thức so sánh 2 cột để tìm các mục trùng lặp.

Làm việc với các mục trùng lặp được tìm thấy

Hoàn hảo, chúng tôi đã tìm thấy các mục trong cột đầu tiên (Cột A) cũng tồn tại trong cột thứ hai (Cột B). Bây giờ chúng ta cần phải làm gì đó với chúng :)

Sẽ không hiệu quả và mất quá nhiều thời gian để xem qua toàn bộ bảng và xem lại các mục nhập trùng lặp theo cách thủ công. Có nhiều cách tốt hơn.

Chỉ hiển thị các hàng trùng lặp trong Cột A

Nếu các cột của bạn không có tiêu đề, bạn cần thêm chúng. Để thực hiện việc này, hãy đặt con trỏ vào số biểu thị hàng đầu tiên và nó sẽ thay đổi thành mũi tên đen như trong ảnh chụp màn hình:

Nhấp chuột phải vào hàng đã chọn và chọn " Insert " từ menu ngữ cảnh:

Đặt tên cho các cột của bạn, ví dụ: " Tên " và " Sao chép? ". Sau đó chuyển sang tab Dữ liệu và nhấp vào Bộ lọc :

Sau đó, nhấp vào mũi tên nhỏ màu xám bên cạnh " Sao chép? " để mở một danh sách thả xuống, bỏ chọn tất cả các mục khác với mục Duplicate trong danh sách đó và nhấp vào OK :

Vậy là xong, bây giờ bạn chỉ thấy các ô của Cột A có các giá trị trùng lặp trong Cột B. Chỉ có ba ô như vậy trong trang tính thử nghiệm của chúng tôi, như bạn hiểu trong trang tính thực, có thể có nhiều hơn, nhiều hơn nữa:

Trongđể hiển thị lại tất cả các hàng của Cột A, hãy nhấp vào biểu tượng bộ lọc trong Cột B hiện trông giống như một cái phễu có mũi tên nhỏ và chọn "Chọn tất cả". Ngoài ra, bạn có thể thực hiện tương tự thông qua tab Dữ liệu -> Chọn & Lọc -> Xóa , như minh họa trong ảnh chụp màn hình:

Tô màu hoặc đánh dấu các bản sao được tìm thấy

Nếu cờ " Trùng lặp " không đủ cho mục đích của bạn và bạn muốn đánh dấu các ô trùng lặp bằng màu phông chữ hoặc màu tô hoặc theo cách khác…

Sau đó, lọc các ô trùng lặp như đã giải thích ở trên, chọn tất cả các ô đã lọc và nhấn Ctrl + F1 để mở hộp thoại Định dạng ô . Ví dụ: hãy thay đổi màu nền của các hàng trùng lặp thành màu vàng sáng. Tất nhiên, bạn có thể thay đổi màu nền của các ô bằng cách sử dụng tùy chọn Fill color trên tab Home , nhưng ưu điểm của hộp thoại Format Cells là nó cho phép bạn thực hiện tất cả các định dạng. thay đổi cùng một lúc:

Bây giờ, bạn chắc chắn sẽ không bỏ lỡ một ô trùng lặp nào:

Xóa các ô trùng lặp khỏi cột đầu tiên

Lọc bảng của bạn để chỉ các ô trùng lặp hiển thị và chọn tất cả các ô đó.

Nếu 2 cột bạn đang so sánh nằm trên các trang tính khác nhau , tức là trong các bảng riêng biệt, hãy nhấp chuột phải vào dải ô đã chọn và chọn " Xóa hàng " từ menu ngữ cảnh:

Nhấp vào OK khi Excel sẽ yêu cầu bạn xác nhậnrằng bạn thực sự muốn "Xóa toàn bộ hàng trang tính" và sau đó xóa bộ lọc. Như bạn có thể thấy, chỉ còn lại các hàng có giá trị duy nhất:

Nếu 2 cột nằm trên một trang tính , cạnh nhau (liền kề) hoặc không chạm vào nhau (không liền kề) , việc loại bỏ trùng lặp phức tạp hơn một chút. Chúng tôi không thể xóa toàn bộ các hàng chứa các giá trị trùng lặp vì điều này cũng sẽ xóa các ô tương ứng trong cột thứ 2. Vì vậy, để chỉ để lại các mục nhập duy nhất trong Cột A, bạn thực hiện như sau:

  1. Lọc bảng để chỉ hiển thị các ô trùng lặp và chọn tất cả các ô đó. Nhấp chuột phải vào lựa chọn và chọn " Xóa nội dung ":
  2. Xóa bộ lọc.
  3. Chọn tất cả các ô trong Cột A bắt đầu từ ô A1 cho đến ô cuối cùng ô chứa dữ liệu.
  4. Chuyển đến tab Dữ liệu và nhấp vào Sắp xếp từ A đến Z . Trong cửa sổ hộp thoại mở ra, chọn " Tiếp tục với lựa chọn hiện tại " và nhấp vào Sắp xếp :
  5. Xóa cột chứa công thức vì bạn không không cần nó nữa, bây giờ chỉ còn lại "Duy nhất".
  6. Vậy thôi, hiện tại Cột A chỉ chứa dữ liệu duy nhất không tồn tại trong Cột B :

Như bạn thấy, không quá khó để loại bỏ các giá trị trùng lặp giữa hai cột Excel bằng công thức. Mặc dù quá trình viết và sao chép công thức rất tốn thời gian và nhàm chán, nhưng hãy áp dụng vàxóa bộ lọc mỗi khi bạn cần so sánh 2 cột trong trang tính của mình. Một giải pháp khác mà tôi sắp lưu ý với bạn đơn giản hơn nhiều và sẽ chỉ mất một phần nhỏ thời gian mà chúng ta đã dành cho phương pháp đầu tiên. Tôi tin rằng bạn sẽ tìm thấy nhiều thứ thú vị hơn để dành thời gian tiết kiệm;)

So sánh 2 cột Excel để tìm các bản sao bằng cách sử dụng trình hướng dẫn trực quan

Và bây giờ hãy để tôi chỉ cho bạn cách so sánh hai cột cho trùng lặp bằng cách sử dụng các công cụ Dedupe dành cho Excel của chúng tôi.

  1. Mở trang tính (hoặc nhiều trang tính) nơi chứa các cột bạn muốn so sánh.
  2. Chọn bất kỳ ô nào trong cột đầu tiên, chuyển đổi đến tab Dữ liệu Ablebits và nhấp vào nút So sánh các bảng :
  3. bước 1 của trình hướng dẫn, bạn sẽ thấy điều đó cột đầu tiên của bạn đã được chọn, vì vậy chỉ cần nhấp vào Tiếp theo .

    Lưu ý. Nếu muốn so sánh không chỉ 2 cột mà cả 2 bảng, bạn cần chọn toàn bộ bảng đầu tiên trong bước này.

  4. bước 2 của trình hướng dẫn, hãy chọn Cột thứ 2 mà bạn muốn so sánh. Chúng tôi chọn Sheet2 trong cùng một sổ làm việc. Trong hầu hết các trường hợp, trình hướng dẫn thông minh sẽ tự động chọn cột thứ 2, nếu vì lý do nào đó điều này không xảy ra, hãy chọn cột mục tiêu bằng chuột. Nếu bạn đang so sánh toàn bộ bảng, hãy chọn toàn bộ bảng thứ 2.
  5. Chọn để tìm Các giá trị trùng lặp :
  6. Chọn cặp cột mà bạnmuốn so sánh:

    Mẹo. Nếu bạn đang so sánh các bảng, bạn có thể chọn một số cặp cột để so sánh, chẳng hạn như họ và tên. Để biết thêm chi tiết, vui lòng xem Cách xóa các bản trùng lặp khỏi hai bảng tính Excel.

  7. Và cuối cùng, bạn phải quyết định xem mình muốn làm gì với các bản sao được tìm thấy. Bạn có thể chọn xóa các mục nhập trùng lặp, di chuyển hoặc sao chép chúng sang một trang tính khác, thêm cột trạng thái (kết quả sẽ tương tự như giải pháp đầu tiên của chúng tôi với công thức Excel), đánh dấu các mục nhập trùng lặp hoặc chỉ chọn tất cả các ô có giá trị trùng lặp:

    Mẹo. Không chọn xóa các bản sao, đặc biệt nếu bạn đang sử dụng công cụ này lần đầu tiên. Thay vào đó, hãy chọn di chuyển các bản sao chép sang trang tính khác . Thao tác này sẽ loại bỏ các mục trùng lặp khỏi bảng đầu tiên, nhưng cho bạn cơ hội xem lại danh sách các mục nhập được nhận dạng là trùng lặp. Khi so sánh theo một số cột phù hợp trong các bảng lớn, có thể xảy ra trường hợp bạn vô tình quên chọn một cột chính có dữ liệu duy nhất và việc di chuyển các cột trùng lặp sẽ tránh được tình trạng mất dữ liệu không thể khôi phục.

  8. Nhấp vào Hoàn tất và tận hưởng kết quả. Những gì chúng tôi có bây giờ là một bảng sạch đẹp, không có bảng trùng lặp:

Ghi nhớ giải pháp trước đó và cảm nhận sự khác biệt :) Thực sự rất nhanh chóng và dễ dàng để loại bỏ bảng tính của bạn với So sánh hai bảng . Trên thực tế, bạn sẽ mất ít thời gian hơn so với việc đọcbài viết này.

Hiện tại, So sánh các bảng là một phần của Ultimate Suite dành cho Excel của chúng tôi, một bộ sưu tập hơn 70 công cụ chuyên nghiệp bao gồm hơn 300 trường hợp sử dụng. Đồng hồ đang kêu tích tắc, vì vậy hãy nhanh tay tải xuống ngay bây giờ!

Nếu bạn có thắc mắc hoặc điều gì chưa rõ, vui lòng gửi cho tôi một nhận xét và tôi sẽ sẵn lòng giải thích thêm. Cảm ơn bạn đã đọc!

Michael Brown là một người đam mê công nghệ chuyên dụng với niềm đam mê đơn giản hóa các quy trình phức tạp bằng các công cụ phần mềm. Với hơn một thập kỷ kinh nghiệm trong ngành công nghệ, anh ấy đã trau dồi kỹ năng của mình trong Microsoft Excel và Outlook, cũng như Google Trang tính và Tài liệu. Blog của Michael dành để chia sẻ kiến ​​thức và chuyên môn của anh ấy với những người khác, cung cấp các mẹo và hướng dẫn dễ thực hiện để cải thiện năng suất và hiệu quả. Cho dù bạn là một chuyên gia dày dạn kinh nghiệm hay người mới bắt đầu, blog của Michael đều cung cấp những hiểu biết có giá trị và lời khuyên thiết thực để tận dụng tối đa những công cụ phần mềm thiết yếu này.