Сравняване на две колони и премахване на дубликати в Excel

  • Споделя Това
Michael Brown

Прочитането на тази статия ще ви отнеме около 10 минути, а през следващите 5 минути (или дори по-бързо, ако изберете второто решение, описано в статията) лесно ще сравнявате две колони на Excel за дублирания и ще премахвате или подчертавате намерените дублирания. Добре, обратното броене започна!

Excel е много мощно и наистина страхотно приложение за създаване и обработка на големи масиви от данни. Сега, когато имате много работни книги с набор от данни или може би само една огромна таблица, може да искате да сравните 2 колони за дублиращи се данни и след това да направите нещо с намерените записи, например да изтриете дублиращи се редове, да оцветите дублиращите се клетки или да изчистите съдържанието на дублиращите се клетки. Тези две колони могат да бъдатразположени в една таблица, съседно или несъседно, или могат да се намират в 2 различни работни листа или дори работни книги.

Да речем, че имате 2 колони с имена на хора - 5 имена в колона А и 3 имена в колона Б, и искате да сравните данните между тези две колони, за да откриете дублиращи се. Както разбирате, това са фиктивни данни само за бърз пример; в реалните работни листове обикновено има хиляди и десетки хиляди записи.

Вариант А : Двете колони са разположени на един лист в една таблица: Колона А и Колона B

Вариант B : Две колони са разположени на различни листове: Колона А в лист2 и Колона А в лист3

Вграденият инструмент за премахване на дубликати, наличен в Excel 2016, Excel 2013 и 2010, не може да се справи с този сценарий, тъй като не може да сравнява данни между 2 колони. Освен това той може само да премахва дубликати, без да има друг избор, като например подчертаване или оцветяване, уви :-(.

По-нататък ще опиша два възможни начина за сравняване на две колони на Excel, които ви позволяват да откривате и премахвате дублиращи се записи:

    Сравняване на 2 колони за намиране на дубликати с помощта на формулите на Excel

    Вариант А: и двете колони са в един и същи списък

    1. В първата празна клетка, в нашия пример това е клетка C1, запишете следната формула:

      =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)), "Уникален", "Дубликат")

      В нашата формула, A1 е първата клетка от първата колона, която искаме да използваме за сравнение. $B$1 и $B$10000 Това са адресите на първата и последната клетка от втората колона, с които искате да сравните.Обърнете внимание на абсолютната препратка към клетките - знаците за долар ($) пред буквите на колоните и номерата на редовете. Използвам абсолютната препратка нарочно, за да останат адресите на клетките непроменени при копиране на формулата.

      Ако искате да намерите дублиращи се данни в колона В, разменете имената на колоните, така че формулата да изглежда по следния начин:

      =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)), "Уникален", "Дубликат")

      Вместо " Уникален "/" Дублиране на " можете да напишете свои собствени етикети, например " Не е намерен "/" Намерени ", или да оставите само " Дублиране на " и въведете "" вместо "Unique". Във втория случай ще имате празни клетки до клетките, за които не са открити дубликати, като смятам, че такова представяне е по-удобно за анализ на данните.

    2. Сега нека копираме формулата във всички клетки на колона C , до последния ред, който съдържа данни в колона А. За да направите това, поставете курсора в долния десен ъгъл на клетката C1 , а курсорът ще се промени на черен кръст, както е показано на изображението по-долу:

      Щракнете върху левия бутон на мишката и като го държите натиснат, плъзнете границата надолу, като изберете всички клетки, в които искате да копирате формулата. Когато всички необходими клетки са избрани, освободете левия бутон на мишката:

      Съвет: В големи таблици е по-бързо да копирате формулата, като използвате бързи клавиши. Щракнете върху клетката C1 за да я изберете и натиснете Ctrl + C (за да копирате формулата в клипборда), след това натиснете Ctrl + Shift + End (за да изберете всички непразни клетки в колона C) и накрая натиснете Ctrl + V (за да поставите формулата във всички избрани клетки).

    3. Страхотно, всички дублирани клетки се маркират като "Дубликат":

    Вариант Б: двете колони са в различни работни листове (работни книги)

    1. В първата клетка на първата празна колона в лист 2 (колона B в нашия случай) запишете формулата:

      =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),"", "Duplicate")

      Къде: Лист3 е името на листа, на който се намира втората колона, и $A$1:$A$10000 са адресите на първата и последната клетка от тази втора колона.

    2. Подобно на Вариант А.
    3. Получаваме следния резултат:

    Щракнете, за да изтеглите работния лист с горните примери и формулата за сравняване на 2 колони за откриване на дубликати.

    Работа с намерени дубликати

    Перфектно, намерихме записите в първата колона (колона А), които съществуват и във втората колона (колона Б). Сега трябва да направим нещо с тях :)

    Би било доста неефективно и би отнело твърде много време да се преглежда цялата таблица и да се преглеждат ръчно дублиращите се записи. Има много по-добри начини.

    Показване само на дублирани редове в колона A

    Ако колоните ви нямат заглавия, трябва да ги добавите. За да направите това, поставете курсора върху числото, обозначаващо първия ред, и то ще се промени на черна стрелка както е показано на снимката на екрана:

    Кликнете с десния бутон върху избрания ред и изберете " Вмъкване на " от контекстното меню:

    Дайте имена на колоните си, например " Име " и " Дублиране? ". След това преминете към Данни и щракнете върху Филтър :

    След това щракнете върху малката сива стрелка до " Дублиране? ", за да отворите падащ списък, премахнете отметката от всички елементи, различни от Дублиране, и щракнете върху ОК :

    Това е всичко, сега виждате само онези клетки от колона А, които имат дублирани стойности в колона Б. В нашия тестов работен лист има само три такива клетки, както разбирате, в реалните листове те вероятно са повече, много повече:

    За да се покажат отново всички редове от колона А, щракнете върху символа за филтър в колона В, който сега прилича на фуния с малка стрелка. и поставете отметка на "Избери всички". Алтернативно можете да направите същото чрез Раздел Данни -> Изберете & Филтър -> Clear , както е показано на снимката на екрана:

    Оцветяване или подчертаване на намерени дубликати

    Ако " Дублиране на " не е достатъчен за вашите цели и искате да маркирате дублираните клетки с цвят на шрифта, цвят на запълване или по някакъв друг начин...

    След това филтрирайте дубликатите, както е обяснено по-горе, изберете всички филтрирани клетки и натиснете Ctrl + F1, за да отворите Форматиране на клетките Като пример нека променим цвета на фона на дублираните редове на ярко жълт. Разбира се, можете да промените цвета на фона на клетките, като използвате Цвят на запълване опция в Начало но предимството на диалоговия прозорец Format Cells (Форматиране на клетките) е, че ви позволява да правите всички промени във форматирането едновременно:

    Сега със сигурност няма да пропуснете нито една дублирана клетка:

    Премахване на дубликати от първата колона

    Филтрирайте таблицата така, че да се показват само клетките с дублирани стойности, и изберете всички тези клетки.

    Ако 2 колони, които сравнявате, са разположени в различни работни листове , т.е. в отделни таблици, щракнете с десния бутон на мишката върху избрания диапазон и изберете " Изтриване на ред " от контекстното меню:

    Кликнете върху ОК когато Excel ще поиска от вас да потвърдите, че наистина искате да "Изтриете целия ред на листа" и след това да изтриете филтъра. Както можете да видите, остават само редовете с уникални стойности:

    Ако 2 колони са разположени в един работен лист , съседни един на друг (съседни) или не се допират един до друг (несъседни), премахването на дубликатите е малко по-сложно. Не можем да изтрием цели редове, които съдържат дублиращи се стойности, защото това би довело до изтриване и на съответните клетки във 2-ра колона. Така че, за да оставите само уникални записи в колона А, правите следното:

    1. Филтрирайте таблицата така, че да се показват само дублираните клетки, и изберете всички тези клетки. Щракнете с десния бутон на мишката върху селекцията и изберете " Ясно съдържание ":
    2. Изчистете филтъра.
    3. Изберете всички клетки в колона A, като започнете от клетка A1 до последната клетка, която съдържа данни.
    4. Отидете в Данни и щракнете върху Сортиране от A до Z . В отворения диалогов прозорец изберете " Продължаване на текущия избор " и щракнете върху Сортиране :
    5. Изтрийте колоната, съдържаща формулата, тъй като тя вече не ви е необходима, в нея вече са останали само "Uniques".
    6. Това е всичко, сега колона A съдържа само уникални данни, които не съществуват в колона B :

    Както виждате, не е толкова трудно да премахнете дублиранията между две колони в Excel с помощта на формули. Въпреки че е много трудоемък и скучен процес да пишете и копирате формулата, да прилагате и изчиствате филтъра всеки път, когато трябва да сравните 2 колони в работните си листове. Другото решение, което ще представя на вашето внимание, е много по-просто и ще отнеме само част от времето, което сме прекарали впърви метод. Вярвам, че ще намерите по-приятни неща, за които да прекарате спестеното време ;)

    Сравняване на 2 колони на Excel за дубликати с помощта на визуален съветник

    А сега ще ви покажа как да сравните две колони за дублирания с помощта на нашите инструменти Dedupe за Excel.

    1. Отворете работния лист (или работните листове), в който се намират колоните, които искате да сравните.
    2. Изберете която и да е клетка в колона 1, преминете към Данни от Ablebits и щракнете върху Сравняване на таблици бутон:
    3. На стъпка 1 на съветника, ще видите, че първата колона вече е избрана, така че просто щракнете върху Следваща .

      Забележка: Ако искате да сравните не само 2 колони, но и 2 таблици, трябва да изберете цялата първа таблица в тази стъпка.

    4. На стъпка 2 на съветника, изберете втората колона, с която искате да сравнявате. Лист2 в една и съща работна книга. В повечето случаи интелигентният съветник избира автоматично 2-та колона, ако по някаква причина това не се случи, изберете целевата колона с помощта на мишката. Ако сравнявате цели таблици, изберете цялата 2-ра таблица.
    5. Изберете да намерите Дублиращи се стойности :
    6. Изберете двойката колони, които искате да сравните:

      Съвет: Ако сравнявате таблици, можете да изберете няколко двойки колони за сравнение, например име и фамилия. За повече подробности вижте Как да премахнем дубликати от две електронни таблици на Excel.

    7. И накрая, трябва да решите какво искате да направите с намерените дубликати. Можете да изберете да изтриете дублираните записи, да ги преместите или копирате в друг работен лист, да добавите колона със статус (резултатът ще бъде подобен на първото ни решение с формули на Excel), да подчертаете дубликатите или просто да изберете всички клетки с дублирани стойности:

      Съвет: Не избирайте да изтривате дубликати, особено ако използвате инструмента за първи път. Вместо това изберете да преместване на дубликати към друг работен лист . Това ще премахне дубликатите от първата таблица, но ще ви даде възможност да прегледате списъка със записи, разпознати като дубликати. При сравняване по няколко съвпадащи колони в големи таблици може да се случи така, че случайно да забравите да изберете ключова колона с уникални данни, а преместването на дубликатите ще предотврати безвъзвратна загуба на данни.

    8. Кликнете върху Завършете и се насладете на резултата. Сега имаме хубава, чиста таблица без дубликати:

    Спомнете си предишното решение и усетете разликата :) Наистина е бързо и лесно да извадите работните си листове с Сравняване на две таблици Всъщност това ще ви отнеме по-малко време, отколкото сте отделили за прочитането на тази статия.

    В момента, Сравняване на таблици е част от нашия Ultimate Suite за Excel - колекция от над 70 професионални инструмента, които обхващат над 300 случая на употреба. Часовникът тиктака, така че побързайте и го изтеглете още сега!

    Ако имате въпроси или нещо е останало неясно, моля, напишете ми коментар и с удоволствие ще ви разясня допълнително. Благодаря ви за четенето!

    Майкъл Браун е отдаден технологичен ентусиаст със страст към опростяване на сложни процеси с помощта на софтуерни инструменти. С повече от десетилетие опит в технологичната индустрия, той е усъвършенствал уменията си в Microsoft Excel и Outlook, както и в Google Sheets и Docs. Блогът на Майкъл е посветен на споделянето на неговите знания и опит с други, предоставяйки лесни за следване съвети и уроци за подобряване на продуктивността и ефективността. Независимо дали сте опитен професионалист или начинаещ, блогът на Michael предлага ценни прозрения и практически съвети за извличане на максимума от тези основни софтуерни инструменти.