Paghambingin ang dalawang column at alisin ang mga duplicate sa Excel

  • Ibahagi Ito
Michael Brown

Aabutin ka ng humigit-kumulang 10 minuto upang basahin ang artikulong ito at sa susunod na 5 minuto (o mas mabilis pa kung pipiliin mo ang pangalawang solusyon na inilarawan sa artikulo) madali mong ikumpara ang dalawang column ng Excel para sa mga duplicate at alisin o i-highlight ang mga nahanap na dupe. Okay, nagsimula na ang countdown!

Ang Excel ay isang napakalakas at talagang cool na application para sa paggawa at pagproseso ng malalaking array ng data. Ngayong marami ka nang workbook na may pool ng data, o maaaring isang malaking table lang, maaaring gusto mong paghambingin ang 2 column para sa mga duplicate at pagkatapos ay gumawa ng isang bagay na may nakitang mga entry, halimbawa, tanggalin ang mga duplicate na row, color dupe o i-clear ang mga nilalaman ng mga dobleng selula. Ang dalawang column na ito ay maaaring matatagpuan sa isang table, magkadikit o hindi magkadikit, o maaari silang nasa 2 magkaibang worksheet o kahit na workbook.

Sabihin, mayroon kang 2 column na may mga pangalan ng tao - 5 pangalan sa column A at 3 pangalan sa column B, at gusto mong paghambingin ang data sa pagitan ng dalawang column na ito upang makahanap ng mga duplicate. Tulad ng naiintindihan mo, ito ay huwad na data para lamang sa isang mabilis na halimbawa; sa mga totoong worksheet kadalasan ay mayroon kang libu-libo at sampu-sampung libong mga entry.

Variant A : Ang parehong column ay matatagpuan sa isang sheet, sa isang talahanayan: Column A at Column B

Variant B : Dalawang column ang makikita sa magkaibang sheet: Column A sa Sheet2 at Column A sa Sheet3

Ang built-in na Remove Duplicatetool na available sa Excel 2016, Excel 2013 at 2010 ay hindi mapangasiwaan ang sitwasyong ito dahil hindi nito maihahambing ang data sa pagitan ng 2 column. Higit pa rito, maaari lamang itong mag-alis ng mga dupe, walang ibang pagpipilian gaya ng pag-highlight o pagkulay, sayang :-(.

Sa karagdagang, ilalarawan ko ang 2 posibleng paraan ng paghahambing ng dalawang column ng Excel na hahayaan kang makahanap at alisin ang mga duplicate na entry:

Ihambing ang 2 column upang maghanap ng mga duplicate gamit ang mga formula ng Excel

Variant A: ang parehong column ay nasa parehong listahan

  1. Sa unang walang laman na cell, sa aming halimbawa ito ay Cell C1, isulat ang sumusunod na formula:

    =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)),"Unique","Duplicate")

    Sa aming formula, A1 ang unang cell ng unang column na gusto naming gamitin para sa paghahambing. $B$1 at $B$10000 ang mga address ng una at huling cell ng 2nd column na gusto mong paghambingin. Bigyang-pansin ang ang absolute cell reference - dollar signs ($) na nauuna sa mga column letter at row number. Ginagamit ko ang absolute reference sa layunin, upang ang mga cell address ay manatiling hindi nagbabago kapag kinokopya ang formula.

    Kung gusto mong maghanap ng mga dupe sa Column B, palitan ang column mga pangalan upang maging ganito ang formula:

    =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)),"Unique","Duplicate")

    Sa halip na " Natatangi "/" Duplicate " maaari kang sumulat ng sarili mong mga label, hal. " Not found "/" Found ", o iwanan lang ang " Duplicate " at i-type ang "" sa halip na "Unique". Sa huling kaso, magkakaroon kawalang laman na mga cell sa tabi ng mga cell kung saan ang mga duplicate ay hindi natagpuan, naniniwala ako na ang gayong pagtatanghal ay mas maginhawa para sa pagsusuri ng data.

  2. Ngayon, kopyahin natin ang formula sa lahat ng mga cell ng column C , hanggang sa huling row na naglalaman ng data sa column A. Upang gawin ito, ilagay ang cursor sa sa ibabang kanang sulok ng cell C1 , at ang cursor ay magiging isang itim na krus, tulad ng ipinapakita sa larawan sa ibaba:

    I-click ang kaliwang pindutan ng mouse at pindutin nang matagal ito i-drag ang hangganan pababa. pagpili sa lahat ng mga cell kung saan mo gustong kopyahin ang formula. Kapag napili ang lahat ng kinakailangang cell, bitawan ang kaliwang pindutan ng mouse:

    Tip: Sa malalaking talahanayan, mas mabilis na kopyahin ang formula gamit ang mga shortcut. Mag-click sa cell C1 upang piliin ito at pindutin ang Ctrl + C (upang kopyahin ang formula sa clipboard), pagkatapos ay pindutin ang Ctrl + Shift + End (upang piliin ang lahat ng hindi walang laman na mga cell sa Column C), at sa wakas ay pindutin Ctrl + V (upang i-paste ang formula sa lahat ng napiling mga cell).

  3. Kahanga-hanga, lahat ng na-duplicate na mga cell ay na-flag bilang "Duplicate":

Variant B: dalawang column ang nasa magkaibang worksheet (workbook)

  1. Sa 1st cell ng 1st empty column sa Sheet2 (column B sa aming case), isulat ang formula:

    =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),"","Duplicate")

    Kung saan ang Sheet3 ay ang pangalan ng sheet kung saan matatagpuan ang ika-2 column, at ang $A$1:$A$10000 ay ang mga address ng una at huling mga cell ng ang ika-2 column na iyon.

  2. Katulad ng Variant A.
  3. Kamimagkaroon ng sumusunod na resulta:

I-click upang i-download ang worksheet na may mga halimbawa sa itaas at ang formula upang paghambingin ang 2 column upang makahanap ng mga duplicate.

Paggawa gamit ang mga natagpuang duplicate

Perpekto, nakita namin ang mga entry sa unang column (Column A) na mayroon din sa pangalawang column (Column B). Ngayon ay kailangan nating gumawa ng isang bagay sa kanila :)

Ito ay sa halip ay hindi epektibo at kakailanganin ng masyadong maraming oras upang tingnan ang buong talahanayan at suriin nang manu-mano ang mga duplicate na entry. Mayroong mas mahusay na mga paraan.

Ipakita lamang ang mga duplicate na row sa Column A

Kung walang mga header ang iyong mga column, kailangan mong idagdag ang mga ito. Upang gawin ito, ilagay ang cursor sa numerong nagpapahiwatig ng 1st row at ito ay magiging isang itim na arrow tulad ng ipinapakita sa screenshot:

I-right click ang napiling row at piliin ang " Insert " mula sa menu ng konteksto:

Bigyan ng mga pangalan ang iyong mga column, hal. " Pangalan " at " Duplicate? ". Pagkatapos ay lumipat sa tab na Data at i-click ang Filter :

Pagkatapos ay mag-click ng maliit na kulay abong arrow sa tabi ng " Duplicate? " upang magbukas ng isang drop down na listahan, alisan ng check ang lahat ng item maliban sa Duplicate sa listahang iyon, at i-click ang OK :

Iyon lang, ngayon ay makikita mo lang ang mga cell ng Column A na may mga duplicate na value sa Colum B. Tatlo lang ang ganoong mga cell sa aming test worksheet, gaya ng nauunawaan mo sa mga totoong sheet na malamang na mas marami ang mga ito:

Saupang ipakita muli ang lahat ng row ng Column A, i-click ang filter na simbolo sa Column B na mukhang funnel na ngayon na may maliit na arrow at lagyan ng check ang "Piliin lahat". Bilang kahalili, maaari mong gawin ang parehong sa pamamagitan ng tab ng Data -> Piliin ang & Filter -> I-clear , tulad ng ipinapakita sa screenshot:

Kulayan o i-highlight ang mga nakitang duplicate

Kung ang flag na " Duplicate " ay hindi sapat para sa iyong mga layunin at gusto mong markahan ang mga duplicate na cell ayon sa kulay ng font o fill color o sa ibang paraan...

Pagkatapos ay i-filter ang mga duplicate tulad ng ipinaliwanag sa itaas, piliin ang lahat ng na-filter na mga cell at pindutin ang Ctrl + F1 upang buksan ang Format Cells dialog box. Bilang halimbawa, baguhin natin ang kulay ng background ng mga duplicate na row sa maliwanag na dilaw. Siyempre, maaari mong baguhin ang kulay ng background ng mga cell gamit ang opsyon na Kulay ng Punan sa tab na Home , ngunit ang bentahe ng dialog box ng Format Cells ay hinahayaan ka nitong gawin ang lahat ng pag-format. nagbabago nang sabay-sabay:

Ngayon ay tiyak na hindi mo na mapalampas ang isang solong nadobleng cell:

Alisin ang mga duplicate sa unang column

I-filter ang iyong talahanayan upang ang mga cell lamang na may duplicated lalabas ang mga value, at piliin ang lahat ng mga cell na iyon.

Kung ang 2 column na iyong inihahambing ay matatagpuan sa iba't ibang worksheet , ibig sabihin, sa magkahiwalay na mga talahanayan, i-right-click ang napiling hanay at piliin ang " Delete Row " mula sa context menu:

I-click ang OK kapag hihilingin sa iyo ng Excel na kumpirmahinna talagang gusto mong "Tanggalin ang buong hilera ng sheet" at pagkatapos ay i-clear ang filter. Gaya ng nakikita mo, ang mga row na lang na may natatanging value ang natitira:

Kung 2 column ang makikita sa isang worksheet , sa tabi ng isa't isa (katabi) o hindi magkadikit (hindi magkatabi) , ang pag-aalis ng mga duplicate ay medyo mas kumplikado. Hindi namin matatanggal ang buong row na naglalaman ng mga duplicate na value dahil tatanggalin din nito ang mga katumbas na cell sa 2nd column. Kaya, upang mag-iwan lamang ng mga natatanging entry sa Column A, gagawin mo ang sumusunod:

  1. I-filter ang talahanayan upang ang mga duplicate na cell lamang ang ipapakita at piliin ang lahat ng mga cell na iyon. I-right click ang pagpili at piliin ang " I-clear ang mga nilalaman ":
  2. I-clear ang filter.
  3. Piliin ang lahat ng mga cell sa Column A simula sa cell A1 hanggang sa huli cell na naglalaman ng data.
  4. Pumunta sa tab na Data at i-click ang Pagbukud-bukurin A hanggang Z . Sa dialog window na bubukas, piliin ang " Magpatuloy sa kasalukuyang pagpili " at i-click ang Pagbukud-bukurin :
  5. Tanggalin ang column na naglalaman ng formula dahil hindi mo kailangan pa, "Mga Natatanging" na lang ang natitira doon sa ngayon.
  6. Iyon lang, ngayon ang Column A ay naglalaman lang ng natatanging data na wala sa Column B :

Tulad ng nakikita mo, hindi napakahirap na alisin ang mga duplicate sa pagitan ng dalawang column ng Excel gamit ang mga formula. Kahit na napakatagal at nakakainip na proseso upang magsulat at kopyahin ang formula, mag-apply ati-clear ang filter sa tuwing kailangan mong maghambing ng 2 column sa iyong worksheet. Ang iba pang solusyon na ibibigay ko sa iyong pansin ay mas simple at kukuha lamang ng kaunting oras na ginugol namin sa unang paraan. Naniniwala ako na makakahanap ka ng higit pang kaaya-ayang mga bagay na gugugol ng naka-save na oras sa ;)

Ihambing ang 2 column ng Excel para sa mga duplicate gamit ang isang visual wizard

At ngayon hayaan mo akong ipakita sa iyo kung paano ihambing ang dalawang column para sa duplicate sa pamamagitan ng paggamit ng aming Dedupe tool para sa Excel.

  1. Buksan ang worksheet (o worksheet) kung saan matatagpuan ang mga column na gusto mong ihambing.
  2. Pumili ng anumang cell sa loob ng 1st column, lumipat sa tab na Ablebits Data at i-click ang button na Compare Tables :
  3. Sa hakbang 1 ng wizard, makikita mo iyon napili na ang iyong unang column, kaya i-click lang ang Next .

    Tandaan. Kung gusto mong paghambingin hindi lang 2 column, kundi 2 table, kailangan mong piliin ang buong unang table sa hakbang na ito.

  4. Sa step 2 ng wizard, piliin ang 2nd column na gusto mong paghambingin. Pinipili namin ang Sheet2 sa parehong workbook. Sa karamihan ng mga kaso, awtomatikong pinipili ng matalinong wizard ang ika-2 column, kung sa ilang kadahilanan ay hindi ito nangyari, piliin ang target na column gamit ang mouse. Kung inihahambing mo ang buong talahanayan, piliin ang buong ika-2 talahanayan.
  5. Piliin na hanapin ang Mga duplicate na value :
  6. Piliin ang pares ng mga column mogustong ihambing:

    Tip. Kung naghahambing ka ng mga talahanayan, maaari kang pumili ng ilang mga pares ng hanay para sa paghahambing, halimbawa, pangalan at apelyido. Para sa higit pang mga detalye, pakitingnan ang Paano mag-alis ng mga duplicate sa dalawang Excel spreadsheet.

  7. At sa wakas, ikaw ang magpapasya kung ano ang gusto mong gawin sa mga nahanap na dupe. Maaari mong piliing tanggalin ang mga duplicate na entry, ilipat o kopyahin ang mga ito sa isa pang worksheet, magdagdag ng column ng status (magiging katulad ang resulta sa aming unang solusyon sa mga Excel formula), i-highlight ang mga duplicate, o piliin lang ang lahat ng mga cell na may mga dobleng halaga:

    Tip. Huwag piliing tanggalin ang mga duplicate, lalo na kung ginagamit mo ang tool sa unang pagkakataon. Sa halip, piliin na ilipat ang mga dupe sa isa pang worksheet . Aalisin nito ang mga duplicate mula sa unang talahanayan, ngunit nagbibigay sa iyo ng pagkakataong suriin ang listahan ng mga entry na kinikilala bilang mga duplicate. Kapag naghahambing sa pamamagitan ng ilang magkatugmang column sa malalaking talahanayan, maaaring mangyari na hindi mo sinasadyang nakalimutang pumili ng isang pangunahing column na may natatanging data, at ang paglipat ng mga duplicate ay maiiwasan ang hindi na mababawi na pagkawala ng data.

  8. I-click ang Tapos na at tamasahin ang resulta. Ang mayroon tayo ngayon ay isang magandang, malinis na mesa na walang mga duplicate:

Alalahanin ang nakaraang solusyon at damhin ang pagkakaiba :) Mabilis at madali talagang i-dedupe ang iyong mga worksheet gamit ang Paghambingin ang Dalawang Talahanayan . Sa katunayan, ito ay magdadala sa iyo ng mas kaunting oras kaysa sa iyong ginugol sa pagbabasaang artikulong ito.

Sa kasalukuyan, ang Compare Tables ay bahagi ng aming Ultimate Suite for Excel, isang koleksyon ng 70+ propesyonal na tool na nagtatago sa mahigit 300 kaso ng paggamit. Ang orasan ay ticking, kaya bilisan at i-download ito ngayon din!

Kung mayroon kang mga tanong o kung ano ang naiwang hindi malinaw, mangyaring mag-drop sa akin ng komento at masaya akong magdetalye pa. Salamat sa pagbabasa!

Si Michael Brown ay isang dedikadong mahilig sa teknolohiya na may hilig sa pagpapasimple ng mga kumplikadong proseso gamit ang mga tool sa software. Sa higit sa isang dekada ng karanasan sa industriya ng tech, hinasa niya ang kanyang mga kasanayan sa Microsoft Excel at Outlook, pati na rin ang Google Sheets at Docs. Ang blog ni Michael ay nakatuon sa pagbabahagi ng kanyang kaalaman at kadalubhasaan sa iba, na nagbibigay ng madaling sundan na mga tip at mga tutorial para sa pagpapabuti ng pagiging produktibo at kahusayan. Isa ka mang batikang propesyonal o baguhan, nag-aalok ang blog ni Michael ng mahahalagang insight at praktikal na payo para masulit ang mahahalagang software tool na ito.