Divu kolonnu salīdzināšana un dublikātu noņemšana programmā Excel

  • Dalīties Ar Šo
Michael Brown

Lai izlasītu šo rakstu, jums būs nepieciešamas aptuveni 10 minūtes, un nākamajās 5 minūtēs (vai pat ātrāk, ja izvēlēsieties 2. rakstā aprakstīto risinājumu) jūs viegli salīdzināsiet divus Excel kolonnas, lai atrastu dublikātus, un noņemsiet vai izcelt atrastos dublikātus. Labi, atpakaļskaitīšana ir sākusies!

Excel ir ļoti jaudīga un patiešām forša lietojumprogramma lielu datu masīvu izveidei un apstrādei. Tagad, kad jums ir daudz darbgrāmatu ar datu kopumu vai varbūt tikai viena milzīga tabula, jūs, iespējams, vēlaties salīdzināt 2 kolonnas, lai atrastu dublikātus, un pēc tam kaut ko darīt ar atrastajiem ierakstiem, piemēram, dzēst dublētās rindas, iekrāsot dublikātus vai izdzēst dublēto šūnu saturu. Šīs divas kolonnas var būtvar atrasties vienā tabulā, saistītā vai nesaistītā veidā, vai arī tās var atrasties 2 dažādās darblapās vai pat darbgrāmatās.

Teiksim, jums ir 2 slejas ar cilvēku vārdiem - 5 vārdi A slejā un 3 vārdi B slejā, un jūs vēlaties salīdzināt datus starp šīm divām ailēm, lai atrastu dubultus. Kā jūs saprotat, šie ir fiktīvi dati tikai īsam piemēram; reālās darblapās parasti ir tūkstošiem un desmitiem tūkstošu ierakstu.

A variants : Abas kolonnas atrodas vienā lapā, vienā tabulā: A sleja un B sleja

B variants : Divas kolonnas atrodas dažādās lapās: A sleja 2. lapā un A sleja 3. lapā

Iebūvētais rīks Dublētu noņemšana, kas pieejams programmā Excel 2016, Excel 2013 un Excel 2010, nevar tikt galā ar šo scenāriju, jo tas nevar salīdzināt datus starp divām kolonnām. Turklāt tas var tikai noņemt dubultus, bet citas izvēles, piemēram, izcelšana vai krāsošana, diemžēl nav pieejamas :-(.

Tālāk es aprakstīšu 2 iespējamos divu Excel kolonnu salīdzināšanas veidus, kas ļauj atrast un noņemt dublējošos ierakstus:

    2 kolonnu salīdzināšana, lai atrastu dubultus, izmantojot Excel formulas

    A variants: abas kolonnas ir vienā sarakstā.

    1. Pirmajā tukšajā šūnā (mūsu piemērā tā ir šūna C1) ierakstiet šādu formulu:

      =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)), "Unikāls", "Dublikāts")

      Mūsu formulā, A1 ir pirmās kolonnas pirmā šūna, kuru vēlamies izmantot salīdzināšanai. $B$1 un $B$10000 ir 2. slejas pirmās un pēdējās šūnas, ar kurām vēlaties salīdzināt, adreses.Pievērsiet uzmanību absolūtajai šūnas atsaucei - dolāra zīmēm ($) pirms slejas burtiem un rindas numuriem. Es izmantoju absolūto atsauci ar nolūku, lai šūnu adreses nemainītos, kopējot formulu.

      Ja vēlaties atrast dubultdatus B slejā, nomainiet slejas nosaukumus tā, lai formula izskatītos šādi:

      =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)), "Unikāls", "Dublikāts")

      Tā vietā, lai " Unikāls "/" Dublikāts " varat rakstīt savas etiķetes, piemēram, " Nav atrasts "/" Atrasts " vai atstājiet tikai " Dublikāts " un ierakstiet "", nevis "Unikāls". Pēdējā gadījumā jums būs tukšas šūnas blakus šūnām, kurām netika atrasti dublikāti, un, manuprāt, šāds attēlojums ir ērtāks datu analīzei.

    2. Tagad kopēsim formulu uz visām šūnām C sleja līdz pēdējai rindai, kurā ir A slejas dati. Lai to izdarītu, novietojiet kursoru uz šūnas apakšējo labo stūri C1 , un kursors mainīsies uz melnu krustiņu, kā parādīts attēlā zemāk:

      Noklikšķiniet ar peles kreiso pogu un, turot to nospiestu, velciet malu uz leju, atlasot visas šūnas, kurās vēlaties kopēt formulu. Kad atlasītas visas vajadzīgās šūnas, atlaidiet peles kreiso pogu:

      Padoms: lielās tabulās formulu ātrāk ir kopēt, izmantojot īsceļus. Noklikšķiniet uz šūnas. C1 lai to atlasītu, un nospiediet Ctrl + C (lai kopētu formulu uz starpliktuvi), pēc tam nospiediet Ctrl + Shift + End (lai atlasītu visas C slejas šūnas, kas nav tukšas) un visbeidzot nospiediet Ctrl + V (lai ielīmētu formulu visās atlasītajās šūnās).

    3. Lieliski, visas dublētās šūnas tiek atzīmētas kā "Dublēts":

    B variants: divas kolonnas ir dažādās darblapās (darbgrāmatās).

    1. 2. lapas 1. tukšās kolonnas 1. šūnā (mūsu gadījumā - B kolonnā) ierakstiet formulu:

      =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),"", "Dublikāts")

      Kur Lapa3 ir tās lapas nosaukums, kurā atrodas 2. sleja, un $A$1:$A$10000 ir šīs 2. slejas pirmās un pēdējās šūnas adreses.

    2. Līdzīgs A variantam.
    3. Mēs iegūstam šādu rezultātu:

    Noklikšķiniet, lai lejupielādētu darblapu ar iepriekš minētajiem piemēriem un formulu 2 kolonnu salīdzināšanai, lai atrastu dublikātus.

    Darbs ar atrastajiem dublikātiem

    Lieliski, esam atraduši ierakstus pirmajā ailē (A ailē), kas pastāv arī otrajā ailē (B ailē). Tagad mums ar tiem kaut kas jādara :)

    Tas būtu diezgan neefektīvi un prasītu pārāk daudz laika, lai manuāli pārlūkotu visu tabulu un pārskatītu dublētos ierakstus. Ir daudz labāki veidi.

    Rādīt tikai dublētās rindas A slejā

    Ja jūsu kolonnām nav virsrakstu, tie ir jāpievieno. Lai to izdarītu, novietojiet kursoru uz skaitļa, kas apzīmē 1. rindu, un tas mainīsies uz a. melnā bulta kā parādīts ekrānšāviņā:

    Ar peles labo pogu noklikšķiniet uz atlasītās rindas un izvēlieties " Ievietot " no konteksta izvēlnes:

    Nosauciet kolonnām nosaukumus, piemēram, " Nosaukums " un " Dublikāts? ". Pēc tam pārslēdzieties uz Dati cilni un noklikšķiniet uz Filtrs :

    Pēc tam noklikšķiniet uz mazās pelēkās bultiņas blakus " Dublikāts? ", lai atvērtu nolaižamo sarakstu, noņemiet atzīmi no visiem saraksta elementiem, izņemot Dublikāts, un noklikšķiniet uz LABI :

    Tas ir viss, tagad jūs redzat tikai tās A slejas šūnas, kurām ir dublētas vērtības B slejā. Mūsu testa darblapā ir tikai trīs šādas šūnas, kā jūs saprotat, reālajās lapās to var būt vairāk, daudz vairāk:

    Lai atkal parādītu visas A slejas rindas, noklikšķiniet uz filtra simbola B slejā, kas tagad izskatās kā piltuve ar mazu bultiņu. un atzīmējiet "Atlasīt visus". To pašu varat izdarīt arī, izmantojot Datu cilne -> Atlasīt & amp; Filtrēt -> Skaidrs , kā parādīts ekrānšāviņš:

    Krāsot vai izcelt atrastos dublikātus

    Ja " Dublikāts " karodziņš nav pietiekams jūsu vajadzībām un jūs vēlaties dublētās šūnas atzīmēt ar fonta krāsu vai aizpildījuma krāsu, vai kā citādi...

    Pēc tam filtrējiet dublikātus, kā paskaidrots iepriekš, atlasiet visas filtrētās šūnas un nospiediet Ctrl + F1, lai atvērtu programmu. Šūnu formatēšana Dialoglodziņš. Kā piemēru mainīsim dublēto rindu fona krāsu uz spilgti dzeltenu. Protams, šūnu fona krāsu var mainīt, izmantojot ikonu Aizpildījuma krāsa opcija Sākums cilne, bet dialoglodziņa Format Cells priekšrocība ir tā, ka tajā var veikt visas formatēšanas izmaiņas vienlaicīgi:

    Tagad noteikti nepalaidīsiet garām nevienu dublētu šūnu:

    Pirmajā slejā dzēst dublikātus

    Izfiltrējiet tabulu tā, lai tiktu parādītas tikai tās šūnas, kurās ir dublētās vērtības, un atlasiet visas šīs šūnas.

    Ja 2 salīdzināmās kolonnas atrodas dažādās darblapās. t. i., atsevišķās tabulās, noklikšķiniet ar peles labo pogu uz atlasītā diapazona un izvēlieties " Dzēst rindu " no konteksta izvēlnes:

    Noklikšķiniet uz LABI kad Excel lūgs jums apstiprināt, ka patiešām vēlaties "Dzēst visu lapas rindu", un pēc tam dzēsīs filtru. Kā redzat, paliks tikai rindas ar unikālām vērtībām:

    Ja vienā darblapā atrodas 2 kolonnas , kas atrodas blakus (blakus) vai nesaskaras (nesaskaras), dublikātu dzēšana ir nedaudz sarežģītāka. Mēs nevaram dzēst veselas rindas, kurās ir dublējošās vērtības, jo tādējādi tiktu dzēstas arī atbilstošās 2. slejas šūnas. Tātad, lai A slejā atstātu tikai unikālus ierakstus, veiciet šādu darbību:

    1. Izfiltrējiet tabulu tā, lai tiktu parādītas tikai dublētās šūnas, un atlasiet visas šīs šūnas. Ar peles labo pogu noklikšķiniet uz atlases un izvēlieties " Skaidrs saturs ":
    2. Notīriet filtru.
    3. Atlasiet visas A slejas šūnas, sākot no A1 šūnas līdz pēdējai šūnai, kurā ir dati.
    4. Dodieties uz Dati cilni un noklikšķiniet uz Kārtot no A līdz Z . Atvērtajā dialoglodziņā izvēlieties " Turpināt pašreizējo atlasi " un noklikšķiniet uz Atlasīt :
    5. Izdzēsiet kolonnu, kurā ir formula, jo tā jums vairs nav vajadzīga, tur ir palikušas tikai "Uniques".
    6. Tas ir viss, tagad A slejā ir tikai unikāli dati, kas neeksistē B slejā. :

    Kā redzat, nav nemaz tik sarežģīti noņemt dublēšanos starp diviem Excel kolonnām, izmantojot formulas. Lai gan tas ir ļoti laikietilpīgs un garlaicīgs process, lai rakstītu un kopētu formulu, piemērotu un notīrītu filtru katru reizi, kad nepieciešams salīdzināt 2 kolonnas darblapās. Otrs risinājums, ko es grasos piedāvāt jūsu uzmanībai, ir daudz vienkāršāks un aizņems tikai daļu no laika, ko esam pavadījuši uzpirmā metode. Es ticu, ka atradīsi daudz patīkamākas lietas, kam veltīt ietaupīto laiku ;)

    Salīdziniet 2 Excel kolonnas, lai atrastu dublikātus, izmantojot vizuālo vedni

    Tagad parādīšu, kā, izmantojot mūsu Excel rīkus Dedupe, salīdzināt divas kolonnas, lai noteiktu, vai tās nav dublējušās.

    1. Atveriet darblapu (vai darblapas), kurā atrodas kolonnas, kuras vēlaties salīdzināt.
    2. Izvēlieties jebkuru šūnu 1. slejā, pārslēdziet uz Ablebits dati un noklikšķiniet uz cilnes Tabulu salīdzināšana pogu:
    3. Uz solis 1 sadaļā redzēsiet, ka jūsu pirmā sleja jau ir atlasīta, tāpēc vienkārši noklikšķiniet uz Nākamais .

      Piezīme. Ja vēlaties salīdzināt ne tikai 2 kolonnas, bet 2 tabulas, šajā solī ir jāizvēlas visa pirmā tabula.

    4. Uz solis 2 vedņa sadaļā atlasiet 2. sleju, ar kuru vēlaties salīdzināt. Mēs izvēlamies Lapa2 tajā pašā darbgrāmatā. Lielākajā daļā gadījumu gudrais vednis 2. kolonnu izvēlas automātiski, ja kaut kādu iemeslu dēļ tas nenotiek, atlasiet mērķa kolonnu, izmantojot peli. Ja salīdzināt veselas tabulas, atlasiet visu 2. tabulu.
    5. Izvēlieties atrast Vērtību dublēšanās :
    6. Izvēlieties kolonnu pāri, kurus vēlaties salīdzināt:

      Padoms. Ja salīdzināt tabulas, salīdzināšanai varat izvēlēties vairākus kolonnu pārus, piemēram, vārdu un uzvārdu. Lai iegūtu sīkāku informāciju, skatiet sadaļu Kā no divām Excel izklājlapām noņemt dublikātus.

    7. Un visbeidzot, jums jāizlemj, ko vēlaties darīt ar atrastajiem dublikātiem. Varat izvēlēties dzēst dublētos ierakstus, pārvietot vai kopēt tos uz citu darblapu, pievienot statusa kolonnu (rezultāts būs līdzīgs mūsu pirmajam risinājumam ar Excel formulām), izcelt dublikātus vai vienkārši atlasīt visas šūnas ar dublētajām vērtībām:

      Padoms. Neizvēlieties dzēst dubultrakstus, jo īpaši, ja lietojat rīku pirmo reizi. Tā vietā izvēlieties iespēju. pārvietot dublikātus uz citu darblapu . Tādējādi no pirmās tabulas tiks noņemti dublikāti, bet jums tiks dota iespēja pārskatīt to ierakstu sarakstu, kuri ir atzīti par dublikātiem. Salīdzinot pēc vairākiem vienādiem slejām lielās tabulās, var gadīties, ka nejauši esat aizmirsis atlasīt galveno sleju ar unikāliem datiem, un dublikātu pārvietošana novērsīs neatgriezenisku datu zudumu.

    8. Noklikšķiniet uz Apdare un izbaudiet rezultātu. Tagad mums ir skaista, tīra tabula bez dubultiem:

    Atcerieties iepriekšējo risinājumu un izjūtiet atšķirību :) Ir ātri un vienkārši dedupēt darblapas ar Divu tabulu salīdzināšana Patiesībā tas aizņems mazāk laika, nekā esat patērējis šī raksta lasīšanai.

    Pašlaik, Tabulu salīdzināšana ir daļa no mūsu Ultimate Suite for Excel komplekta, kas ietver vairāk nekā 70 profesionālu rīku kolekciju, kas aptver vairāk nekā 300 lietojuma gadījumus. Pulkstenis rit, tāpēc pasteidzieties un lejupielādējiet to tieši tagad!

    Ja jums ir jautājumi vai kaut kas palicis neskaidrs, lūdzu, rakstiet man komentāru, un es labprāt paskaidrošu sīkāk. Paldies, ka izlasījāt!

    Maikls Brauns ir īpašs tehnoloģiju entuziasts, kura aizraušanās ir sarežģītu procesu vienkāršošana, izmantojot programmatūras rīkus. Ar vairāk nekā desmit gadu pieredzi tehnoloģiju nozarē viņš ir pilnveidojis savas prasmes programmās Microsoft Excel un Outlook, kā arī Google izklājlapās un dokumentos. Maikla emuārs ir veltīts tam, lai dalītos savās zināšanās un pieredzē ar citiem, sniedzot viegli izpildāmus padomus un pamācības produktivitātes un efektivitātes uzlabošanai. Neatkarīgi no tā, vai esat pieredzējis profesionālis vai iesācējs, Maikla emuārs piedāvā vērtīgas atziņas un praktiskus padomus, kā maksimāli izmantot šos būtiskos programmatūras rīkus.