Excelで2つの列を比較し、重複を削除する

  • これを共有
Michael Brown

この記事を読むのに10分ほどかかりますが、5分もあれば(記事中にある2番目の解決策を選べばもっと早く)、2つのExcel列の重複を簡単に比較し、見つかった重複を削除またはハイライトすることができます。 さて、カウントダウンが始まりましたね。

Excelは、大規模なデータの配列を作成し、処理するための非常に強力でクールなアプリケーションです。 データのプールを持つ多くのワークブック、または1つの巨大なテーブルを持っている場合、2つの列の重複を比較し、見つかったエントリで何かをしたいかもしれません。 これらの2つの列は、次のようになります。は、1つのテーブルに、連続または非連続に配置されるか、または2つの異なるワークシート、あるいはワークブックに存在することがあります。

例えば、A列に5名、B列に3名の人名が入った2列のデータがあり、この2列のデータを比較して重複を見つけたいとします。 ご理解のように、これはあくまで例としての偽データで、実際のワークシートでは数千から数万の項目があるのが普通です。

バリアントA : 両列とも1枚のシートにあり、1つのテーブルになっています。 A列 B列

バリアントB : 2つの列が異なるシートに配置されています。 Sheet2 の A 列 Sheet3のA列

Excel 2016、Excel 2013および2010に内蔵されている重複の削除ツールは、2列間のデータを比較できないため、このシナリオを処理できません。 さらに、重複の削除のみが可能で、ハイライトや色付けなどの他の選択肢はありません。

さらに、Excelの2つの列を比較して、重複する項目を見つけ、削除する2つの方法を説明するつもりです。

    Excelの計算式を使って2つの列を比較し、重複を見つける

    バリエーションA:両方の列が同じリストにある場合

    1. 最初の空のセル(この例ではセルC1)に、次の数式を書き込みます。

      =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)), "Unique", "Duplicate")

      私たちの計算式では A1 は、比較に使用したい最初の列の最初のセルです。 $B$1 $B$10000 は、比較したい2列目の最初と最後のセルのアドレスです。絶対セル参照に注意してください - 列の文字と行番号の前にドル記号($)があります。 計算式をコピーするときにセルのアドレスが変更されないように、わざと絶対参照を使用するのです。

      B列の重複を見つけたい場合は、列名を入れ替えて、以下のような式にします。

      =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)), "Unique", "Duplicate")

      の代わりに、" ユニーク "/" デュプリケート " のように、独自のラベルを書くことができます。 不明 "/" 発見 " のみを残すか、" デュプリケート 「後者の場合、重複が見つからなかったセルの隣が空白になりますが、その方がデータ分析には便利だと思います。

    2. のすべてのセルに数式をコピーしてみましょう。 C列 A列のデータを含む最後の行まで、カーソルをセル C1 と表示され、カーソルが下の画像のように黒い十字に変わります。

      マウスの左ボタンをクリックし、押したまま境界線を下方向にドラッグして、数式をコピーしたいすべてのセルを選択します。 必要なセルがすべて選択されたら、マウスの左ボタンを離します。

      ヒント:大きな表では、ショートカットを使って数式をコピーする方が早いです。 セル上でクリックする C1 で選択し、Ctrl + C(数式をクリップボードにコピー)、Ctrl + Shift + End(C列の空でないセルをすべて選択)、最後にCtrl + V(選択したすべてのセルに数式を貼り付ける)を押します。

    3. Awesome、重複しているすべてのセルに "Duplicate "のフラグが立つ。

    バリエーションB:2つの列が異なるワークシート(ワークブック)にある場合

    1. Sheet2の1つ目の空欄のセル(ここではB列)に、数式を書き込みます。

      =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),"", "Duplicate (重複)")

      どこ シート3 は2列目があるシートの名前であり A$1:$A$10000 は、その2列目の最初と最後のセルのアドレスである。

    2. Variant Aに類似。
    3. 次のような結果が得られました。

    上記の例と、2つの列を比較して重複を見つける公式を含むワークシートをダウンロードするには、クリックしてください。

    見つかった重複を処理する

    これで、1列目(A列)のエントリーが2列目(B列)にも存在することがわかりました。 あとは、それらを使って何かをする必要があります :)

    もっといい方法があるはずです。

    A列の重複した行だけを表示する

    ヘッダーがない列は、ヘッダーを追加する必要があります。 そのためには、1行目を示す数字の上にカーソルを置くと、その数字が 黒矢印 をスクリーンショットのように表示します。

    選択した行を右クリックし、" インサート " をコンテキストメニューから選択します。

    カラムに名前をつける(例: " 名称 " と " 重複? " に切り替えてください。 データ タブをクリックし フィルター :

    その後、" "の隣にある小さな灰色の矢印をクリックします。 重複? をクリックしてドロップダウンリストを開き、その中の「複製」以外のすべての項目のチェックを外して よっしゃー :

    これで、A列のセルのうち、B列の値と重複しているものだけが表示されるようになりました。このようなセルは、今回のテストシートでは3つだけですが、実際のシートにはもっとたくさんあることはおわかりでしょう。

    A列のすべての行を再び表示するには、B列のフィルター記号をクリックしてください。 をクリックし、「すべてを選択」をチェックします。 データタブ -> 選択・絞り込み -> クリア は、スクリーンショットに示すとおりです。

    重複を発見した場合、色付けまたはハイライト表示

    もし、" デュプリケート " フラグでは不十分で、重複するセルをフォントの色や塗りつぶしの色、あるいは他の方法でマークしたい場合。

    次に、上記で説明したように重複をフィルタリングし、フィルタリングしたすべてのセルを選択して、Ctrl + F1 キーを押しながら、次のように開きます。 セルのフォーマット ここでは、重複した行の背景色を明るい黄色にしてみましょう。 もちろん、セルの背景色は 塗りつぶし色 オプションで ホーム タブに表示されますが、「セルの書式設定」ダイアログボックスの利点は、すべての書式設定を一度に変更できることです。

    これで、重複したセルを一つも見逃すことはありません。

    最初の列から重複を削除する

    テーブルをフィルタリングして、値が重複しているセルだけが表示されるようにし、それらのセルをすべて選択します。

    比較する2つの列が異なるワークシートにある場合 を選択し、右クリックで" "を選択します。 行の削除 " をコンテキストメニューから選択します。

    クリック よっしゃー をクリックすると、Excelが本当に「シート行全体を削除」するかどうかを確認し、フィルタをクリアします。 ご覧のように、ユニークな値を持つ行だけが残ります。

    1つのワークシートに2つの列がある場合 とか、隣り合っている(隣接)とか、接していない(非隣接)とか、重複の削除は少し複雑です。 重複する値を含む行全体を削除すると、2列目の該当セルも削除されてしまうからです。 そこで、A列にユニークな項目のみを残すために、次のようにします。

    1. 重複しているセルだけが表示されるように表をフィルタリングし、それらのセルをすべて選択します。 選択したセルを右クリックして、" "を選択します。 クリアコンテンツ ":
    2. フィルターをクリアする。
    3. A列のセルA1から始まり、データを含む最後のセルまで、すべてのセルを選択する。
    4. に行ってみてください。 データ タブをクリックし AからZへのソート 開いたダイアログウィンドウで、" "を選択します。 現在の選択を継続する " をクリックします。 ソート :
    5. 数式を含む列はもう必要ないので削除し、今は「Uniques」だけが残っています。
    6. 以上です。 現在、A列にはB列に存在しないユニークなデータのみが含まれています。 :

    このように、数式を使ってExcelの2つの列の間の重複を取り除くのはそれほど難しいことではありません。 しかし、ワークシートの2つの列を比較する必要があるたびに数式を書いてコピーし、フィルターを適用してクリアするというのは非常に時間がかかり退屈です。 これから紹介する解決策は、もっと簡単で、これまでのこの方法なら、節約した時間をもっと楽しいことに使えると思います。)

    ビジュアルウィザードを使用して、2つのExcel列の重複を比較する

    次に、Excel用のDedupeツールを使って、2つの列の重複を比較する方法を説明します。

    1. 比較したい列があるワークシート(または複数のワークシート)を開きます。
    2. 1列目の任意のセルを選択し、1列目のセルに切り替えてください。 エイブルビットのデータ タブをクリックし テーブルの比較 ボタンをクリックします。
    3. オン ステップ1 をクリックすると、最初の列がすでに選択されていることがわかります。 次のページ .

      注:2つの列だけでなく、2つのテーブルを比較したい場合は、このステップで最初のテーブル全体を選択する必要があります。

    4. オン ステップ2 ウィザードの2番目の列を選択します。 シート2 ほとんどの場合、スマートウィザードは自動的に2列目を選択しますが、何らかの理由で選択されない場合は、マウスを使って目的の列を選択してください。 テーブル全体を比較する場合は、2番目のテーブル全体を選択してください。
    5. 探すを選択 重複する値 :
    6. 比較したい列のペアを選びます。

      ヒント:表を比較する場合、姓と名のように複数の列のペアを選択して比較することができます。 詳しくは、「2つのExcelスプレッドシートから重複を削除する方法」をご覧ください。

    7. 重複した項目を削除する、別のワークシートに移動またはコピーする、ステータス欄を追加する(Excelの数式を使った最初の解決策と同様の結果になります)、重複をハイライトする、重複した値のあるセルをすべて選択する、などの方法を選択できます。

      ヒント:特に初めて使用する場合は、「重複を削除する」を選択しないでください。 代わりに、以下を選択してください。 とりあう を別のワークシートにコピーします。 これは、最初のテーブルから重複を削除しますが、重複と認識されたエントリーのリストを確認する機会を与えます。 大きなテーブルで複数の一致する列で比較する場合、一意のデータを持つキー列を誤って選択し忘れることがありますが、重複を移動すればデータの回復不能な損失を防ぐことができます。

    8. クリック 仕上がり これで、重複のないきれいなテーブルができあがりました。

    前回の解決策を思い出し、その違いを実感してください :) ワークシートの控除は、実に迅速かつ簡単です。 2つのテーブルを比較する 実際、この記事を読むのに費やした時間よりも短い時間で終わるでしょう。

    現在 テーブルの比較 は、300以上のユースケースをカバーする70以上のプロフェッショナルツールのコレクションであるUltimate Suite for Excelの一部です。 時間は限られていますので、急いで今すぐダウンロードしてください。

    ご質問や不明な点がありましたら、コメント欄にご記入ください。 読んでくださってありがとうございます。

    Michael Brown は、ソフトウェア ツールを使用して複雑なプロセスを簡素化することに情熱を注ぐ熱心なテクノロジー愛好家です。テクノロジー業界で 10 年以上の経験があり、Microsoft Excel と Outlook、さらに Google Sheets と Docs のスキルを磨いてきました。 Michael のブログは、彼の知識と専門知識を他の人と共有することに特化しており、生産性と効率を向上させるためのわかりやすいヒントとチュートリアルを提供しています。経験豊富なプロフェッショナルであろうと初心者であろうと、Michael のブログでは、これらの重要なソフトウェア ツールを最大限に活用するための貴重な洞察と実践的なアドバイスを提供しています。