目次
Google Sheetsで重複を見つける簡単な方法をお探しですか? 7つの方法はどうですか? :) 多数のユースケースに必要なのはこれだけです :) 数式不要のツール(コーディングなし - 約束!)、条件付き書式、熱心な数式ファン向けのいくつかの簡単な関数の使い方を紹介します。
Google Sheetsの使用頻度にかかわらず、重複したデータを処理する必要があります。 そのようなレコードは、1つの列に表示されたり、行全体を占めていることがあります。
この記事を読み終わるころには 重複の除去、カウント、ハイライト、ステータス表示など、必要な機能はすべて備えています。 また、Google Sheetsの重複をスケジュール通りに検出・削除するツールも紹介します。 条件付き書式も便利です。
好きなものを選んで、レッツ・ロール :)
Google Sheetsで数式を使用して重複を検索する方法
従来は、まず数式から始めます。 数式の主な利点は、元のテーブルがそのまま残ることです。 数式は重複を識別して、Google Sheetsの別の場所に結果を返します。 そして、目的の結果に基づいて、異なる関数がトリックを実行します。
Google SheetsでUNIQUE関数を使用して重複を削除する方法
UNIQUE関数は、データをスキャンして重複を削除し、その名の通りユニークな値/行を返します。
以下は、異なる行が繰り返される小さなテーブルの例です。
例1.重複した行を削除し、1回目の出現を維持する。
一方では、このGoogle Sheetsのテーブルから重複する行をすべて削除し、最初のエントリだけを残す必要があるかもしれません。
そのためには、UNIQUE の中にデータの範囲を入力するだけです。
=unique(a1:c10)
この小さな数式は、すべてのユニークな行と、2番目、3番目などを無視したすべての最初の出現を返します。
例2:重複する行をすべて削除(1回目も削除)。
一方、「本物」のユニークな行だけを取得したい場合もあります。 本物の」というのは、一度も繰り返さない行のことです。 では、どうすればいいのでしょうか。
ちょっと時間をおいて、すべてのUNIQUE引数に目を通してみましょう。
UNIQUE(range,[by_column],[exactly_once])- レンジ - は処理したいデータです。
- [by_column]です。 - は、完全に一致する行をチェックするか、 あるいは個々の列のセルをチェックするかを指定します。 列の場合は TRUE を、行の場合は FALSE を指定するか、 あるいは引数をスキップします。
- [exactly_once] - これは、Google Sheets の重複だけでなく、その最初のエントリも削除するように指示します。 つまり、重複のないレコードだけを返すようにします。 そのためには TRUE、それ以外は FALSE にするか、引数をスキップします。
この最後の主張が、ここでのあなたの武器になるのです。
したがって、Google Sheetsから重複する行を(その1行目も含めて)完全に削除するには、式の2番目の引数をスキップして、3番目の引数を追加します。
=unique(a1:c10,,true)です。
右側のテーブルが短くなったのは、UNIQUEが重複した行とその1回目の出現を元のGoogle Sheetsのテーブルから削除したからです。 今はユニークな行だけが残っています。
Google SheetsのCOUNTIF関数を使って重複を特定する
他のデータセットでスペースを取るのが嫌なら、Google Sheetsで重複を数える(そして手動で削除する)こともできます。 カラムがひとつ増えるだけですし、COUNTIF関数が役に立ちます。
ヒント:この機能については、ブログの記事で詳しく説明していますので、ぜひご覧ください。
例1.総出現回数を取得する
Google Sheetsで1回目の出現で重複をすべて特定し、各ベリーの出現数の合計を確認してみましょう。 D2で以下の式を使い、それを列下にコピーします。
=countif($b$2:$b$10,$b2)です。
ヒント:この式で列の各行を自動的に処理するには、すべてをArrayFormulaで囲み、次のように変更します。 $B2 まで B2:$B10 (したがって、数式をコピーする必要はありません。
このデータセットを数字でフィルタリングすれば、Google Sheetsのテーブルから余分な重複行を手動で削除することも可能だ。
例2.Google Sheetsで重複しているものを全て検索して列挙する。
総出現回数が目的ではなく、この行のこのレコードが1番目か2番目かなどを知りたい場合は、数式を少し調整する必要があります。
列全体から範囲を変更する ($B$2:$B$10) たった一つの細胞に ($B$2:$B2) .
注)絶対参照の使い方に注意する。
=countif($b$2:$b2,$b2)です。
今回、このGoogle Sheetsのテーブルから重複を削除するのは、1つ目の項目以外を隠すことができるので、さらに簡単です。
例3.Google Sheetsで重複する行を数える
上記の数式は、Google Sheetsの1つの列の重複を数えるものですが、すべての列を考慮し、重複する行を特定する数式が必要な場合があります。
この場合、COUNTIFSがより適しています。 テーブルのすべてのカラムとそれに対応する基準をリストアップしてください。
=countifs($a$2:$a$10,$a2,$b$2:$b$10,$b2,$c$2:$c$10,$c2)です。
ヒント:数式を使わずに重複を計算する方法がもう一つあります。 ピボットテーブルを使った方法ですが、さらに詳しく説明します。
ステータス欄の重複をマークする-IF機能
時には数字だけでは不十分で、重複しているものを見つけてステータス欄にマークした方が良い場合もあります。 繰り返しになりますが、この欄でGoogle Sheetsのデータをフィルタリングすれば、不要になった重複を削除することができます。
例1.Google Sheetsの1列で重複しているものを探す
この作業には、同じCOUNTIF関数が必要ですが、今回はIF関数に包まれています。 ちょうど次のような感じです。
=IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate", "Unique")
この式でどうなるか見てみましょう。
- まず、COUNTIFはB列全体からB2のベリーを探し出し、見つかったらそれらを合計する。
- そして、IFはこの合計をチェックし、1より大きければ、次のように言うのです。 デュプリケート それ以外の場合は ユニーク .
もちろん、独自のステータスを返す数式を取得することもできますし、例えば、find & Google Sheetsのデータから重複するものだけを特定することもできます。
=IF(COUNTIF($B$2:$B$10,$B2)>1, "Duplicate","")
ヒント:このような重複を見つけたら、すぐにステータスカラムでテーブルをフィルタリングすることができます。 この方法では、繰り返されたレコードやユニークなレコードを非表示にし、さらに行全体を選択&Ampし、Google Sheetsからこれらの重複を完全に削除することができます。
例2.重複する行の特定
同様に、絶対重複行(すべての列のすべてのレコードが表中に複数回出現する行)をマークすることもできます。
- 各列の最初の値をスキャンし、3つの列の3つのレコードがすべて繰り返される行のみをカウントするもので、前と同じCOUNTIFSで開始します。
=countifs($a$2:$a$10,$a2,$b$2:$b$10,$b2,$c$2:$c$10,$c2)です。
- そして、その数式をIFで囲み、繰り返される行の数をチェックし、それが1を超えたら、その行を重複行と名付けるというものです。
=IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1, "Duplicate",""".)
cherryが3回出現しても、3つの列がすべて同じなのは2つだけなので、重複は2つだけになりました。
例3.重複する行を探し、1つ目のエントリーを無視する。
1回目の出現を無視し、2回目以降をマークするには、列全体ではなく、表の最初のセルを参照します。
=IF(COUNTIFS($A$2:$A2,$A2,$B$2,$B2,$C$2:$C2,$C2)>1, "Duplicate",""")
ヒント Microsoft Excelをお使いの場合は、次の例が参考になるかもしれません。
条件付き書式ルールでGoogle Sheetsの重複を識別してハイライトする
繰り返されるデータを処理することで、テーブルを一目見ただけで、このレコードはダブりなのかどうかがわかるようになる可能性があります。
Google Sheetsで重複を強調表示することについてです。 条件付き書式を使うと便利です。
ヒント:条件付き書式を試したことがない方、ご安心ください。この記事でその仕組みを説明しています。
ここで、必要なことを説明します。
- 条件付き書式の設定を開く フォーマット> 条件付き書式 .
- を確認してください。 レンジに適用する フィールドには、重複を強調したい範囲が含まれています。 この例では、B列から始めてみましょう。
- で フォーマット規定 撥ねる カスタム式は と入力し、上で紹介したのと同じCOUNTIFを入力します。
=COUNTIF($B$2:$B$10,$B2)>1
B列に2回以上現れるレコードを探し出し、好みの色合いで着色します。
また、重複する行をハイライトすることも可能です。 ルールを適用する範囲を調整するだけです。
ヒント:Google Sheetsで重複をハイライトしたら、色でデータをフィルタリングできます。
- 一方では、塗りつぶしの色が白のセルだけを表示するように列をフィルタリングすることができます。 この方法では、ビューから重複を削除することができます。
- 一方、色のついたセルだけを表示させておくこともできます。
で、これらの行を選択し、Google Sheetsからこれらの重複を完全に削除してください。
ヒント:Google Sheetsで重複を強調するその他の公式については、このチュートリアルをご覧ください。
Google Sheetsで重複を検索・削除する数式不要の方法
数式や条件付き書式も良いのですが、他にも重複を見つけるのに役立つツールがあります。 そのうちの2つは、この特定の問題のために設計されたものです。
Pivot table for Google Sheetsで重複を確認する
ピボットテーブルは、表計算ソフトでデータを回転させ、表を読みやすく、理解しやすくするために使用します。 これは、データセットを提示する代替方法のようなものです。
ピボットテーブルは、元データを参照し、その結果を別タブで表示するため、元データが変化しないことが最大の魅力です。
ちなみにその結果は、外出先で微調整できる設定によってダイナミックに変化します。
繰り返されるレコードの場合、ピボットテーブルを使用すると、Google Sheetsで重複をカウントして削除することができます。
例1.Google Sheetsでピボットテーブルが重複をカウントする方法
- 次のページへ 挿入> ピボットテーブル をクリックし、データ範囲とピボット・テーブルの場所を指定します。
- ピボット・テーブル・エディタで、重複を示す列を追加します ( 名称 に対して 列 とのことです。 価値観 .
カラムに数値レコードが含まれる場合、COUNTを要約関数として選択し 価値観 は、Google Sheetsで重複をカウントするために使用します。 テキストがある場合は、代わりにCOUNTAを選択してください。
正しく操作すれば、ピボット・テーブルにリストの各項目が表示され、その回数が表示されます。
このピボットテーブルを見ると、ブラックベリーとチェリーだけがデータセットに再登場していることがわかります。
例2.ピボットテーブルを使ってGoogle Sheetsの重複を削除する
ピボット・テーブルを使用して重複を削除するには、残りの列 (この例では 2 つ) を次のように追加します。 列 を使用して、ピボット・テーブルを作成します。
重複した行を含むテーブルが表示されますが、どの行が元のデータセットに再表示されているかは数字でわかります。
ヒント:数字が不要になったら、そのまま 価値観 のボックスの右上にある対応するアイコンを押して、ピボットテーブルを表示します。
最終的にピボット・テーブルはこのような形になります。
重複や余分な計算がなく、ユニークなレコードが1つのテーブルに並べられるだけです。
標準的なデータクリーンアップツール「Remove Duplicates
Google Sheetsは、重複を除去するための小さくシンプルなツールを備えています。 これは、その操作にちなんで名付けられ、以下の場所にあります。 データ> データクリーンアップ タブで表示します。
テーブルのヘッダー行を指定し、重複をチェックする列を選択するだけで、派手さはありません。
準備ができたら、大きな緑色のボタンをクリックすると、Google Sheetsのテーブルから重複する行を見つけて削除し、ユニークな行がいくつ残っているかを表示します。
しかし、このツールはここまでです。 重複を処理する必要があるたびに、このユーティリティを手動で実行する必要があります。 また、このツールは重複を削除するだけで、別の処理を行うオプションはありません。
幸いなことに、AblebitsのGoogle Sheets用重複排除アドオンでは、これらの欠点がすべて解決されています。
Google Sheets用重複排除アドオン
Remove Duplicatesアドオンは、Google Sheetsの重複を識別するための5つのツールを備えています。 しかし、今日は、次のものを見てみましょう。 重複または一意な行の検索 .
重複を処理するための7つの方法を提供するだけでなく、そのプロセス全体を高速化するだけでなく、完全に自動化する方法を知っています。
Google Workspace Marketplaceからインストールすると、以下のように表示されます。 エクステンション :
Google Sheetsの標準ツールと同様に、処理する範囲と列を選択することもできますが、よりエレガントなものになります :)
すべての設定は4つのステップに分かれており、使いやすいように選択することができます。
- 範囲
- 何を探すか:デュープかユニックか
- じょうぶ
- どうすりゃいいんだ
特別な写真も見ることができるので、何をすればいいのかが一目瞭然です。
と思われるかもしれませんが、このアドオンは標準のツールとは異なり、非常に多くのことを提供します。
- 掬い取る のみならず 1回目の発生を含む、または含まない
- ハイライト Google Sheetsの複製
- ステータスカラムを追加する
- コピー/ムーブ じっせき を新しいシート/スプレッドシートにコピーする またはスプレッドシート内の特定の場所
- 晴朗 つくる 価値観 細胞から
- ふせぐ をGoogleシートから完全に削除します。
あなたの好みに合った方法を選び、オプションを選択すれば、あとはアドオンにお任せください。
ヒント:このビデオは少し古いものですが、アドオンを使った作業がいかに簡単であるかを完璧に示しています。
アドオンで重複を自動的に削除するようにする
さらに、4つのステップで設定した内容をシナリオとして保存し、後でどのテーブルでもクリックするだけで実行することができます。
さらに、毎日決まった時間に自動的に起動するよう、シナリオをスケジュールするのもよいでしょう。
このアドオンは、ファイルを閉じたときやオフラインのときでも自動的に重複を削除します。 もっと詳しく知りたい方は、この詳細なチュートリアルとデモビデオをご覧ください。
Google Sheetsのストアからアドオンをインストールして、いろいろと試してみてください。 数回のクリックで、数式を使わずに重複を見つけ、削除し、ハイライトすることがいかに簡単かわかると思います。
表計算ソフトの計算式例
Google Sheetsで重複を検索&削除する - 計算式の例(スプレッドシートのコピーを作成する)