Table of contents
你在寻找一种简单的方法来寻找谷歌表格中的重复内容吗? 7种方法怎么样? 这就是你在众多使用案例中所需要的:)我将向你展示如何使用无公式工具(没有编码--保证!)、条件格式化和一些狂热的公式爱好者的简单函数。
无论你多么频繁地使用谷歌表,你都有可能要处理重复的数据。 这些记录可能出现在一列中,也可能占据整个行。
在本文结束时,你将知道 你需要的一切,以消除重复,计算它们,突出显示和识别状态。 我将展示一些公式的例子,并分享不同的工具。 其中一个工具甚至可以按计划找到并删除你的谷歌表格中的重复内容!条件格式化也将派上用场。
只要选择你的毒药,我们就开始吧 :)
如何使用公式在谷歌表格中查找重复的内容
传统上,我会从公式开始。 它们的主要优点是你的原始表格保持不变。 公式会识别重复的内容,并将结果返回到你的Google表的其他地方。 而根据所需的结果,不同的函数会有不同的作用。
如何使用UNIQUE函数删除Google表单中的重复内容
UNIQUE函数扫描你的数据,删除重复的数据,并准确地返回它的名字--唯一值/行。
这里有一个小的样本表,其中不同的行会重复出现。
例1.删除重复的行,保留第1次出现的行
一方面,你可能需要从这个谷歌表中删除所有重复的行,只保留第一个条目。
要做到这一点,只需在UNIQUE里面输入你的数据范围。
=unique(a1:c10)
这个小公式返回所有唯一的行和所有第1次出现的行,忽略第2次、第3次等。
例2.删除所有重复的行,甚至是第一次出现的行
另一方面,你可能只想获得 "真正的 "唯一行。 我所说的 "真正的 "是指那些不重复出现的行--甚至一次也没有。 那么你该怎么做呢?
让我们花点时间,看看所有的唯一论点。
UNIQUE(range,[by_column],[exact_once])- 范围 - 是你要处理的数据。
- [by_column] - 告诉你是检查完全匹配的行还是单个列中的单元格。 如果是列,输入TRUE。 如果是行,输入FALSE或直接跳过该参数。
- [exactly_once] - 这个参数告诉函数不仅要删除Google Sheets中的重复记录,还要删除它们的第1个条目。 或者,换句话说,只返回没有任何重复的记录。 为此,你要输入TRUE,否则输入FALSE或跳过这个参数。
最后一个论点是你在这里的筹码。
因此,要想从谷歌表中完全删除所有重复的行(以及它们的第1行),请跳过公式中的第二个参数,但添加第三个参数。
=unique(a1:c10,,true)
看到右边的表格如何缩短了吗? 这是因为UNIQUE发现并删除了重复的行以及它们在原始Google表中的第一次出现。 现在只剩下唯一的行了。
使用谷歌表的COUNTIF功能识别重复的内容
如果用另一个数据集占用空间不是你计划的一部分,你可以在谷歌表格中计算重复的数据(然后手动删除)。 这只需要一个额外的列,COUNTIF函数会有帮助。
如果你不熟悉这个功能,我们有一整篇关于它的博文,随时可以看看。
例1.获得总的出现次数
让我们用谷歌表格中的第1次出现来识别所有的重复,并检查列表中出现的每种浆果的总数。 我将在D2中使用以下公式,然后将其复制到列中。
=countif($b$2:$b$10,$b2)
提示:要使这个公式自动处理列中的每一行,请用ArrayFormula包住所有内容,并改变 $B2 至 $B2:$B10 (因此,你不需要把公式复制下来。
如果之后你通过数字过滤这个数据集,你将能够看到,甚至从你的谷歌表中手动删除所有多余的重复行。
例2.查找和列举谷歌表格中的所有重复内容
如果出现的总数不是你的目标,而你更想知道这一行的特定记录是否是第1条、第2条,等等,你需要对公式稍作调整。
从整列中改变范围 ($B$2:$B$10) 只有一个细胞 ($B$2:$B2) .
注意,要注意使用绝对引用。
=countif($b$2:$b2,$b2)
这一次,从这个谷歌表格中删除任何或所有重复的条目将更加容易,因为你将能够隐藏除第一条以外的所有条目。
例3.计算Google表的重复行数
虽然上述公式只计算谷歌表一列中的重复数据,但你可能需要一个考虑所有列的公式,从而识别重复的行。
在这种情况下,COUNTIFS会更合适。 只要把你的表的每一列和它相应的标准列出来就可以了。
=counttifs($a$2:$a$10,$a2,$b$2:$b$10,$b2,$c$2:$c$10,$c2)
提示:还有一种计算重复的方法--没有公式。 它涉及一个数据透视表,我将进一步介绍。
在一个状态栏中标记重复的内容--IF功能
有时数字是不够的。 有时最好找到重复的,并在状态栏中标记它们。 同样:以后通过这一栏过滤你的谷歌表数据,可以让你删除那些你不再需要的重复数据。
例1.在1个Google表列中查找重复的内容
对于这项任务,你将需要同样的COUNTIF函数,但这次是用IF函数包裹的。 就像这样。
=IF(COUNTIF($B$2:$B$10,$B2)>1, "重复", "独特")
让我们看看在这个公式中会发生什么。
- 首先,COUNTIF在整个B列中搜索来自B2的浆果。 一旦找到,它就把它们加起来。
- 然后,IF检查这个总数,如果它大于1,它说 重复的 ,否则。 独特的 .
当然,你可以让该公式返回你自己的状态,或者,例如,找到&;在你的谷歌表格数据中只识别重复的数据。
=IF(COUNTIF($B$2:$B$10,$B2)>1, "重复",")
提示:一旦你发现这些重复的记录,你可以通过状态列过滤表格,这种方式可以让你隐藏重复或唯一的记录,甚至可以选择整个行&;从你的Google表中完全删除这些重复的记录。
例2.识别重复的行
同样,你可以标记绝对重复的行--所有列中的所有记录在表中出现多次的行。
- 从之前的COUNTIFS开始--扫描每一列的第一个值,只计算那些所有3列的记录都重复的行。
=counttifs($a$2:$a$10,$a2,$b$2:$b$10,$b2,$c$2:$c$10,$c2)
- 它检查重复的行数,如果超过1,该公式将该行命名为重复行。
=IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)>1, "重复的","")
现在只有2个重复,因为即使樱桃在一个表中出现了3次,但其中只有两个的3列都是相同的。
例3.寻找重复的行,忽略第1个条目
要忽略第1次出现的情况,只标记第2次和其他情况,请参考表格的第一个单元格,而不是整个列。
=IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$C$2:$C2,$C2)>1, "重复","")
提示:如果你使用的是Microsoft Excel,下面的例子可能对你有帮助:如何在Excel中寻找重复的内容。
用条件格式化规则识别并突出显示谷歌表格中的重复内容
有可能以这样的方式处理重复的数据,只要看一眼你的表就能清楚地了解这是否是一条重复的记录。
我说的是在谷歌表格中突出显示重复的内容。 条件性格式化会帮助你做到这一点。
提示:从未尝试过条件格式化吗? 不用担心,我们在这篇文章中解释了它是如何工作的。
以下是你需要做的事情。
- 打开条件格式化设置。 格式化> 条件性格式化 .
- 请确保 适用于范围 在这个例子中,让我从B列开始。
- 在 格式规则 挑选 自定义公式是 并输入我上面介绍的那个COUNTIF。
=COUNTIF($B$2:$B$10,$B2)>1
一旦它找到了在B列中至少出现两次的记录,它们就会被染上你所选择的色调。
另一个选择是突出显示重复的行。 只需调整适用规则的范围即可。
提示:一旦你在谷歌表格中突出显示重复的内容,你可以通过颜色过滤数据。
- 一方面,你可以对该列进行过滤,使其只有具有白色填充颜色的单元格保持可见。 这样,你就会从视图中删除重复的内容。
- 另一方面,你可以只保留有颜色的单元格可见。
然后选择这些行,并从你的谷歌表格中完全删除这些重复的行。
提示:请访问本教程,了解更多在谷歌表格中突出显示重复内容的公式。
在谷歌表格中查找和删除重复内容的无公式方法
公式和条件格式化是很好的,但还有其他工具可以帮助你找到重复的内容。 其中有两个工具是为这个特殊问题设计的。
用谷歌表格的透视表识别重复的内容
数据透视表在电子表格中用于扭转你的数据,使你的表格易于阅读和理解。 它是一种呈现你的数据集的替代方式。
这里最吸引人的是,你的原始数据不会改变。 数据透视表将其作为参考,并在一个单独的标签中提供结果。
顺便说一下,这个结果将根据你可以在路上调整的设置而动态变化。
在重复记录的情况下,数据透视表将帮助你在谷歌表格中计算和删除重复的记录。
例1.数据透视表如何计算谷歌表的重复数
- 转到 插入> 透视表 指定你的数据范围和透视表的位置。
- 在数据透视表编辑器中,为你的重复数据添加一列( 命名 在我的例子中)为 行数 和为 价值观 .
如果你的列包含数字记录,请选择COUNT作为一个总结性函数,用于 价值观 如果你有文本,选择COUNTA代替。
如果你做得正确,透视表将以你的清单中的每个项目为特征,并得到它在那里出现的次数。
正如你所看到的,这个透视表显示,只有黑莓和樱桃在我的数据集中重复出现。
例2.使用数据透视表删除谷歌表中的重复内容
要使用数据透视表删除重复的数据,你需要将其余的列(在我的例子中是2列)添加为 行数 为你的透视表。
你会看到表中有重复的行,但数字会告诉你其中哪些行在原始数据集中重新出现。
提示:如果你不再需要这些数字,只要关闭 价值观 按右上角的相应图标,就可以在数据透视表中的方框中找到。
这就是你的数据透视表最终的模样。
没有重复的,没有额外的计算。 只有唯一的记录被整理在一个表中。
删除重复数据--标准数据清理工具
谷歌表的特点是他们的小的、简单的、不挑剔的工具来删除重复的内容。 它被称为其操作后,驻扎在 数据> 数据清理 标签。
你不会发现这里有什么花哨的东西,一切都超级直接。 你只需指定你的表是否有标题行,并选择所有应检查重复的列。
一旦你准备好了,点击那个大的绿色按钮,该工具将从你的谷歌表格中找到并删除重复的行,并说明还有多少唯一的行。
唉,这个工具也就到此为止了。 每次你需要处理重复的东西时,你都必须手动运行这个工具。 而且,这就是它的全部功能:删除重复的东西。 没有选择以不同方式处理它们。
幸运的是,所有这些缺点都已在Ablebits公司为谷歌表提供的Remove Duplicates插件中得到解决。
移除谷歌表格中的重复内容插件
Remove Duplicates插件是一个真正的游戏改变者。 首先,它包含5个不同的工具来识别谷歌表格中的重复内容。 但今天让我们看一下 查找重复或唯一的行 .
仅仅是它就提供了7种不同的处理重复的方法,而且它不仅仅是加快整个过程。 它知道如何将其完全自动化。
一旦你从Google Workspace Marketplace安装了它,它将出现在 延伸 :
作为标准的谷歌表工具,它也可以让你选择要处理的范围和列,但更优雅 :)
所有的设置都分为4个用户友好的步骤,你要选择。
- 范围
- 要找的东西:赝品或独角兽
- 列
- 如何处理找到的记录
你甚至可以偷看特殊的图片,这样就可以随时清楚地知道该做什么。
你可能会想,这有什么意义呢? 好吧,与标准工具不同,这个附加组件提供了很多东西。
- 找到重复的 以及 包括或不包括第1次出现的独居者
- 亮点 谷歌表格中的重复内容
- 增加一个状态栏
- 复制/移动 结果 到一个新的工作表/电子表格 或你的电子表格中的任何特定位置
- 清楚 发现 价值 来自细胞的
- 删除重复的行 从你的谷歌工作表完全
只要选择最适合你的方式,选择选项,让附加组件完成工作。
提示:这段视频可能有点老,但它完美地展示了使用该附加组件是多么容易。
让附加组件自动删除重复的内容
作为锦上添花,你将能够把所有4个步骤的所有设置保存到方案中,以后只需点击一下就可以在任何桌子上运行。
或者--更好的是--安排这些场景在每天的某个时间自动启动。
你不需要在场,即使文件关闭或你离线,该插件也会自动删除重复的文件。 要了解更多信息,请访问这个详细的教程和观看这个演示视频。
我鼓励你从谷歌表格商店安装这个插件,并仔细研究一下。 你会发现,只需点击几下,就可以在没有公式的情况下查找、删除和突出显示重复的内容,这是很容易的。
带公式的电子表格示例
查找&删除谷歌表格中的重复内容--公式示例(制作电子表格的副本)