7 простих способів знайти та видалити дублікати в Google Таблицях

  • Поділитися Цим
Michael Brown

Зміст

Шукаєте простий спосіб знайти дублікати в Google Sheets? Як щодо 7 способів? :) Це все, що вам потрібно для численних випадків використання :) Я покажу вам, як використовувати інструменти без формул (ніякого кодування - обіцяю!), умовне форматування і кілька простих функцій для завзятих шанувальників формул.

Як би часто ви не користувалися таблицями Google, скоріш за все, вам доводиться стикатися з дублюванням даних. Такі записи можуть з'являтися в одному стовпчику або займати цілі рядки.

По закінченню цієї статті ви будете знати все необхідне для видалення дублікатів, їх підрахунку, виділення та ідентифікації зі статусом. Покажу кілька прикладів формул та поділюся різними інструментами. Один з них навіть знаходить і видаляє дублікати у ваших Google Таблицях за розкладом! У нагоді також стане умовне форматування.

Просто виберіть свою отруту і поїхали :)

    Як знайти дублікати в Google Таблицях за допомогою формул

    Традиційно почну з формул. Їх головна перевага в тому, що ваша вихідна таблиця залишається недоторканою. Формули виявляють дублікати і повертають результат в якесь інше місце ваших Google Sheets. А вже виходячи з бажаного результату, різні функції роблять свою справу.

    Як видалити дублікати в Google Таблицях за допомогою функції UNIQUE

    Функція UNIQUE сканує ваші дані, видаляє дублікати і повертає саме те, про що говорить її назва - унікальні значення/рядки.

    Ось невеликий зразок таблиці, де різні рядки повторюються:

    Приклад 1. Видаляємо дублікати рядків, зберігаємо 1-е входження

    З одного боку, вам може знадобитися видалити всі рядки, що повторюються, з цієї таблиці Google Sheets і залишити тільки перші записи.

    Для цього просто введіть діапазон для ваших даних в UNIQUE:

    =UNIQUE(A1:C10)

    Ця невелика формула повертає всі унікальні рядки і всі 1-е входження, ігноруючи 2-е, 3-є і т.д.

    Приклад 2: Видалити всі рядки, що повторюються, навіть 1-е входження

    З іншого боку, ви можете захотіти отримати тільки "справжні" унікальні рядки. Під "справжніми" я маю на увазі ті, які не повторюються - жодного разу. Що ж робити?

    Давайте зупинимося і розглянемо всі УНІКАЛЬНІ аргументи:

    UNIQUE(range,[by_column],[exactly_once])
    • діапазон - це дані, які ви хочете обробляти.
    • [by_column] (по_колонці) - вказує, чи перевіряти повністю збіг рядків або комірок в окремих стовпчиках. Якщо це стовпчики, введіть TRUE, якщо це рядки, введіть FALSE або просто пропустіть аргумент.
    • [рівно_один раз]. - цей вказує функції видаляти не тільки дублікати в Google Sheets, але і їх перші записи. Або, іншими словами, повертати тільки записи без дублікатів. Для цього ви ставите TRUE, інакше FALSE або пропускаєте аргумент.

    Останній аргумент - це ваш важіль впливу.

    Таким чином, щоб повністю видалити всі дублікати рядків з Google Таблиць (разом з їх 1-м), пропустіть другий аргумент у формулі, але додайте третій:

    =UNIQUE(A1:C10,,TRUE)

    Бачите, що таблиця праворуч стала набагато коротшою? Це тому, що UNIQUE знайшов і видалив дублікати рядків, а також їх перші входження з вихідної таблиці Google Sheets. Тепер залишилися тільки унікальні рядки.

    Виявлення дублікатів за допомогою функції Google Sheets COUNTIF

    Якщо займати місце іншим набором даних не входить у ваші плани, ви можете порахувати дублікати в Google Таблицях (а потім видалити їх вручну). Для цього знадобиться лише один додатковий стовпчик, а функція COUNTIF допоможе.

    Порада: якщо ви не знайомі з цією функцією, у нас є ціла стаття в блозі про неї, будь ласка, ознайомтеся.

    Приклад 1: Отримати загальну кількість входжень

    Давайте визначимо всі дублікати з їх 1-ми входженнями в Google Sheets і перевіримо загальну кількість кожної ягоди, що з'явилася в списку. Я буду використовувати наступну формулу в D2, а потім скопіюю її вниз по стовпчику:

    =COUNTIF($B$2:$B$10,$B2)

    Порада. Щоб ця формула обробляла кожен рядок у стовпці автоматично, оберніть все в ArrayFormula і змініть $B2 до $B2:$B10 (Таким чином, вам не потрібно буде копіювати формулу вниз:

    Якщо після цього відфільтрувати цей набір даних за номерами, то можна буде побачити і навіть видалити всі зайві рядки-дублікати з таблиці Google Sheets вручну:

    Приклад 2: Знайти та перерахувати всі дублікати в Google Таблицях

    Якщо загальна кількість входжень не є Вашою метою, і Ви бажаєте знати, чи є цей конкретний запис у цьому конкретному рядку 1-м, 2-м і т.д. записом, Вам необхідно внести невеликі корективи у формулу.

    Змінити діапазон з усього стовпця ($B$2:$B$10) в одну камеру ($B$2:$B2) .

    Примітка: зверніть увагу на використання абсолютних посилань.

    =COUNTIF($B$2:$B2,$B2)

    Цього разу видалити будь-який або всі дублікати з цієї таблиці Google Sheets буде ще простіше, оскільки ви зможете приховати всі записи, крім 1-го:

    Приклад 3. Підрахунок дубльованих рядків у Google Таблицях

    Хоча наведені вище формули підраховують дублікати лише в одному стовпчику Google Sheets, вам може знадобитися формула, яка враховує всі стовпчики і, таким чином, ідентифікує дублікати рядків.

    У цьому випадку краще підійде COUNTIFS - просто перерахуйте кожен стовпець Вашої таблиці разом з відповідними критеріями:

    =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    Порада. Існує ще один спосіб підрахунку дублікатів - без формул. Він передбачає використання зведеної таблиці, і я опишу його далі.

    Відмічати дублікати в колонці статусу - функція IF

    Іноді просто не вистачає цифр, іноді краще знайти дублікати і позначити їх у колонці статусу. Знову ж таки: фільтрування даних у Google Таблицях за цією колонкою пізніше дозволить вам видалити ті дублікати, які вам більше не потрібні.

    Приклад 1. Пошук дублікатів в 1 стовпці Google Таблиці

    Для цього завдання вам знадобиться та ж функція COUNTIF, але на цей раз загорнута в функцію IF. Ось так:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Дублікат", "Унікальний")

    Давайте подивимося, що виходить в цій формулі:

    1. Спочатку COUNTIF шукає по всьому стовпчику B ягоду з B2, а коли знаходить, то підсумовує їх.
    2. Потім IF перевіряє цю суму, і якщо вона більша за 1, то пише Дублікат В іншому випадку, Унікальний .

    Звичайно, ви можете отримати формулу для повернення власних статусів, або, наприклад, знайти & виявити тільки дублікати в даних ваших Google Таблиць:

    =IF(COUNTIF($B$2:$B$10,$B2)>1, "Дублікат","")

    Порада. Як тільки ви знайдете ці дублікати, ви можете відфільтрувати таблицю за стовпчиком стану. Це дозволить вам приховати повторювані або унікальні записи, і навіть виділити цілі рядки і повністю видалити ці дублікати з ваших Google Таблиць:

    Приклад 2. Виявлення дубльованих рядків

    Аналогічно можна позначити абсолютні дублікати рядків - рядки, в яких всі записи у всіх стовпцях зустрічаються в таблиці кілька разів:

    1. Почніть з тієї ж самої COUNTIFS, що й раніше - тієї, яка сканує кожен стовпець на предмет його першого значення і рахує тільки ті рядки, де всі 3 записи у всіх 3 стовпцях повторюються:

      =COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,$B2,$C$2:$C$10,$C2)

    2. Потім помістіть цю формулу в IF. Вона перевіряє кількість повторюваних рядків, і якщо вона перевищує 1, формула називає рядок дублікатом:

      =IF(COUNTIFS($A$2:$A$10,$A2,$B$2:$B$10,B2,$C$2:$C$10,$C2)>1, "Дублікат","")

    Тепер є тільки 2 дублі, тому що хоча вишня зустрічається в таблиці 3 рази, тільки у двох з них всі 3 стовпчики ідентичні.

    Приклад 3. знайти рядки, що повторюються, ігнорувати 1-й запис

    Для того, щоб проігнорувати 1-й випадок і відмітити лише 2-й та інші, слід звертатися до перших клітинок таблиці, а не до цілих стовпчиків:

    =IF(COUNTIFS($A$2:$A2,$A2,$B$2:$B2,$B2,$C$2:$C2,$C2)>1, "Дублікат","")

    Порада: Якщо ви використовуєте Microsoft Excel, наступні приклади можуть бути корисними: Як знайти дублікати в Excel.

    Виявлення та виділення дублікатів в таблицях Google за допомогою умовних правил форматування

    Є можливість обробляти повторювані дані таким чином, що один погляд на вашу таблицю дасть вам чітке розуміння, чи це не дублікат запису.

    Мова йде про виділення дублікатів в Google Таблицях. У цьому вам допоможе умовне форматування.

    Порада. Ніколи не пробували умовне форматування? Не хвилюйтеся, ми пояснили, як воно працює в цій статті.

    Ось що вам потрібно зробити:

    1. Відкрити налаштування умовного форматування: Формат> Умовне форматування .
    2. Переконайтеся в тому, що Застосувати до діапазону Поле містить діапазон, в якому ви хочете виділити дублікати. Для цього прикладу почнемо зі стовпчика B.
    3. В Правила формату вибирати Спеціальна формула виглядає наступним чином і введіть той самий COUNTIF, який я представив вище:

      =COUNTIF($B$2:$B$10,$B2)>1

    Після того, як він знайде записи, які з'являються принаймні двічі в колонці B, вони будуть забарвлені у вибраний вами відтінок:

    Іншим варіантом може бути виділення повторюваних рядків. Просто налаштуйте діапазон, до якого буде застосовано правило:

    Порада. Після того, як ви виділите дублікати в Google Таблицях, ви можете відфільтрувати дані за кольором:

    • З одного боку, ви можете відфільтрувати стовпець таким чином, щоб залишилися видимими тільки клітинки з білим кольором заливки. Таким чином, ви видалите дублікати з подання:

    • З іншого боку, можна залишити видимими тільки кольорові клітинки:

    а потім виділіть ці рядки і повністю видаліть ці дублікати з ваших Google Таблиць:

    Порада. Відвідайте цей підручник, щоб дізнатися більше формул для виділення дублікатів в таблицях Google.

    Безформульні способи пошуку та видалення дублікатів в Google Таблицях

    Формули та умовне форматування - це добре, але є й інші інструменти, які допоможуть знайти дублікати. Два з них були розроблені саме для цієї проблеми.

    Виявлення дублікатів за допомогою зведеної таблиці для Google Sheets

    Зведені таблиці використовуються в електронних таблицях для того, щоб перевернути ваші дані і зробити ваші таблиці легкими для читання і розуміння. Це свого роду альтернативний спосіб представлення ваших наборів даних.

    Найпривабливішим тут є те, що ваші вихідні дані не змінюються. Зведена таблиця використовує їх як посилання і надає результат в окремій вкладці.

    Цей результат, до речі, буде динамічно змінюватися в залежності від налаштувань, які ви можете змінювати на ходу.

    У разі повторення записів зведена таблиця допоможе порахувати і видалити дублікати в Google Таблицях.

    Приклад 1. Як зведена таблиця підраховує дублікати в Google Sheets

    1. Перейдіть до Вставка> Зведена таблиця , вкажіть діапазон даних і місце для зведеної таблиці:

    2. У редакторі зведеної таблиці додайте стовпець з вашими дублікатами ( Ім'я та прізвище в моєму прикладі) для Ряди і для Цінності .

      Якщо ваш стовпець містить числові записи, виберіть COUNT як функцію підсумовування для Цінності для підрахунку дублікатів в Google Таблицях. Якщо у вас є текст, замість цього виберіть COUNTA:

    Якщо все зроблено правильно, у зведеній таблиці буде відображено кожен елемент зі списку і вказано, скільки разів він там з'являється:

    Як бачите, ця зведена таблиця показує, що лише ожина та вишня повторюються в моєму наборі даних.

    Приклад 2. Видалення дублікатів в Google Таблицях за допомогою зведеної таблиці

    Щоб видалити дублікати за допомогою зведеної таблиці, потрібно додати інші ваші стовпці (2 в моєму прикладі) як Ряди для вашої зведеної таблиці:

    Ви побачите таблицю з повторюваними рядками, але номери покажуть, які з них повторюються у вихідному наборі даних:

    Порада: якщо вам більше не потрібні цифри, просто закрийте вікно Цінності у зведеній таблиці, натиснувши відповідну піктограму у її правому верхньому куті:

    Ось так виглядатиме ваша зведена таблиця в кінцевому підсумку:

    Ніяких дублікатів, ніяких зайвих обчислень - просто унікальні записи впорядковані в одній таблиці.

    Видалення дублікатів - стандартний інструмент очищення даних

    Таблиці Google мають свій невеликий, простий і невибагливий інструмент для видалення дублікатів. Він називається після його роботи і знаходиться в розділі Очищення даних рахунок:

    Тут ви не знайдете нічого хитромудрого, все дуже просто. Ви просто вказуєте, чи є у вашій таблиці заголовний рядок, і виділяєте всі ті стовпці, які потрібно перевірити на наявність дублікатів:

    Коли ви будете готові, натисніть велику зелену кнопку, і інструмент знайде та видалить дублікати рядків з вашої таблиці Google Таблиці та повідомить, скільки унікальних рядків залишилося:

    На жаль, на цьому можливості цього інструменту не вичерпуються. Кожного разу, коли вам знадобиться розібратися з дублікатами, вам доведеться запускати цю утиліту вручну. Крім того, це все, що вона робить: видаляє дублікати. Немає можливості обробити їх по-іншому.

    На щастя, всі ці недоліки були вирішені в доповненні Видалення дублікатів для Google Таблиць від Ablebits.

    Видалення дублікатів для Google Таблиць

    Доповнення Remove Duplicates дійсно змінює правила гри. Почнемо з того, що воно містить 5 різних інструментів для виявлення дублікатів в таблицях Google. Але на сьогоднішній день давайте подивимося на Пошук повторюваних або унікальних рядків .

    Лише вона пропонує 7 різних способів роботи з дублікатами і не просто прискорює весь процес, а знає, як його повністю автоматизувати.

    Після встановлення з Google Workspace Marketplace він з'явиться в розділі Розширення :

    Як і стандартний інструмент Google Sheets, він також дозволяє вибрати діапазон і стовпці для обробки, але більш елегантно :)

    Всі налаштування розділені на 4 зручних для користувача кроки, на яких ви маєте зробити вибір:

    1. діапазон
    2. що шукати: дублікати чи унікальні екземпляри
    3. колонки
    4. що робити зі знайденими записами

    Можна навіть підглянути спеціальні картинки, щоб завжди було зрозуміло, що робити:

    У чому сенс, запитаєте ви? На відміну від стандартного інструменту, це доповнення пропонує набагато більше:

    • знайти дублікати а також унікальності з урахуванням або без урахування 1-го входження
    • родзинка дублікати в Google Таблицях
    • додати колонку статусу
    • копіювати/переміщати результати на новий аркуш/таблицю або будь-яке конкретне місце у вашій електронній таблиці
    • ясний знайдений цінності з клітин
    • видалити дублікати рядків з вашого Google аркуша повністю

    Просто виберіть той спосіб, який вам найбільше підходить, виберіть опції і дозвольте доповненню зробити свою роботу.

    Порада: це відео, можливо, трохи застаріле, але воно чудово демонструє, наскільки легко працювати з доповненням:

    Зробити так, щоб доповнення автоматично видаляло дублікати

    Як вишенька на торті, ви зможете зберегти всі налаштування з усіх 4-х кроків у сценарії і запустити їх пізніше на будь-якому столі одним клацанням миші.

    Або - ще краще - запланувати автоматичний запуск цих сценаріїв у певний час щодня:

    Ваша присутність не є обов'язковою, а додаток автоматично видалить дублікати, навіть якщо файл закрито або ви не в мережі. Щоб дізнатися більше про це, будь ласка, відвідайте цей детальний посібник та перегляньте це демонстраційне відео:

    Я рекомендую вам встановити додаток з магазину Google Таблиць і попрацювати з ним. Ви побачите, як легко знаходити, видаляти і виділяти дублікати без формул всього за кілька кліків.

    Електронна таблиця з прикладами формул

    Знайдіть та видаліть дублікати в Google Таблицях - приклади формул (зробіть копію таблиці)

    Майкл Браун — відданий ентузіаст технологій із пристрастю до спрощення складних процесів за допомогою програмних засобів. Маючи понад десятирічний досвід роботи в технологічній індустрії, він відточив свої навички роботи з Microsoft Excel і Outlook, а також із Google Таблицями та Документами. Блог Майкла присвячений тому, щоб поділитися своїми знаннями та досвідом з іншими, надаючи прості поради та навчальні посібники для підвищення продуктивності та ефективності. Незалежно від того, чи є ви досвідченим професіоналом чи початківцем, блог Майкла пропонує цінну інформацію та практичні поради щодо отримання максимальної користі від цих основних програмних інструментів.