Ekstrak data daripada Helaian Google: teks tertentu daripada rentetan, URL daripada pautan dan banyak lagi

  • Berkongsi Ini
Michael Brown

Bit seterusnya operasi kami dengan teks dalam hamparan ditumpukan kepada pengekstrakan. Ketahui cara untuk mengekstrak pelbagai data — teks, aksara, nombor, URL, alamat e-mel, tarikh & masa, dsb. — daripada pelbagai kedudukan dalam berbilang sel Helaian Google serentak.

    Formula Helaian Google untuk mengekstrak teks dan nombor daripada rentetan

    Formula dalam Google Cadar adalah segala-galanya. Walaupun beberapa kombo menambah teks & nombor dan alih keluar pelbagai aksara, sesetengah daripadanya turut mengekstrak teks, nombor, aksara berasingan, dsb.

    Ekstrak data mengikut kedudukan: aksara N pertama/akhir/tengah

    Fungsi paling mudah untuk ditangani apabila anda akan mengeluarkan data daripada sel Helaian Google ialah KIRI, KANAN dan TENGAH. Mereka mendapat sebarang data mengikut kedudukan.

    Ekstrak data dari permulaan sel dalam Helaian Google

    Anda boleh mengeluarkan N aksara pertama dengan mudah menggunakan fungsi LEFT:

    LEFT(rentetan, [number_of_character])
    • rentetan ialah teks tempat anda ingin mengekstrak data.
    • bilangan_aksara ialah bilangan aksara untuk dikeluarkan bermula dari kiri.

    Berikut ialah contoh paling mudah: mari keluarkan kod negara daripada nombor telefon:

    Seperti yang anda lihat, negara kod mengambil 6 simbol pada permulaan sel, jadi formula yang anda perlukan ialah:

    =LEFT(A2,6)

    Petua. ArrayFormula akan memungkinkan untuk mendapatkan 6 aksara daripadakeseluruhan julat sekali gus:

    =ArrayFormula(LEFT(A2:A7,6))

    Ekstrak data daripada hujung sel dalam Helaian Google

    Untuk mengeluarkan N aksara terakhir daripada sel, gunakan fungsi RIGHT sebaliknya:

    RIGHT(rentetan,[number_of_characters])
    • rentetan masih merupakan teks (atau rujukan sel) untuk mengekstrak data daripadanya.
    • number_of_character juga ialah bilangan aksara yang perlu diambil dari sebelah kanan.

    Mari kita dapatkan nama negara itu daripada nombor telefon yang sama:

    Ia hanya mengambil 2 aksara dan itulah yang saya nyatakan dalam formula:

    =RIGHT(A2,2)

    Petua. ArrayFormula juga akan membantu anda mengekstrak data dari penghujung semua sel Helaian Google sekaligus:

    =ArrayFormula(RIGHT(A2:A7,2))

    Ekstrak data dari tengah sel dalam Helaian Google

    Jika terdapat fungsi untuk mengekstrak data dari awal dan akhir sel, mesti ada fungsi untuk mengekstrak data dari tengah juga. Dan ya — ada satu.

    Ia dipanggil MID:

    MID(rentetan, starting_at, extract_length)
    • rentetan — teks yang ingin anda keluarkan bahagian tengah dari.
    • starting_at — kedudukan watak yang anda mahu mulakan mendapatkan data.
    • extract_length — nombor daripada aksara yang perlu anda keluarkan.

    Dengan contoh nombor telefon yang sama, mari cari nombor telefon itu sendiri tanpa kod negara dan negaranyasingkatan:

    Memandangkan kod negara berakhir dengan aksara ke-6 dan yang ke-7 ialah sempang, saya akan menarik nombor bermula dari digit ke-8. Dan saya akan mendapat 8 digit kesemuanya:

    =MID(A2,8,8)

    Petua. Menukar satu sel kepada keseluruhan julat dan membungkusnya dalam ArrayFormula akan memberikan anda hasil untuk setiap sel sekaligus:

    =ArrayFormula(MID(A2:A7,8,8))

    Ekstrak teks/nombor daripada rentetan

    Kadangkala mengekstrak teks mengikut kedudukan (seperti yang ditunjukkan di atas) bukan pilihan. Rentetan yang diperlukan mungkin berada di mana-mana bahagian sel anda dan terdiri daripada bilangan aksara yang berbeza yang memaksa anda membuat formula yang berbeza untuk setiap sel.

    Tetapi Helaian Google tidak akan menjadi Helaian Google jika ia tidak mempunyai fungsi lain yang akan membantu untuk mengekstrak teks daripada rentetan.

    Mari kita semak beberapa cara yang mungkin ditawarkan hamparan.

    Ekstrak data sebelum teks tertentu — LEFT+SEARCH

    Bila-bila masa anda ingin mengekstrak data yang mendahului teks tertentu, gunakan LEFT + SEARCH:

    • LEFT digunakan untuk mengembalikan bilangan aksara tertentu dari permulaan sel (dari kiri)
    • SEARCH mencari aksara/rentetan tertentu dan mendapat kedudukannya.

    Gabungkan ini — dan LEFT akan mengembalikan bilangan aksara yang dicadangkan oleh SEARCH.

    Berikut ialah contoh: bagaimana anda mengekstrak kod teks sebelum setiap 'ea'?

    Ini ialah formula yang akan membantu anda dalam perkara yang serupakes:

    =LEFT(A2,SEARCH("ea",A2)-1)

    Berikut ialah perkara yang berlaku dalam formula:

    1. SEARCH("ea",A2 ) mencari 'ea' dalam A2 dan mengembalikan kedudukan di mana 'ea' itu bermula untuk setiap sel — 10.
    2. Jadi kedudukan ke-10 ialah tempat 'e' berada. Tetapi oleh kerana saya mahu semuanya betul-betul sebelum 'ea', saya perlu tolak 1 daripada kedudukan itu. Jika tidak, 'e' akan dikembalikan juga. Jadi saya mendapat 9 akhirnya.
    3. LEFT melihat A2 dan mendapat 9 aksara pertama.

    Ekstrak data selepas teks

    Di sana juga bermaksud untuk mendapatkan segala-galanya selepas rentetan teks tertentu. Tetapi kali ini, RIGHT tidak akan membantu. Sebaliknya, REGEXREPLACE mengambil giliran.

    Petua. REGEXREPLACE menggunakan ungkapan biasa. Jika anda tidak bersedia untuk berurusan dengan mereka, terdapat penyelesaian yang lebih mudah yang diterangkan di bawah. REGEXREPLACE(teks, ungkapan_biasa, penggantian)

    • teks ialah rentetan atau sel tempat anda ingin membuat perubahan
    • ungkapan_biasa ialah gabungan aksara yang bermaksud sebahagian daripada teks yang anda cari
    • penggantian ialah apa sahaja yang anda mahu dapatkan dan bukannya teks
    itu

    Jadi, bagaimanakah anda menggunakannya untuk mengekstrak data selepas teks tertentu — 'ea' dalam contoh saya?

    Mudah — menggunakan formula ini:

    =REGEXREPLACE(A2,"(.*)ea(.*)","$2")

    Biar saya terangkan cara formula ini berfungsi dengan tepat:

    1. A2 ialah sel yang saya keluarkan data daripada.
    2. "(.*)ea(.*)" ialah tetap sayaungkapan (atau anda boleh memanggilnya topeng). Saya mencari 'ea' dan meletakkan semua aksara lain ke dalam kurungan. Terdapat 2 kumpulan aksara — semua sebelum 'ea' ialah kumpulan pertama (.*) dan semua selepas 'ea' ialah kumpulan kedua (.*). Keseluruhan topeng itu sendiri diletakkan pada petikan berganda.
    3. "$2" ialah perkara yang saya mahu dapatkan — kumpulan kedua (oleh itu nombor 2) daripada hujah sebelumnya.

    Petua. Semua aksara yang digunakan dalam ungkapan biasa dikumpulkan pada halaman khas ini.

    Ekstrak nombor daripada sel Helaian Google

    Bagaimana jika anda ingin mengekstrak nombor sahaja apabila kedudukannya dan apa sahaja yang berlaku sebelum & selepas itu tidak penting?

    Topeng (a.k.a. ungkapan biasa) juga akan membantu. Malah, saya akan menggunakan fungsi REGEXREPLACE yang sama dan menukar ungkapan biasa:

    =REGEXREPLACE(A2,"[^[:digit:]]", "")

    1. A2 ialah sel tempat saya ingin mendapatkan nombor tersebut.
    2. "[^[:digit:]]" adalah ungkapan biasa yang mengambil semua kecuali digit. Simbol ^caret itulah yang menjadikan pengecualian untuk digit.
    3. "" menggantikan semua kecuali aksara angka dengan "tiada apa-apa". Atau, dengan kata lain, membuangnya sepenuhnya, hanya meninggalkan nombor dalam sel. Atau, mengekstrak nombor :)

    Ekstrak teks mengabaikan nombor dan aksara lain

    Dengan cara yang sama, anda boleh mengeluarkan hanya data abjad daripada sel Helaian Google. Penguncupan untuk ungkapan biasa yangsingkatan untuk teks dipanggil sewajarnya — alpha:

    =REGEXREPLACE(A2,"[^[:alpha:]]", "")

    Formula ini mengambil segala-galanya kecuali huruf (A-Z, a-z) dan secara literal menggantikannya dengan "tiada apa-apa" . Atau, dengan cara lain, keluarkan hanya huruf.

    Cara bebas formula untuk mengekstrak data daripada sel Helaian Google

    Jika anda sedang mencari cara mudah tanpa formula untuk mengekstrak pelbagai jenis data, anda telah datang ke tempat yang betul. Alat tambah Power Tools kami hanya mempunyai alatan untuk tugas itu.

    Ekstrak pelbagai jenis data menggunakan alat tambah Power Tools

    Alat pertama yang saya ingin anda ketahui ialah Extract . Ia melakukan apa yang anda cari dalam artikel ini — mengekstrak jenis data yang berbeza daripada sel Helaian Google.

    Tetapan mesra pengguna

    Semua kes yang saya bincangkan di atas tidak hanya boleh diselesaikan dengan add-on. Alat ini mesra pengguna jadi anda hanya perlu memilih julat yang ingin anda proses dan tandakan kotak pilihan yang diperlukan. Tiada formula, tiada ungkapan biasa.

    Ingat perkara kedua artikel ini dengan REGEXREPLACE dan ungkapan biasa? Begini cara mudahnya untuk alat tambah:

    Pilihan tambahan

    Seperti yang anda lihat, terdapat beberapa pilihan tambahan (hanya tandakan kotak) yang anda boleh hidupkan/matikan dengan cepat untuk mendapatkan hasil yang paling tepat:

    1. Dapatkan rentetan huruf kecil yang diperlukan sahaja.
    2. Tarik keluar semua kejadian daripada setiapsel dan letakkannya dalam satu sel atau lajur yang berasingan.
    3. Sisipkan lajur baharu dengan hasilnya di sebelah kanan data sumber.
    4. Kosongkan teks yang diekstrak daripada data sumber.

    Ekstrak jenis data yang berbeza

    Bukan sahaja Alat Kuasa mengekstrak data sebelum/selepas/antara rentetan teks tertentu dan aksara N pertama/terakhir; tetapi ia juga mengeluarkan yang berikut:

    1. Nombor bersama-sama dengan perpuluhannya mengekalkan perpuluhan/ribuan pemisah utuh:

  • N aksara bermula dari kedudukan tertentu dalam sel.
  • Hiperpautan (teks + pautan), URL (pautan), alamat e-mel.
  • Ekstrak sebarang rentetan data dari mana-mana

    Ada juga pilihan untuk menyediakan corak tepat anda sendiri dan menggunakannya untuk pengekstrakan. Ekstrak dengan topeng dan aksara kad bebasnya — * dan ? — lakukan silap mata:

    • Sebagai contoh, anda boleh membawa keluar semua di antara kurungan menggunakan topeng berikut: (*)
    • Atau dapatkan SKU yang hanya mempunyai 5 nombor dalam idnya: SKU?????
    • Atau, seperti yang saya tunjukkan pada tangkapan skrin di bawah, tarik semuanya selepas setiap 'ea' dalam setiap sel: ea*

    Ekstrak tarikh dan masa daripada cap masa

    Sebagai bonus, terdapat alat yang lebih kecil yang akan mengekstrak tarikh dan masa daripada cap masa — ia dipanggil Split Date & Masa.

    Walaupun ia dicipta untuk membahagikan cap masa di tempat pertama, ia adalah sempurnamampu mendapatkan salah satu unit yang diingini secara individu:

    Hanya pilih salah satu kotak pilihan bergantung pada perkara yang anda mahu ekstrak — tarikh atau masa — daripada cap masa dalam Helaian Google dan tekan Pisah . Unit yang diperlukan akan disalin ke lajur baharu (atau ia akan menggantikan data asal jika anda memilih kotak semak terakhir juga):

    Alat ini juga merupakan sebahagian daripada alat tambah Power Tools jadi sebaik sahaja anda memasangnya untuk mendapatkan sebarang data daripada sel Helaian Google, ia membolehkan anda dilindungi sepenuhnya. Jika tidak, sila tinggalkan komen dan kami akan membantu anda :)

    Michael Brown ialah peminat teknologi yang berdedikasi dengan semangat untuk memudahkan proses kompleks menggunakan alat perisian. Dengan lebih sedekad pengalaman dalam industri teknologi, beliau telah mengasah kemahirannya dalam Microsoft Excel dan Outlook, serta Helaian Google dan Dokumen. Blog Michael berdedikasi untuk berkongsi pengetahuan dan kepakarannya dengan orang lain, menyediakan petua dan tutorial yang mudah diikuti untuk meningkatkan produktiviti dan kecekapan. Sama ada anda seorang profesional berpengalaman atau pemula, blog Michael menawarkan pandangan berharga dan nasihat praktikal untuk memanfaatkan sepenuhnya alatan perisian penting ini.