Gegevens ekstrahearje fan Google Blêden: bepaalde tekst út strings, URL's fan keppelings, en mear

  • Diel Dit
Michael Brown

Dit folgjende bytsje fan ús operaasjes mei tekst yn spreadsheets is wijd oan ekstraksje. Find out manieren in extract ferskate gegevens - tekst, karakters, sifers, URLs, e-adressen, datum & amp; tiid, ensfh. - fan ferskate posysjes yn meardere Google Sheets-sellen tagelyk.

    Google Spreadsheets-formules om tekst en sifers út tekenrige te heljen

    Formules yn Google Blêden binne alles. Wylst guon combos tafoegje tekst & amp; nûmers en ferwiderje ferskate karakters, guon fan harren ekstrahearje ek tekst, sifers, aparte tekens, ensfh.

    Gegevens ekstrahearje op posysje: earste/lêste/midden N tekens

    De maklikste funksjes om mei te dwaan as jo op it punt steane gegevens út Google Sheets te heljen binne sellen LEFT, RIGHT en MID. Se krije alle gegevens per posysje.

    Gegevens út it begjin fan sellen yn Google Blêden útpakke

    Jo kinne de earste N karakters maklik útlûke mei de LEFT-funksje:

    LEFT(string, [oantal_karakters])
    • string is de tekst wêrfan jo gegevens ekstrahearje wolle.
    • oantal_tekens is it oantal karakters om te begjinnen fan links.

    Hjir is it ienfâldichste foarbyld: litte wy de lânkoades út de telefoannûmers nimme:

    Sa't jo sjen kinne, lân koades nimme 6 symboalen oan it begjin fan sellen, dus de formule dy't jo nedich binne is:

    =LEFT(A2,6)

    Tip. ArrayFormula sil meitsje it mooglik om te krijen 6 karakters út dehiele berik tagelyk:

    =ArrayFormula(LEFT(A2:A7,6))

    Gegevens út 'e ein fan sellen yn Google Blêdblêden útpakke

    Om de lêste N karakters út sellen te heljen, brûk ynstee de RIGHT-funksje:

    RIGHT(string,[oantal_karakters])
    • string is noch altyd de tekst (as in selferwizing) om gegevens út te heljen.
    • number_of_characters is ek it oantal karakters fan rjochts.

    Litte wy de lânnammen fan deselde telefoannûmers krije:

    Se nimme mar 2 tekens en dat is krekt wat ik neam yn 'e formule:

    =RIGHT(A2,2)

    Tip. ArrayFormula sil jo ek helpe om gegevens út 'e ein fan alle Google Sheets-sellen tagelyk te ekstrahearjen:

    =ArrayFormula(RIGHT(A2:A7,2))

    Gegevens ekstrahearje út 'e midden fan sellen yn Google Sheets

    As d'r funksjes binne om gegevens út it begjin en it ein fan sellen te ekstrahearjen, moat d'r in funksje wêze om ek gegevens út it midden te ekstrahearjen. En ja - der is ien.

    It hjit MID:

    MID(string, starting_at, extract_length)
    • string - de tekst dêr't jo út wolle it middelste diel fan.
    • begjinnend_by - de posysje fan it karakter wêrfan jo de gegevens begjinne wolle.
    • extract_length - it getal fan tekens dy't jo derút moatte lûke.

    Lit ús troch it foarbyld fan deselde telefoannûmers de telefoannûmers sels fine sûnder har lânkoades en lânôfkoarting:

    Om't de lânkoades einigje mei it 6e karakter en it 7e it streepke is, sil ik nûmers lûke fanôf it 8e sifer. En ik krij yn totaal 8 sifers:

    =MID(A2,8,8)

    Tip. It feroarjen fan ien sel yn it hiele berik en it ynpakke yn ArrayFormula sil jo it resultaat foar elke sel tagelyk leverje:

    =ArrayFormula(MID(A2:A7,8,8))

    Tekst/nûmers út strings útpakke

    Soms is it ekstrahearje fan tekst op posysje (lykas hjirboppe toand) gjin opsje. De fereaske tekenrige kinne yn elk diel fan jo sellen wenje en bestean út in oar oantal tekens dy't jo twinge om ferskate formules foar elke sel te meitsjen.

    Mar Google Sheets soe Google Sheets net wêze as it net hie oare funksjes dy't helpe kinne om tekst út tekenrige te heljen.

    Litte wy in pear mooglike manieren besjen wêrop spreadsheets biede.

    Gegevens ekstrahearje foar in bepaalde tekst — LEFT+SEARCH

    Wannear't jo wolle ekstrahearje gegevens dy't foarôfgeane oan in bepaalde tekst, brûk LEFT + SEARCH:

    • LEFT wurdt brûkt om in bepaald oantal karakters werom te jaan fan it begjin fan sellen (fan har lofts)
    • SEARCH siket nei bepaalde tekens/strings en krijt harren posysje.

    Kombinearje dizze - en LEFT sil it oantal tekens weromjaan dat troch SEARCH suggerearre is.

    Hjir is in foarbyld: hoe ekstrahearje jo tekstkoades foar elke 'ea'?

    Dit is de formule dy't jo sil helpe yn ferlykberegefallen:

    =LEFT(A2,SEARCH("ea",A2)-1)

    Hjir is wat der bart yn de formule:

    1. SEARCH("ea",A2 ) syket 'ea' yn A2 en jout de posysje werom wêr't 'ea' foar elke sel begjint - 10.
    2. Dus 10e posysje is wêr't 'e' sit. Mar om't ik alles krekt foar 'ea' wol, moat ik 1 fan dy posysje ôflûke. Oars wurdt 'e' ek weromjûn. Sa krij ik úteinlik 9.
    3. LEFT sjocht nei A2 en krijt de earste 9 tekens.

    Gegevens útpakke nei de tekst

    Dêr binne ek middels om alles nei in bepaalde tekststring te krijen. Mar dizze kear sil RIGHT net helpe. Ynstee komt REGEXREPLACE oan de beurt.

    Tip. REGEXREPLACE brûkt reguliere útdrukkingen. As jo ​​​​net ree binne om har te behanneljen, is d'r in folle maklikere oplossing hjirûnder beskreaun. REGEXREPLACE(tekst, reguliere_ekspresje, ferfanging)

    • tekst is in tekenrige of in sel wêryn jo wizigingen meitsje wolle
    • reguliere_ekspresje is de kombinaasje fan tekens dy't stiet foar in diel fan 'e tekst wêr't jo nei sykje
    • ferfanging is wat jo wolle krije ynstee fan dy tekst

    Dus, hoe brûke jo it om gegevens te ekstrahearjen nei in bepaalde tekst - 'ea' yn myn foarbyld?

    Easy - mei dizze formule:

    =REGEXREPLACE(A2,"(.*)ea(.*)","$2")

    Lit my útlizze hoe't dizze formule krekt wurket:

    1. A2 is in sel dy't ik ekstrahearje de gegevens fan.
    2. "(.*)ea(.*)" is myn reguliereekspresje (of jo kinne it in masker neame). Ik sykje 'ea' en set alle oare karakters tusken heakjes. Der binne 2 groepen karakters - alles foar 'ea' is de earste groep (.*) en alles nei 'ea' is de twadde (.*). It hiele masker sels wurdt set op dûbele oanhalingstekens.
    3. "$2" is wat ik wol krije - de twadde groep (dêrfandinne syn nûmer 2) fan it foarige argumint.

    Tip. Alle karakters brûkt yn reguliere útdrukkingen wurde sammele op dizze spesjale side.

    Extract nûmers út Google Sheets sellen

    Wat as jo wolle extract allinne nûmers doe't harren posysje en wat giet foar & amp; na makket neat út?

    Masken (a.k.a. reguliere útdrukkingen) sille ek helpe. Eins sil ik deselde REGEXREPLACE-funksje nimme en de reguliere ekspresje feroarje:

    =REGEXREPLACE(A2,"[^[:digit:]]", "")

    1. A2 is in sel dêr't ik dy sifers weihelje wol.
    2. "[^[:digit:]]" is in reguliere útdrukking dy't alles nimt behalve sifers. Dat ^caret-symboal is wat in útsûndering makket foar sifers.
    3. "" ferfangt alles útsein numerike tekens mei "neat". Of, mei oare wurden, ferwideret it folslein, wêrtroch allinich nûmers yn sellen litte. Of, ekstrahearje sifers :)

    Tekst ekstrahearje sûnder sifers en oare tekens te negearjen

    Op in fergelykbere manier kinne jo allinich alfabetyske gegevens út Google Sheets-sellen nimme. De krimp foar de reguliere útdrukking datstiet foar tekst wurdt dêrmei neamd — alpha:

    =REGEXREPLACE(A2,"[^[:alpha:]]", "")

    Dizze formule nimt alles behalve letters (A-Z, a-z) en ferfangt it letterlik mei "neat" . Of, om it op in oare manier te sizzen, nimt allinich letters út.

    Formulefrije manieren om gegevens út Google Sheets-sellen te ekstrahearjen

    As jo ​​op syk binne nei in maklike formulefrije manier om ferskate soarten gegevens ekstrahearje, jo binne op it goede plak kommen. Us Power Tools add-on hat krekt de ark foar de baan.

    Ferskillende soarten gegevens útpakke mei help fan Power Tools add-ons

    It earste ark dat ik wol graach dat jo witte, hjit Extract . It docht krekt wat jo yn dit artikel sykje - ekstrahearje ferskate soarten gegevens út sellen fan Google Spreadsheets.

    Gebrûksfreonlike ynstellings

    Alle gefallen dy't ik hjirboppe besprutsen haw binne net gewoan oplosber mei de add-on. It ark is brûkerfreonlik dus alles wat jo hoege te dwaan is it berik te selektearjen dat jo wolle ferwurkje en de fereaske karfakjes oan te vinken. Gjin formules, gjin reguliere útdrukkingen.

    Onthâld it twadde punt fan dit artikel mei REGEXREPLACE en reguliere útdrukkingen? Hjir is hoe ienfâldich it is foar de add-on:

    Ekstra-opsjes

    Sa't jo sjen kinne, binne d'r wat ekstra opsjes (gewoan karfakjes) dy't jo fluch yn-/útskeakelje kinne om it meast krekte resultaat te krijen:

    1. Krij allinich de tekenrige fan 'e fereaske tekstcase.
    2. Pull out alle foarfallen út elksel en pleats se yn ien sel of aparte kolommen.
    3. Foegje in nije kolom yn mei it resultaat rjochts fan de boarnegegevens.
    4. Wis de úthelle tekst út de boarnegegevens.

    Ferskillende gegevenstypen útpakke

    Net allinnich Power Tools ekstrahearje gegevens foar/nei/tusken bepaalde tekststrings en de earste/lêste N karakters; mar it nimt ek it folgjende út:

    1. Nûmers tegearre mei har desimalen dy't de desimaal-/tûzenskiedingstekens yntakt hâlde:

  • N karakters begjinnend fan in bepaalde posysje yn in sel.
  • Hyperkeppelings (tekst + keppeling), URL's (keppeling), e-mailadressen.
  • Ekstra elke string fan gegevens fan oeral

    Der is ek in opsje om jo eigen krekte patroan op te stellen en it te brûken foar de ekstraksje. Extrahert troch masker en de jokertekens - * en ? - dogge de trúk:

    • Jo kinne bygelyks útbringe alles tusken de heakjes mei it folgjende masker: (*)
    • Of krije dy SKU's dy't mar 5 nûmers yn har id's hawwe: SKU?????
    • Of, lykas ik sjen litte op it skermôfbylding hjirûnder, lûk alles nei elke 'ea' yn elke sel: ea*

    Extract datum en tiid út timestamps

    As bonus, der is in lytser ark dat sil extract datum en tiid út timestamps - it hjit Split Datum & amp; Tiid.

    Hoewol't it makke is om tiidstempels yn it earste plak te splitsen, is it perfektyn steat om ien fan 'e winske ienheden yndividueel te krijen:

    Selektearje gewoan ien fan 'e karfakjes ôfhinklik fan wat jo wolle ekstrahearje - datum of tiid - fan tiidstempels yn Google Blêden en klikje op Split . De fereaske ienheid sil nei in nije kolom kopiearre wurde (of it sil de orizjinele gegevens ferfange as jo ek it lêste karfakje selektearje):

    Dit ark is ek diel fan de Power Tools-add-on, dus as jo ienris ynstalleare om alle gegevens fan Google Sheets-sellen te krijen, hat it jo folslein bedekt. As net, lit dan in reaksje efter en wy helpe jo :)

    Michael Brown is in tawijd technology-entûsjast mei in passy foar it ferienfâldigjen fan komplekse prosessen mei software-ark. Mei mear as in desennium ûnderfining yn 'e tech-yndustry hat hy syn feardigens yn Microsoft Excel en Outlook, lykas Google Blêden en Docs, oanskerpe. Michael's blog is wijd oan it dielen fan syn kennis en ekspertize mei oaren, en biedt maklik te folgjen tips en tutorials foar it ferbetterjen fan produktiviteit en effisjinsje. Oft jo in betûfte profesjonele of in begjinner binne, Michael's blog biedt weardefolle ynsjoch en praktysk advys om it measte út dizze essensjele software-ark te heljen.