విషయ సూచిక
క్రింది స్ట్రింగ్లలో, మీరు మొదటి ఆర్డర్ నంబర్ను తొలగించాలనుకుంటున్నారని అనుకుందాం. అటువంటి సంఖ్యలన్నీ హాష్ గుర్తు (#)తో ప్రారంభమవుతాయి మరియు ఖచ్చితంగా 5 అంకెలను కలిగి ఉంటాయి. కాబట్టి, మేము ఈ రీజెక్స్ని ఉపయోగించి వాటిని గుర్తించగలము:
నమూనా : #\d{5}\b
అంతిపదం \b సరిపోలే సబ్స్ట్రింగ్ ఉండకూడదని నిర్దేశిస్తుంది #10000001 వంటి పెద్ద స్ట్రింగ్లో భాగం.
అన్ని సరిపోలికలను తీసివేయడానికి, instance_num ఆర్గ్యుమెంట్ నిర్వచించబడలేదు:
=RegExpReplace(A5, "#\d{5}\b", "")
మొదటి సంఘటనను మాత్రమే నిర్మూలించడానికి, మేము instance_num ఆర్గ్యుమెంట్ని 1:
=RegExpReplace(A5, "#\d{5}\b", "", 1)
Regexకి సెట్ చేసాము నిర్దిష్ట అక్షరాలను తీసివేయడానికి
స్ట్రింగ్ నుండి కొన్ని అక్షరాలను తీసివేయడానికి, అన్ని అవాంఛిత అక్షరాలను వ్రాసి వాటిని నిలువు పట్టీతో వేరు చేయండిVBA RegExp పరిమితులు లేని వాక్యనిర్మాణం, మరియు రెండవది, మీ వర్క్బుక్లలో ఏ VBA కోడ్ను చొప్పించాల్సిన అవసరం లేదు, ఎందుకంటే అన్ని కోడ్ ఇంటిగ్రేషన్ బ్యాకెండ్లో మాచే చేయబడుతుంది.
మీ పనిలో భాగం సాధారణ వ్యక్తీకరణను రూపొందించడం మరియు దీన్ని ఫంక్షన్కి అందించండి :) ఒక ఆచరణాత్మక ఉదాహరణలో దీన్ని ఎలా చేయాలో నేను మీకు చూపుతాను.
regexని ఉపయోగించి బ్రాకెట్లు మరియు కుండలీకరణాల్లోని వచనాన్ని ఎలా తీసివేయాలి
పొడవైన టెక్స్ట్ స్ట్రింగ్లలో, తక్కువ ముఖ్యమైన సమాచారం తరచుగా [బ్రాకెట్లు] మరియు (కుండలీకరణాలు) లో జతచేయబడుతుంది. మీరు అన్ని ఇతర డేటాను ఉంచుకుని ఆ అసంబద్ధ వివరాలను ఎలా తొలగిస్తారు?
వాస్తవానికి, మేము ఇప్పటికే html ట్యాగ్లను తొలగించడం కోసం సారూప్య రీజెక్స్ను రూపొందించాము, అంటే యాంగిల్ బ్రాకెట్లలోని వచనం. సహజంగానే, స్క్వేర్ మరియు రౌండ్ బ్రాకెట్లకు కూడా అదే పద్ధతులు పని చేస్తాయి.
నమూనా : (\(.*?\))
ఎవరైనా సాధారణ వ్యక్తీకరణలతో దాని టూల్బాక్స్ని మెరుగుపరచగలిగితే Excel ఎంత శక్తివంతమైనదని మీరు ఎప్పుడైనా ఆలోచించారా? మేము దాని గురించి ఆలోచించడమే కాకుండా పని చేసాము :) మరియు ఇప్పుడు, మీరు ఈ అద్భుతమైన RegEx ఫంక్షన్ని మీ స్వంత వర్క్బుక్లకు జోడించవచ్చు మరియు ఏ సమయంలోనైనా నమూనాకు సరిపోలే సబ్స్ట్రింగ్లను తుడిచివేయవచ్చు!
గత వారం, మేము చూసాము Excelలో స్ట్రింగ్లను భర్తీ చేయడానికి సాధారణ వ్యక్తీకరణలను ఎలా ఉపయోగించాలో వద్ద. దీని కోసం, మేము అనుకూల Regex రీప్లేస్ ఫంక్షన్ని సృష్టించాము. ఇది ముగిసినట్లుగా, ఫంక్షన్ దాని ప్రాథమిక ఉపయోగానికి మించినది మరియు తీగలను భర్తీ చేయడమే కాకుండా వాటిని తీసివేయగలదు. అది ఎలా ఉంటుంది? ఎక్సెల్ పరంగా, విలువను తీసివేయడం అనేది ఖాళీ స్ట్రింగ్తో భర్తీ చేయడం తప్ప మరేమీ కాదు, మా Regex ఫంక్షన్ చాలా బాగుంది!
VBA RegExp ఫంక్షన్లో ఎక్సెల్లోని సబ్స్ట్రింగ్లను తీసివేయడం
మనందరికీ తెలిసినట్లుగా, డిఫాల్ట్గా Excelలో సాధారణ వ్యక్తీకరణలకు మద్దతు లేదు. వాటిని ప్రారంభించడానికి, మీరు మీ స్వంత వినియోగదారు నిర్వచించిన ఫంక్షన్ని సృష్టించాలి. శుభవార్త ఏమిటంటే, అటువంటి ఫంక్షన్ ఇప్పటికే వ్రాయబడింది, పరీక్షించబడింది మరియు ఉపయోగం కోసం సిద్ధంగా ఉంది. మీరు చేయాల్సిందల్లా ఈ కోడ్ని కాపీ చేసి, మీ VBA ఎడిటర్లో అతికించి, ఆపై మీ ఫైల్ను మాక్రో-ఎనేబుల్డ్ వర్క్బుక్గా (.xlsm) సేవ్ చేయడం.
ఫంక్షన్ కలిగి ఉంది క్రింది సింటాక్స్:
RegExpReplace(టెక్స్ట్, నమూనా, భర్తీ, [instance_num], [match_case])మొదటి మూడు ఆర్గ్యుమెంట్లు అవసరం, చివరి రెండు ఐచ్ఛికం.
ఎక్కడ:
- టెక్స్ట్ - శోధించడానికి టెక్స్ట్ స్ట్రింగ్ఇది ముగింపు బ్రాకెట్ను కనుగొనే వరకు సాధ్యమవుతుంది.
మీరు ఏ నమూనాను ఎంచుకున్నా, ఫలితం ఖచ్చితంగా ఒకే విధంగా ఉంటుంది.
ఉదాహరణకు, A5లోని స్ట్రింగ్ నుండి అన్ని html ట్యాగ్లను తీసివేసి, వచనాన్ని వదిలివేయడానికి, సూత్రం:
=RegExpReplace(A5, "]*>", "")
లేదా స్క్రీన్షాట్లో చూపిన విధంగా మీరు లేజీ క్వాంటిఫైయర్ను ఉపయోగించవచ్చు:
ఈ పరిష్కారం ఖచ్చితంగా పనిచేస్తుంది ఒకే వచనం (వరుసలు 5 - 9). బహుళ టెక్స్ట్ల కోసం (10 - 12 వరుసలు), ఫలితాలు సందేహాస్పదంగా ఉంటాయి - వివిధ ట్యాగ్ల నుండి టెక్స్ట్లు ఒకదానిలో విలీనం చేయబడ్డాయి. ఇది సరైనదేనా కాదా? నేను భయపడుతున్నాను, ఇది సులభంగా నిర్ణయించబడే విషయం కాదు - అన్ని ఆశించిన ఫలితంపై మీ అవగాహనపై ఆధారపడి ఉంటుంది. ఉదాహరణకు, B11లో, "A1" ఫలితం ఆశించబడుతుంది; B10లో ఉన్నప్పుడు, మీరు "data1" మరియు "data2"లను స్పేస్తో వేరు చేయాలని కోరుకోవచ్చు.
html ట్యాగ్లను తీసివేయడానికి మరియు మిగిలిన టెక్స్ట్లను ఖాళీలతో వేరు చేయడానికి, మీరు ఈ విధంగా కొనసాగవచ్చు:
- ట్యాగ్లను ఖాళీ స్ట్రింగ్లతో కాకుండా " "తో భర్తీ చేయండి:
=RegExpReplace(A5, "]*>", " ")
- ఒకే స్పేస్ అక్షరానికి బహుళ ఖాళీలను తగ్గించండి:
=RegExpReplace(RegExpReplace(A5, "]*>", " "), " +", " ")
- ప్రముఖ మరియు వెనుకబడిన ఖాళీలను కత్తిరించండి:
=TRIM(RegExpReplace(RegExpReplace(A5, "]*>", " "), " +", " "))
ఫలితం ఇలా కనిపిస్తుంది:
Ablebits Regex Remove Tool
మీకు Excel కోసం మా అల్టిమేట్ సూట్ని ఉపయోగించే అవకాశం ఉన్నట్లయితే, ఇటీవలి విడుదలతో పరిచయం చేయబడిన కొత్త Regex సాధనాలను మీరు ఇప్పటికే కనుగొన్నారు. ఈ .NET ఆధారిత Regex ఫంక్షన్ల యొక్క అందం ఏమిటంటే, అవి మొదటిగా, పూర్తి ఫీచర్తో కూడిన సాధారణ వ్యక్తీకరణకు మద్దతు ఇస్తాయి. తొలగించు ఎంపిక, మరియు తొలగించు నొక్కండి.
ఫలితాలను విలువలుగా కాకుండా సూత్రాలుగా పొందడానికి, ఫార్ములాగా చొప్పించు చెక్ బాక్స్ను ఎంచుకోండి.
A2:A5లోని స్ట్రింగ్ల నుండి బ్రాకెట్లలోని వచనాన్ని తీసివేయడానికి, మేము సెట్టింగ్లను కాన్ఫిగర్ చేస్తాము క్రింది విధంగా:
ఫలితంగా, AblebitsRegexRemove ఫంక్షన్ మీ అసలు డేటా పక్కన ఉన్న కొత్త నిలువు వరుసలో చొప్పించబడింది.
ఫంక్షన్ని నేరుగా సెల్లో స్టాండర్డ్ ఇన్సర్ట్ ఫంక్షన్ డైలాగ్ బాక్స్ ద్వారా నమోదు చేయవచ్చు, ఇక్కడ అది AblebitsUDFs కింద వర్గీకరించబడుతుంది.
AblebitsRegexRemove వచనాన్ని తీసివేయడానికి రూపొందించబడింది, దీనికి రెండు ఆర్గ్యుమెంట్లు మాత్రమే అవసరం - సోర్స్ స్ట్రింగ్ మరియు రీజెక్స్. రెండు పారామీటర్లను నేరుగా ఫార్ములాలో నిర్వచించవచ్చు లేదా సెల్ రిఫరెన్స్ల రూపంలో అందించవచ్చు. అవసరమైతే, ఈ అనుకూల ఫంక్షన్ ఏదైనా స్థానిక వాటితో కలిసి ఉపయోగించబడుతుంది.
ఉదాహరణకు, ఫలిత స్ట్రింగ్లలో అదనపు ఖాళీలను కత్తిరించడానికి, మీరు TRIM ఫంక్షన్ను రేపర్గా ఉపయోగించవచ్చు:
=TRIM(AblebitsRegexRemove(A5, $A$2))
ఎక్సెల్లో సాధారణ వ్యక్తీకరణలను ఉపయోగించి స్ట్రింగ్లను ఎలా తీసివేయాలి. చదివినందుకు ధన్యవాదాలు మరియు వచ్చే వారం మిమ్మల్ని మా బ్లాగ్లో చూడాలని ఎదురుచూస్తున్నాను!
అందుబాటులో ఉన్న డౌన్లోడ్లు
regex ఉపయోగించి స్ట్రింగ్లను తీసివేయండి - ఉదాహరణలు (.xlsm ఫైల్)
Ultimate Suite - ట్రయల్ వెర్షన్ (.exe ఫైల్)
in.మరింత సమాచారం కోసం, దయచేసి RegExpReplace ఫంక్షన్ను చూడండి.
చిట్కా. సాధారణ సందర్భాల్లో, మీరు Excel సూత్రాలతో సెల్ నుండి నిర్దిష్ట అక్షరాలు లేదా పదాలను తీసివేయవచ్చు. కానీ సాధారణ వ్యక్తీకరణలు దీనికి చాలా ఎక్కువ ఎంపికలను అందిస్తాయి.
సాధారణ ఎక్స్ప్రెషన్లను ఉపయోగించి స్ట్రింగ్లను ఎలా తీసివేయాలి - ఉదాహరణలు
పైన పేర్కొన్న విధంగా, నమూనాకు సరిపోలే వచన భాగాలను తీసివేయడానికి, మీరు వాటిని భర్తీ చేయాలి ఖాళీ స్ట్రింగ్తో. కాబట్టి, సాధారణ సూత్రం ఈ ఆకారాన్ని తీసుకుంటుంది:
RegExpReplace(టెక్స్ట్, నమూనా, "", [instance_num], [match_case])క్రింది ఉదాహరణలు ఈ ప్రాథమిక భావన యొక్క వివిధ అమలులను చూపుతాయి.
తొలగించు అన్ని మ్యాచ్లు లేదా నిర్దిష్ట సరిపోలిక
RegExpReplace ఫంక్షన్ ఇచ్చిన రీజెక్స్కు సరిపోలే అన్ని సబ్స్ట్రింగ్లను కనుగొనడానికి రూపొందించబడింది. instance_num అనే పేరు గల 4వ ఐచ్ఛిక ఆర్గ్యుమెంట్ ద్వారా తొలగించాల్సిన సంఘటనలు నియంత్రించబడతాయి.
డిఫాల్ట్ "అన్ని మ్యాచ్లు" - instance_num అయినప్పుడుconcatenation operator (&) మరియు RIGHT, MID మరియు LEFT వంటి టెక్స్ట్ ఫంక్షన్లు.
ఉదాహరణకు, అన్ని ఫోన్ నంబర్లను (123) 456-7890 ఫార్మాట్లో వ్రాయడానికి, ఫార్ములా:
="("&LEFT(B5, 3)&") "&MID(B5, 4, 3)&"-"&RIGHT(B5, 4)
B5 అనేది RegExpReplace ఫంక్షన్ యొక్క అవుట్పుట్.
regexని ఉపయోగించి ప్రత్యేక అక్షరాలను తీసివేయండి
మా ట్యుటోరియల్లలో ఒకదానిలో, ఇన్బిల్ట్ మరియు కస్టమ్ ఫంక్షన్లను ఉపయోగించి ఎక్సెల్లో అవాంఛిత అక్షరాలను ఎలా తొలగించాలో మేము చూశాము. రెగ్యులర్ వ్యక్తీకరణలు విషయాలు చాలా సులభతరం చేస్తాయి! తొలగించాల్సిన అన్ని అక్షరాలను జాబితా చేయడానికి బదులుగా, మీరు ఉంచాలనుకునే వాటిని పేర్కొనండి :)
ఆకృతి నిరాకరించిన అక్షర తరగతులు ఆధారంగా రూపొందించబడింది - క్యారెక్టర్ క్లాస్ లోపల ఉంచబడింది [^ ] బ్రాకెట్లలో లేని ఏ ఒక్క అక్షరాన్ని సరిపోల్చడానికి. + క్వాంటిఫైయర్ వరుస అక్షరాలను ఒకే మ్యాచ్గా పరిగణించేలా బలవంతం చేస్తుంది, తద్వారా ప్రతి ఒక్క అక్షరానికి బదులుగా సరిపోలే సబ్స్ట్రింగ్కు భర్తీ చేయబడుతుంది.
మీ అవసరాలను బట్టి, కింది రీజెక్స్లలో ఒకదాన్ని ఎంచుకోండి.
అల్ఫాన్యూమరిక్ కాని అక్షరాలను తీసివేయడానికి, అంటే అక్షరాలు మరియు అంకెలు మినహా అన్ని అక్షరాలు:
నమూనా : [^0-9a-zA-Z] +
అక్షరాలు , అంకెలు మరియు ఖాళీలు మినహా అన్ని అక్షరాలను ప్రక్షాళన చేయడానికి :
నమూనా : [^0-9a-zA-Z ]+
అన్ని అక్షరాలు తొలగించడానికి అక్షరాలు , అంకెలు మరియు అండర్ స్కోర్ , మీరు \ని ఉపయోగించవచ్చు W అంటే ఆల్ఫాన్యూమరిక్ అక్షరం కాని ఏదైనా అక్షరం లేదాunderscore:
నమూనా : \W+
మీరు కొన్ని ఇతర అక్షరాలను ఉంచుకోవాలనుకుంటే , ఉదా. విరామ చిహ్నాలు, వాటిని బ్రాకెట్లలో ఉంచండి.
ఉదాహరణకు, అక్షరం, అంకె, కాలం, కామా లేదా ఖాళీ కాకుండా ఏదైనా అక్షరాన్ని తీసివేయడానికి, క్రింది రీజెక్స్ని ఉపయోగించండి:
నమూనా : [^0-9a-zA-Z\., ]+
ఇది అన్ని ప్రత్యేక అక్షరాలను విజయవంతంగా తొలగిస్తుంది, కానీ అదనపు ఖాళీ స్థలం మిగిలి ఉంది.
దీన్ని పరిష్కరించడానికి, మీరు పైన పేర్కొన్న ఫంక్షన్ను ఒకే స్పేస్ క్యారెక్టర్తో బహుళ స్పేస్లను రీప్లేస్ చేసే మరొక దానిలో నెస్ట్ చేయవచ్చు.
=RegExpReplace(RegExpReplace(A5,$A$2,""), " +", " ")
లేదా అదే ప్రభావంతో స్థానిక TRIM ఫంక్షన్ని ఉపయోగించండి :
=TRIM(RegExpReplace(A5, $A$2, ""))
సంఖ్యేతర అక్షరాలను తీసివేయడానికి Regex
స్ట్రింగ్ నుండి అన్ని సంఖ్యేతర అక్షరాలను తొలగించడానికి, మీరు ఉపయోగించవచ్చు ఈ పొడవైన ఫార్ములా లేదా దిగువ జాబితా చేయబడిన చాలా సులభమైన రీజెక్స్లలో ఒకటి.
అంకె లేని ఏదైనా అక్షరాన్ని సరిపోల్చండి:
నమూనా : \D+
నెగేటెడ్ తరగతులను ఉపయోగించి సంఖ్యేతర అక్షరాలను తీసివేయండి:
నమూనా : [^0-9]+
నమూనా : [^\d] +
చిట్కా. మీ లక్ష్యం టెక్స్ట్ని తీసివేసి, మిగిలిన సంఖ్యలను ప్రత్యేక సెల్లుగా స్పిల్ చేయడం లేదా పేర్కొన్న డీలిమిటర్తో వేరు చేయబడిన ఒక సెల్లో ఉంచడం అయితే, సాధారణ వ్యక్తీకరణలను ఉపయోగించి స్ట్రింగ్ నుండి సంఖ్యలను ఎలా సంగ్రహించాలో వివరించిన విధంగా RegExpExtract ఫంక్షన్ను ఉపయోగించండి.
స్పేస్ తర్వాత అన్నింటినీ తీసివేయడానికి Regex
స్పేస్ తర్వాత అన్నింటినీ తుడిచివేయడానికి, స్పేస్ ( )ని ఉపయోగించండి లేదావైట్స్పేస్ (\s) అక్షరం మొదటి ఖాళీని కనుగొనడానికి మరియు .* దాని తర్వాత ఏవైనా అక్షరాలతో సరిపోలడానికి.
మీరు సాధారణ ఖాళీలను మాత్రమే కలిగి ఉన్న సింగిల్-లైన్ స్ట్రింగ్లను కలిగి ఉంటే (7-బిట్ ASCII సిస్టమ్లో విలువ 32) , మీరు దిగువన ఉన్న రీజెక్స్లలో దేనిని ఉపయోగిస్తున్నారనేది నిజంగా పట్టింపు లేదు. బహుళ-లైన్ స్ట్రింగ్ల విషయంలో, ఇది తేడాను కలిగిస్తుంది.
ప్రతిదీ తీసివేయడానికి స్పేస్ క్యారెక్టర్ , ఈ రీజెక్స్ని ఉపయోగించండి:
నమూనా : " .*"
=RegExpReplace(A5, " .*", "")
ఈ ఫార్ములా ప్రతి పంక్తి లో మొదటి ఖాళీ తర్వాత ఏదైనా తీసివేయబడుతుంది. ఫలితాలు సరిగ్గా ప్రదర్శించబడాలంటే, వ్రాప్ టెక్స్ట్ని ఆన్ చేయాలని నిర్ధారించుకోండి.
అన్నింటినీ తీసివేయడానికి ఒక వైట్స్పేస్ తర్వాత (స్పేస్, ట్యాబ్, క్యారేజ్ రిటర్న్ మరియు కొత్త లైన్తో సహా), రీజెక్స్ ఉంది:
నమూనా : \s.*
=RegExpReplace(A5, "\s.*", "")
ఎందుకంటే \s కొత్త పంక్తితో సహా కొన్ని విభిన్న వైట్స్పేస్ రకాలను సరిపోల్చుతుంది (\n), ఈ ఫార్ములా సెల్లో ఎన్ని పంక్తులు ఉన్నప్పటికీ, సెల్లోని మొదటి ఖాళీ తర్వాత ప్రతిదీ తొలగిస్తుంది.
నిర్దిష్ట తర్వాత వచనాన్ని తీసివేయడానికి Regex అక్షరం
మునుపటి ఉదాహరణలోని పద్ధతులను ఉపయోగించి, మీరు పేర్కొన్న ఏదైనా అక్షరం తర్వాత వచనాన్ని నిర్మూలించవచ్చు.
ప్రతి పంక్తిని విడిగా నిర్వహించడానికి:
సాధారణ నమూనా : char.*
సింగిల్-లైన్ స్ట్రింగ్లలో, ఇది char తర్వాత ప్రతిదీ తీసివేస్తుంది. బహుళ-లైన్ స్ట్రింగ్లలో, ప్రతి పంక్తి ఒక్కొక్కటిగా ప్రాసెస్ చేయబడుతుంది ఎందుకంటే VBA Regex ఫ్లేవర్లో, ఒక పీరియడ్ (.) కొత్త అక్షరానికి మినహా ఏ అక్షరానికి సరిపోలుతుందిస్ట్రింగ్ ప్రారంభం ^, మేము సున్నా లేదా అంతకంటే ఎక్కువ నాన్-స్పేస్ అక్షరాలు [^ ]*ని సరిపోల్చాము, వాటిని వెంటనే ఒకటి లేదా అంతకంటే ఎక్కువ ఖాళీలు " +" అనుసరిస్తాయి. ఫలితాల్లో సంభావ్య లీడింగ్ స్పేస్లను నిరోధించడానికి చివరి భాగం జోడించబడింది.
ప్రతి పంక్తిలో మొదటి ఖాళీకి ముందు వచనాన్ని తీసివేయడానికి, ఫార్ములా డిఫాల్ట్ "అన్ని మ్యాచ్లు" మోడ్లో వ్రాయబడుతుంది ( instance_num విస్మరించబడింది):
=RegExpReplace(A5, "^[^ ]* +", "")
మొదటి పంక్తిలో మొదటి ఖాళీకి ముందు వచనాన్ని తొలగించడానికి మరియు అన్ని ఇతర పంక్తులను అలాగే ఉంచడానికి, instance_num ఆర్గ్యుమెంట్ 1:<కి సెట్ చేయబడింది 3>
=RegExpReplace(A5, "^[^ ]* +", "", 1)
=RegExpReplace(A5, "^[^ ]* +", "", 1)
అక్షరానికి ముందు ఉన్న అన్నింటినీ తీసివేయడానికి Regex
నిర్దిష్ట అక్షరానికి ముందు మొత్తం వచనాన్ని తీసివేయడానికి సులభమైన మార్గం రీజెక్స్ని ఉపయోగించడం ఇలా:
సాధారణ నమూనా : ^[^char]*char
మానవ భాషలోకి అనువదించబడింది, ఇది ఇలా చెప్పింది: "ఒక స్ట్రింగ్ ప్రారంభం నుండి ^ , char [^char]* మినహా char యొక్క మొదటి సంభవం వరకు 0 లేదా అంతకంటే ఎక్కువ అక్షరాలను సరిపోల్చండి.
ఉదాహరణకు, మొదటి కోలన్ ముందు ఉన్న మొత్తం వచనాన్ని తొలగించడానికి , ఈ సాధారణ వ్యక్తీకరణను ఉపయోగించండి:
నమూనా : ^[^:]*:
ఫలితాలలో ప్రముఖ ఖాళీలను నివారించడానికి, ఒక వైట్స్పేస్ అక్షరాన్ని \s* జోడించండి ముగింపు. ఇది అన్నింటినీ తొలగిస్తుంది g మొదటి కోలన్కు ముందు మరియు దాని తర్వాత ఏవైనా ఖాళీలను కత్తిరించండి:
నమూనా : ^[^:]*:\s*
=RegExpReplace(A5, "^[^:]*:\s*", "")
చిట్కా. సాధారణ వ్యక్తీకరణలతో పాటు, స్థానం లేదా మ్యాచ్ ద్వారా వచనాన్ని తీసివేయడానికి Excel దాని స్వంత మార్గాలను కలిగి ఉంది. స్థానిక సూత్రాలతో విధిని ఎలా సాధించాలో తెలుసుకోవడానికి,దయచేసి Excelలో అక్షరానికి ముందు లేదా తర్వాత వచనాన్ని ఎలా తీసివేయాలో చూడండి.
రెజెక్స్ మినహా అన్నింటినీ తీసివేయడానికి
ఒక స్ట్రింగ్ నుండి మీరు ఉంచాలనుకునే అక్షరాలు మినహా అన్ని అక్షరాలను నిర్మూలించడానికి, తిరస్కరించబడిన అక్షర తరగతులను ఉపయోగించండి.
ఉదాహరణకు, చిన్న అక్షరాలు మినహా అన్ని అక్షరాలను తీసివేయడానికి మరియు చుక్కలు, రీజెక్స్:
నమూనా : [^a-z\.]+
వాస్తవానికి, మా ఫంక్షన్ అన్నింటినీ భర్తీ చేస్తుంది కాబట్టి మనం ఇక్కడ + క్వాంటిఫైయర్ లేకుండా చేయవచ్చు మ్యాచ్లను కనుగొన్నారు. క్వాంటిఫైయర్ దీన్ని కొంచెం వేగవంతం చేస్తుంది - ప్రతి ఒక్క అక్షరాన్ని నిర్వహించడానికి బదులుగా, మీరు సబ్స్ట్రింగ్ను భర్తీ చేస్తారు.
=RegExpReplace(A5, "[^a-z\.]+", "")
Excelలో html ట్యాగ్లను తీసివేయడానికి Regex
మొదట, HTML సాధారణ భాష కాదని గమనించాలి, కాబట్టి సాధారణ వ్యక్తీకరణలను ఉపయోగించి దాన్ని అన్వయించడం ఉత్తమ మార్గం కాదు. మీ డేటాసెట్ను క్లీనర్గా మార్చడానికి మీ సెల్ల నుండి ట్యాగ్లను తీసివేయడానికి రీజెక్స్లు ఖచ్చితంగా సహాయపడగలవని పేర్కొంది.
html ట్యాగ్లు ఎల్లప్పుడూ యాంగిల్ బ్రాకెట్లలో ఉంచబడతాయి , మీరు వాటిని క్రింది రీజెక్స్లలో ఒకదానిని ఉపయోగించి కనుగొనవచ్చు.
నెగేటెడ్ క్లాస్:
నమూనా : ]*>
ఇక్కడ, మేము ఓపెనింగ్ యాంగిల్ బ్రాకెట్ను సరిపోల్చాము, తర్వాత ఏదైనా అక్షరం యొక్క సున్నా లేదా అంతకంటే ఎక్కువ సంఘటనలు ఉంటాయి క్లోజింగ్ యాంగిల్ బ్రాకెట్ [^>]* సమీప క్లోజింగ్ యాంగిల్ బ్రాకెట్ వరకు.
లేజీ శోధన:
నమూనా :
ఇక్కడ, మేము సరిపోలాము మొదటి ప్రారంభ బ్రాకెట్ నుండి మొదటి ముగింపు బ్రాకెట్ వరకు ఏదైనా. క్వశ్చన్ మార్క్ ఫోర్స్ .* చాలా తక్కువ అక్షరాలతో సరిపోలుతుందిలైన్.
అన్ని లైన్లను ఒకే స్ట్రింగ్గా ప్రాసెస్ చేయడానికి:
సాధారణ నమూనా : చార్(.