உள்ளடக்க அட்டவணை
கீழே உள்ள வரிகளில், முதல் வரிசை எண்ணை நீக்க விரும்புகிறீர்கள் என்று வைத்துக்கொள்வோம். அத்தகைய எண்கள் அனைத்தும் ஹாஷ் அடையாளத்துடன் (#) தொடங்கி சரியாக 5 இலக்கங்களைக் கொண்டிருக்கும். எனவே, இந்த ரீஜெக்ஸைப் பயன்படுத்தி அவற்றை நாம் அடையாளம் காணலாம்:
முறை : #\d{5}\b
வார்த்தை எல்லை \b பொருந்தக்கூடிய சப்ஸ்ட்ரிங் இருக்கக்கூடாது என்று குறிப்பிடுகிறது #10000001 போன்ற பெரிய சரத்தின் ஒரு பகுதி.
எல்லாப் பொருத்தங்களையும் அகற்ற, instance_num வாதம் வரையறுக்கப்படவில்லை:
=RegExpReplace(A5, "#\d{5}\b", "")
முதல் நிகழ்வை மட்டும் அழிக்க, instance_num வாதத்தை 1:
=RegExpReplace(A5, "#\d{5}\b", "", 1)
Regex என அமைத்துள்ளோம் குறிப்பிட்ட எழுத்துகளை அகற்ற
ஒரு சரத்திலிருந்து சில எழுத்துக்களை அகற்ற, தேவையற்ற அனைத்து எழுத்துக்களையும் எழுதி, செங்குத்து பட்டியால் பிரிக்கவும்VBA RegExp வரம்புகள் இல்லாத தொடரியல், இரண்டாவதாக, உங்கள் பணிப்புத்தகங்களில் VBA குறியீட்டைச் செருக வேண்டிய அவசியமில்லை, ஏனெனில் அனைத்து குறியீடு ஒருங்கிணைப்பும் பின்தளத்தில் எங்களால் செய்யப்படுகிறது.
உங்கள் வேலையின் ஒரு பகுதி வழக்கமான வெளிப்பாட்டைக் கட்டமைப்பது மற்றும் அதை செயல்பாட்டிற்கு வழங்கவும் :) அதை எப்படி செய்வது என்று ஒரு நடைமுறை எடுத்துக்காட்டில் காட்டுகிறேன்.
ரெஜெக்ஸைப் பயன்படுத்தி அடைப்புக்குறிகள் மற்றும் அடைப்புக்குறிக்குள் உள்ள உரையை எவ்வாறு அகற்றுவது
நீண்ட உரைச் சரங்களில், குறைவான முக்கியத் தகவல் பெரும்பாலும் [அடைப்புக்குறிகள்] மற்றும் (அடைப்புக்குறிக்குள்) இணைக்கப்பட்டுள்ளது. மற்ற எல்லாத் தரவையும் வைத்து, அந்தத் தொடர்பில்லாத விவரங்களை எவ்வாறு அகற்றுவது?
உண்மையில், html குறிச்சொற்களை நீக்குவதற்கு, அதாவது கோண அடைப்புக்குறிக்குள் உள்ள உரையை, நாங்கள் ஏற்கனவே இதேபோன்ற ரீஜெக்ஸை உருவாக்கியுள்ளோம். வெளிப்படையாக, அதே முறைகள் சதுர மற்றும் வட்ட அடைப்புக்குறிகளுக்கும் வேலை செய்யும்.
முறை : (\(.*?\))
வழக்கமான வெளிப்பாடுகள் மூலம் எக்செல் கருவிப்பெட்டியை மெருகூட்டினால் அது எவ்வளவு சக்தி வாய்ந்ததாக இருக்கும் என்று நீங்கள் எப்போதாவது யோசித்திருக்கிறீர்களா? நாங்கள் யோசித்தது மட்டும் அல்ல, அதில் வேலை செய்துள்ளோம் :) இப்போது, இந்த அற்புதமான RegEx செயல்பாட்டை உங்கள் சொந்தப் புத்தகங்களில் சேர்க்கலாம் மற்றும் எந்த நேரத்திலும் ஒரு மாதிரியுடன் பொருந்தக்கூடிய சப்ஸ்ட்ரிங்ஸை அழிக்கலாம்!
கடந்த வாரம், நாங்கள் பார்த்தோம் Excel இல் சரங்களை மாற்றுவதற்கு வழக்கமான வெளிப்பாடுகளை எவ்வாறு பயன்படுத்துவது என்பதில். இதற்காக, தனிப்பயன் Regex Replace செயல்பாட்டை உருவாக்கினோம். அது மாறியது போல், செயல்பாடு அதன் முதன்மை பயன்பாட்டிற்கு அப்பாற்பட்டது மற்றும் சரங்களை மாற்றுவது மட்டுமல்லாமல் அவற்றை அகற்றவும் முடியும். அது எப்படி இருக்க முடியும்? எக்செல் அடிப்படையில், ஒரு மதிப்பை அகற்றுவது, அதை வெற்று சரம் மூலம் மாற்றுவதைத் தவிர வேறொன்றுமில்லை, எங்களின் Regex செயல்பாடு மிகவும் சிறப்பாக உள்ளது!
VBA RegExp செயல்பாடு எக்செல் இல் உள்ள சப்ஸ்ட்ரிங்ஸை அகற்றும்
நாம் அனைவரும் அறிந்தது போல, வழக்கமான வெளிப்பாடுகள் இயல்பாக Excel இல் ஆதரிக்கப்படாது. அவற்றை இயக்க, நீங்கள் உங்கள் சொந்த பயனர் வரையறுக்கப்பட்ட செயல்பாட்டை உருவாக்க வேண்டும். நல்ல செய்தி என்னவென்றால், அத்தகைய செயல்பாடு ஏற்கனவே எழுதப்பட்டு, சோதிக்கப்பட்டு, பயன்படுத்த தயாராக உள்ளது. நீங்கள் செய்ய வேண்டியது இந்தக் குறியீட்டை நகலெடுத்து, உங்கள் VBA எடிட்டரில் ஒட்டவும், பின்னர் உங்கள் கோப்பை மேக்ரோ-இயக்கப்பட்ட பணிப்புத்தகமாக (.xlsm) சேமிக்கவும்.
செயல்பாடு கொண்டுள்ளது பின்வரும் தொடரியல்:
RegExpReplace(text, pattern, replacement, [instance_num], [match_case])முதல் மூன்று வாதங்கள் தேவை, கடைசி இரண்டு விருப்பமானவை.
எங்கே:
- உரை - தேட வேண்டிய உரைச் சரம்அது மூடும் அடைப்புக்குறியைக் கண்டுபிடிக்கும் வரை சாத்தியமாகும்.
நீங்கள் எந்த வடிவத்தைத் தேர்வுசெய்தாலும், முடிவு முற்றிலும் ஒரே மாதிரியாக இருக்கும்.
உதாரணமாக, A5 இல் உள்ள ஒரு சரத்திலிருந்து எல்லா html குறிச்சொற்களையும் நீக்கிவிட்டு உரையை விட்டுவிட, சூத்திரம்:
=RegExpReplace(A5, "]*>", "")
அல்லது ஸ்கிரீன்ஷாட்டில் காட்டப்பட்டுள்ளபடி சோம்பேறி அளவுகோலைப் பயன்படுத்தலாம்:
இந்த தீர்வு சரியாக வேலை செய்கிறது ஒற்றை உரை (வரிசைகள் 5 - 9). பல உரைகளுக்கு (வரிசைகள் 10 - 12), முடிவுகள் சந்தேகத்திற்குரியவை - வெவ்வேறு குறிச்சொற்களின் உரைகள் ஒன்றாக இணைக்கப்படுகின்றன. இது சரியா இல்லையா? நான் பயப்படுகிறேன், இது எளிதில் முடிவெடுக்கக்கூடிய ஒன்று அல்ல - இவை அனைத்தும் விரும்பிய முடிவைப் பற்றிய உங்கள் புரிதலைப் பொறுத்தது. எடுத்துக்காட்டாக, B11 இல், "A1" முடிவு எதிர்பார்க்கப்படுகிறது; B10 இல் இருக்கும்போது, "data1" மற்றும் "data2" ஆகியவை இடைவெளியுடன் பிரிக்கப்பட வேண்டும்.
html குறிச்சொற்களை அகற்றி மீதமுள்ள உரைகளை இடைவெளிகளுடன் பிரிக்க, நீங்கள் இந்த வழியில் தொடரலாம்:
- குறிச்சொற்களை " " இடைவெளிகளுடன் மாற்றவும், வெற்று சரங்கள் அல்ல:
=RegExpReplace(A5, "]*>", " ")
- ஒரே இடைவெளி எழுத்துக்கு பல இடைவெளிகளைக் குறைக்கவும்:
=RegExpReplace(RegExpReplace(A5, "]*>", " "), " +", " ")
- முன்னணி மற்றும் பின்தங்கிய இடைவெளிகளை ஒழுங்கமைக்கவும்:
=TRIM(RegExpReplace(RegExpReplace(A5, "]*>", " "), " +", " "))
முடிவு இப்படி இருக்கும்:
Ablebits Regex Remove Tool
எக்செல் க்கான அல்டிமேட் சூட்டைப் பயன்படுத்த உங்களுக்கு வாய்ப்பு கிடைத்திருந்தால், சமீபத்திய வெளியீட்டில் அறிமுகப்படுத்தப்பட்ட புதிய Regex கருவிகளை நீங்கள் ஏற்கனவே கண்டுபிடித்திருக்கலாம். இந்த .NET அடிப்படையிலான Regex செயல்பாடுகளின் அழகு என்னவென்றால், முதலில், முழு அம்சங்களுடன் கூடிய வழக்கமான வெளிப்பாட்டை ஆதரிக்கிறது. நீக்கு விருப்பத்தை, நீக்கு என்பதை அழுத்தவும்.
முடிவுகளை சூத்திரங்களாகப் பெற, மதிப்புகள் அல்ல, சூத்திரமாகச் செருகு தேர்வுப்பெட்டியைத் தேர்ந்தெடுக்கவும்.
A2:A5 இல் உள்ள சரங்களிலிருந்து அடைப்புக்குறிக்குள் உள்ள உரையை அகற்ற, அமைப்புகளை உள்ளமைக்கிறோம் பின்வருமாறு:
இதன் விளைவாக, AblebitsRegexRemove செயல்பாடு உங்கள் அசல் தரவுக்கு அடுத்துள்ள புதிய நெடுவரிசையில் செருகப்பட்டது.
செயல்பாடு, நிலையான செயல் செயல்பாடு உரையாடல் பெட்டி வழியாக நேரடியாக ஒரு கலத்தில் உள்ளிடப்படும், அங்கு இது AblebitsUDFs கீழ் வகைப்படுத்தப்பட்டுள்ளது.<3
AblebitsRegexRemove உரையை அகற்றுவதற்காக வடிவமைக்கப்பட்டுள்ளதால், இதற்கு இரண்டு வாதங்கள் மட்டுமே தேவை - மூல சரம் மற்றும் regex. இரண்டு அளவுருக்களும் நேரடியாக ஒரு சூத்திரத்தில் வரையறுக்கப்படலாம் அல்லது செல் குறிப்புகள் வடிவில் வழங்கப்படலாம். தேவைப்பட்டால், இந்தப் பிரத்தியேகச் செயல்பாட்டை எந்த பூர்வீகச் செயல்பாடுகளுடனும் சேர்த்துப் பயன்படுத்தலாம்.
உதாரணமாக, விளைந்த சரங்களில் கூடுதல் இடைவெளிகளைக் குறைக்க, TRIM செயல்பாட்டை ரேப்பராகப் பயன்படுத்தலாம்:
=TRIM(AblebitsRegexRemove(A5, $A$2))
எக்செல் இல் வழக்கமான வெளிப்பாடுகளைப் பயன்படுத்தி சரங்களை அகற்றுவது இதுதான். படித்ததற்கு நன்றி, அடுத்த வாரம் எங்கள் வலைப்பதிவில் உங்களைப் பார்ப்பதற்கு ஆவலுடன் காத்திருக்கிறேன்!
கிடைக்கும் பதிவிறக்கங்கள்
regex - எடுத்துக்காட்டுகளைப் பயன்படுத்தி சரங்களை அகற்றவும் (.xlsm கோப்பு)
Ultimate Suite - சோதனை பதிப்பு (.exe கோப்பு)
in.மேலும் தகவலுக்கு, RegExpReplace செயல்பாட்டைப் பார்க்கவும்.
உதவிக்குறிப்பு. எளிமையான சந்தர்ப்பங்களில், எக்செல் ஃபார்முலாக்கள் மூலம் கலங்களிலிருந்து குறிப்பிட்ட எழுத்துக்கள் அல்லது சொற்களை நீக்கலாம். ஆனால் வழக்கமான வெளிப்பாடுகள் இதற்கு நிறைய விருப்பங்களை வழங்குகின்றன.
வழக்கமான வெளிப்பாடுகளைப் பயன்படுத்தி சரங்களை எவ்வாறு அகற்றுவது - எடுத்துக்காட்டுகள்
மேலே குறிப்பிட்டுள்ளபடி, ஒரு வடிவத்துடன் பொருந்தக்கூடிய உரையின் பகுதிகளை அகற்ற, நீங்கள் அவற்றை மாற்ற வேண்டும். வெற்று சரத்துடன். எனவே, ஒரு பொதுவான சூத்திரம் இந்த வடிவத்தை எடுக்கும்:
RegExpReplace(உரை, முறை, "", [instance_num], [match_case])கீழே உள்ள எடுத்துக்காட்டுகள் இந்த அடிப்படைக் கருத்தின் பல்வேறு செயலாக்கங்களைக் காட்டுகின்றன.
நீக்கு அனைத்து பொருத்தங்கள் அல்லது குறிப்பிட்ட பொருத்தம்
RegExpReplace செயல்பாடு கொடுக்கப்பட்ட ரீஜெக்ஸுடன் பொருந்தக்கூடிய அனைத்து துணைச்சரங்களையும் கண்டறிய வடிவமைக்கப்பட்டுள்ளது. எந்த நிகழ்வுகளை அகற்ற வேண்டும் என்பது instance_num என பெயரிடப்பட்ட 4வது விருப்ப வாதத்தால் கட்டுப்படுத்தப்படும்.
இயல்புநிலையானது "அனைத்தும் பொருந்துகிறது" - instance_num ஆக இருக்கும் போதுஇணைப்பு இயக்கி (&) மற்றும் RIGHT, MID மற்றும் LEFT போன்ற உரை செயல்பாடுகள்.
உதாரணமாக, அனைத்து தொலைபேசி எண்களையும் (123) 456-7890 வடிவத்தில் எழுத, சூத்திரம்:
="("&LEFT(B5, 3)&") "&MID(B5, 4, 3)&"-"&RIGHT(B5, 4)
B5 என்பது RegExpReplace செயல்பாட்டின் வெளியீடு.
regex ஐப் பயன்படுத்தி சிறப்பு எழுத்துகளை அகற்று
எங்கள் பயிற்சி ஒன்றில், உள்ளமைக்கப்பட்ட மற்றும் தனிப்பயன் செயல்பாடுகளைப் பயன்படுத்தி எக்செல் இல் தேவையற்ற எழுத்துக்களை எவ்வாறு அகற்றுவது என்பதை நாங்கள் பார்த்தோம். வழக்கமான வெளிப்பாடுகள் விஷயங்களை மிகவும் எளிதாக்குகின்றன! நீக்க வேண்டிய அனைத்து எழுத்துகளையும் பட்டியலிடுவதற்குப் பதிலாக, நீங்கள் வைத்திருக்க விரும்பும் எழுத்துக்களைக் குறிப்பிடவும் :)
முறையானது நிராகரிக்கப்பட்ட எழுத்து வகுப்புகள் அடிப்படையிலானது - ஒரு எழுத்து வகுப்பிற்குள் ஒரு கேரட் வைக்கப்பட்டுள்ளது [^ ] அடைப்புக்குறிக்குள் இல்லாத எந்த ஒரு எழுத்தையும் பொருத்த வேண்டும். + குவாண்டிஃபையர், தொடர்ச்சியான எழுத்துகளை ஒற்றைப் பொருத்தமாகக் கருதும்படி கட்டாயப்படுத்துகிறது, இதனால் ஒவ்வொரு தனித்தனி எழுத்துக்குறிக்கும் பதிலாக பொருந்தக்கூடிய துணைச்சரத்திற்கு மாற்றீடு செய்யப்படுகிறது.
உங்கள் தேவைகளைப் பொறுத்து, பின்வரும் ரீஜெக்ஸில் ஒன்றைத் தேர்ந்தெடுக்கவும்.
எழுத்து எண் அல்லாத எழுத்துகளை அகற்ற, அதாவது எழுத்துக்கள் மற்றும் இலக்கங்கள் தவிர அனைத்து எழுத்துகளும்:
முறை : [^0-9a-zA-Z] +
எழுத்துகள் , இலக்கங்கள் மற்றும் இடைவெளிகள் :
முறை தவிர அனைத்து எழுத்துகளையும் சுத்தம் செய்ய: [^0-9a-zA-Z ]+
எழுத்துகள் , இலக்கங்கள் மற்றும் அண்டர்ஸ்கோர் தவிர அனைத்து எழுத்துகளையும் நீக்க, நீங்கள் \\ஐப் பயன்படுத்தலாம் W என்பது எண்ணெழுத்து அல்லாத எந்த எழுத்தையும் குறிக்கிறது அல்லதுஅடிக்கோடிட்டு:
முறை : \W+
நீங்கள் வேறு சில எழுத்துக்களை வைத்திருக்க விரும்பினால், எ.கா. நிறுத்தற்குறிகள், அடைப்புக்குறிக்குள் வைக்கவும்.
உதாரணமாக, எழுத்து, இலக்கம், காலம், காற்புள்ளி அல்லது இடம் தவிர வேறு எந்த எழுத்தையும் அகற்ற, பின்வரும் ரீஜெக்ஸைப் பயன்படுத்தவும்:
வடிவம் : [^0-9a-zA-Z\., ]+
இது அனைத்து சிறப்பு எழுத்துகளையும் வெற்றிகரமாக நீக்குகிறது, ஆனால் கூடுதல் இடைவெளி உள்ளது.
இதைச் சரிசெய்ய, மேலே உள்ள செயல்பாட்டை நீங்கள் பல இடைவெளிகளுக்குப் பதிலாக ஒரு ஸ்பேஸ் கேரக்டரில் உள்ள வேறொன்றில் இணைக்கலாம்.
=RegExpReplace(RegExpReplace(A5,$A$2,""), " +", " ")
அல்லது அதே விளைவுடன் நேட்டிவ் TRIM செயல்பாட்டைப் பயன்படுத்தவும். :
=TRIM(RegExpReplace(A5, $A$2, ""))
எண் அல்லாத எழுத்துகளை அகற்ற Regex
ஒரு சரத்திலிருந்து எண் அல்லாத அனைத்து எழுத்துகளையும் நீக்க, நீங்கள் பயன்படுத்தலாம் இந்த நீண்ட சூத்திரம் அல்லது கீழே பட்டியலிடப்பட்டுள்ள மிக எளிய ரீஜெக்ஸ்களில் ஒன்று.
இலக்கமாக இல்லாத எந்த எழுத்தையும் பொருத்தவும்:
முறை : \D+
நிராகரிக்கப்பட்ட வகுப்புகளைப் பயன்படுத்தி எண் அல்லாத எழுத்துக்களை அகற்றவும்:
முறை : [^0-9]+
முறை : [^\d] +
உதவிக்குறிப்பு. உரையை அகற்றிவிட்டு, மீதமுள்ள எண்களை தனித்தனி கலங்களாகக் கொட்டுவது அல்லது குறிப்பிட்ட டிலிமிட்டருடன் பிரிக்கப்பட்ட ஒரு கலத்தில் வைப்பது உங்கள் இலக்காக இருந்தால், வழக்கமான வெளிப்பாடுகளைப் பயன்படுத்தி சரத்திலிருந்து எண்களை எவ்வாறு பிரித்தெடுப்பது என்பதில் விளக்கப்பட்டுள்ளபடி RegExpExtract செயல்பாட்டைப் பயன்படுத்தவும்.
ஸ்பேஸுக்குப் பிறகு அனைத்தையும் அகற்ற Regex
ஸ்பேஸுக்குப் பிறகு அனைத்தையும் அழிக்க, ஸ்பேஸ் ( ) அல்லதுமுதல் இடத்தைக் கண்டறிய வெண்வெளி (\s) எழுத்து மற்றும் .* அதற்குப் பிறகு எந்த எழுத்துக்குறிகளையும் பொருத்தவும்.
உங்களிடம் சாதாரண இடைவெளிகளை மட்டுமே கொண்ட ஒற்றை வரி சரங்கள் இருந்தால் (7-பிட் ASCII அமைப்பில் மதிப்பு 32) , கீழே உள்ள ரீஜெக்ஸில் நீங்கள் எதைப் பயன்படுத்துகிறீர்கள் என்பது உண்மையில் முக்கியமில்லை. மல்டி-லைன் ஸ்டிரிங்க்களில், இது ஒரு வித்தியாசத்தை ஏற்படுத்தும்.
எல்லாவற்றையும் அகற்ற ஸ்பேஸ் கேரக்டருக்குப் பிறகு , இந்த ரெஜெக்ஸைப் பயன்படுத்தவும்:
பேட்டர்ன் : " .*"
=RegExpReplace(A5, " .*", "")
இந்த சூத்திரம் ஒவ்வொரு வரியிலும் முதல் இடைவெளிக்குப் பிறகு எதையும் அகற்றும். முடிவுகள் சரியாகக் காண்பிக்க, மடக்கு உரையை இயக்குவதை உறுதிசெய்யவும்.
எல்லாவற்றையும் அகற்ற ஒரு இடைவெளிக்குப் பிறகு (ஒரு இடம், தாவல், வண்டி திரும்புதல் மற்றும் புதிய வரி உட்பட), regex உள்ளது:
முறை : \s.*
=RegExpReplace(A5, "\s.*", "")
ஏனெனில் \s புதிய வரி உட்பட சில வித்தியாசமான இடைவெளி வகைகளுடன் பொருந்துகிறது (\n), இந்த ஃபார்முலா ஒரு கலத்தில் எத்தனை வரிகள் இருந்தாலும், அதில் முதல் இடைவெளிக்குப் பிறகு அனைத்தையும் நீக்குகிறது.
குறிப்பிட்ட பிறகு உரையை அகற்ற Regex எழுத்து
முந்தைய எடுத்துக்காட்டில் உள்ள முறைகளைப் பயன்படுத்தி, நீங்கள் குறிப்பிடும் எந்த எழுத்துக்கும் பிறகு உரையை அழிக்கலாம்.
ஒவ்வொரு வரியையும் தனித்தனியாகக் கையாள:
பொதுவான முறை : char.*
ஒற்றை வரி சரங்களில், இது char க்குப் பிறகு அனைத்தையும் அகற்றும். பல வரி சரங்களில், ஒவ்வொரு வரியும் தனித்தனியாக செயலாக்கப்படும், ஏனெனில் VBA Regex சுவையில், ஒரு காலம் (.) புதிய எழுத்துகளைத் தவிர எந்த எழுத்துக்கும் பொருந்தும்ஒரு சரத்தின் தொடக்கம் ^, பூஜ்ஜியம் அல்லது அதற்கு மேற்பட்ட இடமில்லாத எழுத்துக்களை [^ ]* பொருத்துகிறோம், அவை உடனடியாக ஒன்று அல்லது அதற்கு மேற்பட்ட இடைவெளிகள் " +". முடிவுகளில் சாத்தியமான முன்னணி இடைவெளிகளைத் தடுக்க கடைசிப் பகுதி சேர்க்கப்பட்டது.
ஒவ்வொரு வரியிலும் முதல் இடைவெளிக்கு முன் உரையை அகற்ற, சூத்திரம் இயல்புநிலை "அனைத்து பொருத்தங்கள்" பயன்முறையில் எழுதப்படும் ( instance_num தவிர்க்கப்பட்டது):
=RegExpReplace(A5, "^[^ ]* +", "")
முதல் வரியில் முதல் இடைவெளிக்கு முன் உரையை நீக்கவும், மற்ற எல்லா வரிகளையும் அப்படியே விடவும், instance_num வாதமானது 1:
=RegExpReplace(A5, "^[^ ]* +", "", 1)
=RegExpReplace(A5, "^[^ ]* +", "", 1)
எழுத்துக்கு முன் உள்ள அனைத்தையும் அகற்ற ரீஜெக்ஸ்
குறிப்பிட்ட எழுத்துக்கு முன் அனைத்து உரைகளையும் அகற்றுவதற்கான எளிதான வழி ரீஜெக்ஸைப் பயன்படுத்துவதாகும். இது போல்:
பொதுவான முறை : ^[^char]*char
மனித மொழியில் மொழிபெயர்க்கப்பட்டது, இது கூறுகிறது: "ஒரு சரத்தின் தொடக்கத்திலிருந்து ^ , char [^char]* தவிர்த்து 0 அல்லது அதற்கு மேற்பட்ட எழுத்துக்களை char இன் முதல் நிகழ்வு வரை பொருத்தவும்.
உதாரணமாக, முதல் பெருங்குடலுக்கு முன் உள்ள எல்லா உரையையும் நீக்க , இந்த வழக்கமான வெளிப்பாட்டைப் பயன்படுத்தவும்:
முறை : ^[^:]*:
முடிவுகளில் முன்னணி இடைவெளிகளைத் தவிர்க்க, ஒரு இடைவெளி எழுத்தை \s* இல் சேர்க்கவும் இது எல்லாவற்றையும் நீக்கும் முதல் பெருங்குடலுக்கு முன் g மற்றும் அதற்குப் பிறகு ஏதேனும் இடைவெளிகளை ஒழுங்கமைக்கவும்:
முறை : ^[^:]*:\s*
=RegExpReplace(A5, "^[^:]*:\s*", "")
உதவிக்குறிப்பு. வழக்கமான வெளிப்பாடுகள் தவிர, நிலை அல்லது பொருத்தம் மூலம் உரையை அகற்ற எக்செல் அதன் சொந்த வழிகளைக் கொண்டுள்ளது. நேட்டிவ் ஃபார்முலாக்கள் மூலம் பணியை எப்படி நிறைவேற்றுவது என்பதை அறிய,எக்செல் இல் எழுத்துக்கு முன்னும் பின்னும் உரையை எவ்வாறு அகற்றுவது என்பதைப் பார்க்கவும்.
Regex தவிர அனைத்தையும் அகற்ற
நீங்கள் வைத்திருக்க விரும்பும் எழுத்துக்களைத் தவிர அனைத்து எழுத்துக்களையும் ஒரு சரத்திலிருந்து அழிக்க, நிராகரிக்கப்பட்ட எழுத்து வகுப்புகளைப் பயன்படுத்தவும்.
உதாரணமாக, சிறிய எழுத்துக்களைத் தவிர அனைத்து எழுத்துக்களையும் அகற்றவும். மற்றும் புள்ளிகள், ரீஜெக்ஸ்:
முறை : [^a-z\.]+
உண்மையில், எங்கள் செயல்பாடு அனைத்தையும் மாற்றுவதால் இங்கே + அளவுகோல் இல்லாமல் செய்யலாம் பொருத்தங்களைக் கண்டறிந்தனர். குவாண்டிஃபையர் அதைச் சற்று வேகமாகச் செய்கிறது - ஒவ்வொரு தனி எழுத்தைக் கையாளுவதற்குப் பதிலாக, ஒரு சப்ஸ்ட்ரிங்கை மாற்றுகிறீர்கள்.
=RegExpReplace(A5, "[^a-z\.]+", "")
எக்செல் இல் html குறிச்சொற்களை அகற்ற Regex
முதலில், HTML வழக்கமான மொழி அல்ல என்பதை கவனத்தில் கொள்ள வேண்டும், எனவே வழக்கமான வெளிப்பாடுகளைப் பயன்படுத்தி அதை அலசுவது சிறந்த வழி அல்ல. உங்கள் தரவுத்தொகுப்பை சுத்தமாக்குவதற்கு, regexs கண்டிப்பாக உங்கள் கலங்களில் இருந்து குறிச்சொற்களை அகற்ற உதவும்.
html குறிச்சொற்கள் எப்போதும் கோண அடைப்புக்குறிக்குள் வைக்கப்படுவதால், பின்வரும் ரீஜெக்ஸ்களில் ஒன்றைப் பயன்படுத்தி அவற்றைக் கண்டறியலாம்.
நிராகரிக்கப்பட்ட வகுப்பு:
வடிவம் : ]*>
இங்கே, நாம் ஒரு தொடக்கக் கோண அடைப்புக்குறியைப் பொருத்துகிறோம், அதைத் தொடர்ந்து எந்த எழுத்தின் பூஜ்ஜியம் அல்லது அதற்கு மேற்பட்ட நிகழ்வுகள் மூடும் கோண அடைப்புக்குறி [^>]* அருகிலுள்ள மூடும் கோண அடைப்புக்குறி வரை.
சோம்பேறி தேடல்:
முறை :
இங்கே, நாங்கள் பொருந்துகிறோம் முதல் திறப்பு அடைப்புக்குறி முதல் மூடும் அடைப்புக்குறி வரை எதையும். கேள்விக்குறி விசைகள் .* சில எழுத்துக்களைப் பொருத்த வேண்டும்வரி.
அனைத்து வரிகளையும் ஒரே சரமாக செயலாக்க:
பொதுவான முறை : சார்(.