Google शीट्स से डेटा निकालें: स्ट्रिंग्स से कुछ टेक्स्ट, लिंक्स से यूआरएल, और बहुत कुछ

  • इसे साझा करें
Michael Brown

विषयसूची

स्प्रेडशीट में पाठ के साथ हमारे संचालन का यह अगला भाग निष्कर्षण के लिए समर्पित है। विभिन्न डेटा निकालने के तरीके खोजें - पाठ, वर्ण, संख्याएँ, URL, ईमेल पते, दिनांक और amp; समय, आदि - एक साथ कई Google शीट सेल में विभिन्न पदों से। चादरें सब कुछ हैं। जबकि कुछ कॉम्बो टेक्स्ट और amp जोड़ते हैं; संख्याओं और विभिन्न वर्णों को हटा दें, उनमें से कुछ पाठ, संख्याएँ, अलग-अलग वर्ण आदि भी निकालते हैं। जब आप Google पत्रक से डेटा निकालने वाले होते हैं तो सेल LEFT, RIGHT और MID होते हैं। वे स्थिति के अनुसार कोई भी डेटा प्राप्त करते हैं।

Google पत्रक में सेल की शुरुआत से डेटा निकालें

आप LEFT फ़ंक्शन का उपयोग करके पहले N वर्णों को आसानी से निकाल सकते हैं:

LEFT(string, [number_of_characters])
  • स्ट्रिंग वह टेक्स्ट है जहां से आप डेटा निकालना चाहते हैं। बाईं ओर से।

यहां सबसे सरल उदाहरण दिया गया है: फोन नंबरों से देश कोड निकालते हैं:

जैसा कि आप देख सकते हैं, देश कोड सेल की शुरुआत में 6 प्रतीक लेते हैं, इसलिए आपको जो सूत्र चाहिए वह है:

=LEFT(A2,6)

युक्ति। ArrayFormula से 6 वर्ण प्राप्त करना संभव हो जाएगाएक बार में संपूर्ण श्रेणी:

=ArrayFormula(LEFT(A2:A7,6))

Google पत्रक में सेल के अंत से डेटा निकालें

सेल से अंतिम N वर्ण निकालने के लिए, इसके बजाय राइट फ़ंक्शन का उपयोग करें:

RIGHT(string,[number_of_characters])
  • string डेटा निकालने के लिए अभी भी टेक्स्ट (या सेल संदर्भ) है।
  • <12 number_of_characters भी दाईं ओर से लिए जाने वाले वर्णों की संख्या है।

आइए उसी फ़ोन नंबर से उस देश के नाम प्राप्त करें:

वे केवल 2 अक्षर लेते हैं और ठीक यही मैं सूत्र में उल्लेख करता हूं:

=RIGHT(A2,2)

युक्ति। ArrayFormula एक बार में सभी Google पत्रक कक्षों के अंत से डेटा निकालने में आपकी सहायता करेगा:

=ArrayFormula(RIGHT(A2:A7,2))

Google पत्रक में कक्षों के मध्य से डेटा निकालें

यदि सेल के आरंभ और अंत से डेटा निकालने के लिए फ़ंक्शन हैं, तो मध्य से डेटा निकालने के लिए भी फ़ंक्शन होना चाहिए। और हाँ — एक है।

इसे MID कहते हैं:

MID(string, start_at, extract_length)
  • string — टेक्स्ट जहाँ से आप निकालना चाहते हैं से मध्य भाग।
  • शुरू_पर — उस वर्ण की स्थिति जिससे आप डेटा प्राप्त करना शुरू करना चाहते हैं।
  • extract_length — संख्या वर्णों की संख्या जिन्हें आपको निकालने की आवश्यकता है।

समान फ़ोन नंबरों के उदाहरण से, आइए उन फ़ोन नंबरों का पता लगाएं, जिनके देश कोड और देश नहीं हैंसंक्षिप्ताक्षर:

चूंकि देश कोड 6वें वर्ण के साथ समाप्त होता है और 7वां डैश है, मैं 8वें अंक से शुरू होने वाली संख्याओं को निकालूंगा। और मुझे कुल 8 अंक मिलेंगे:

=MID(A2,8,8)

युक्ति। एक सेल को पूरी रेंज में बदलने और इसे ArrayFormula में लपेटने से आपको प्रत्येक सेल के लिए एक ही बार में परिणाम मिल जाएगा:

=ArrayFormula(MID(A2:A7,8,8))

स्ट्रिंग से टेक्स्ट/नंबर निकालें

कभी-कभी स्थिति के अनुसार टेक्स्ट निकालना (जैसा कि ऊपर दिखाया गया है) कोई विकल्प नहीं है। आवश्यक तार आपके सेल के किसी भी हिस्से में हो सकते हैं और इसमें वर्णों की एक अलग संख्या होती है जो आपको प्रत्येक सेल के लिए अलग-अलग सूत्र बनाने के लिए मजबूर करती है।

लेकिन Google पत्रक Google पत्रक नहीं होता यदि इसमें अन्य फ़ंक्शन जो स्ट्रिंग्स से टेक्स्ट निकालने में मदद करेंगे।

आइए कुछ संभावित तरीकों की समीक्षा करें जो स्प्रेडशीट प्रदान करते हैं।

किसी निश्चित टेक्स्ट से पहले डेटा निकालें - LEFT+SEARCH

जब भी आप एक निश्चित पाठ से पहले डेटा निकालना चाहते हैं, LEFT + SEARCH का उपयोग करें:

  • LEFT कोशिकाओं की शुरुआत से वर्णों की एक निश्चित संख्या वापस करने के लिए उपयोग किया जाता है (उनके बाएं से)
  • SEARCH कुछ वर्णों/स्ट्रिंग्स की तलाश करता है और उनकी स्थिति प्राप्त करता है।

इन्हें मिलाएं — और LEFT SEARCH द्वारा सुझाए गए वर्णों की संख्या वापस कर देगा।<3

यहां एक उदाहरण दिया गया है: आप प्रत्येक 'ईए' से पहले टेक्स्टुअल कोड कैसे निकालते हैं?

यह सूत्र है जो आपको समान बनाने में मदद करेगामामले:

=LEFT(A2,SEARCH("ea",A2)-1)

फ़ॉर्मूला में यह है कि क्या होता है:

  1. SEARCH("ea",A2 ) A2 में 'ea' की तलाश करता है और उस स्थिति को लौटाता है जहां से प्रत्येक सेल के लिए 'ea' शुरू होता है — 10।
  2. तो 10वां स्थान वह है जहां 'e' रहता है। लेकिन चूंकि मुझे 'ईए' से ठीक पहले सब कुछ चाहिए, मुझे उस स्थिति से 1 घटाना होगा। अन्यथा, 'ई' भी वापस कर दिया जाएगा। तो अंत में मुझे 9 मिलते हैं।
  3. बाएं ए2 को देखता है और पहले 9 वर्ण प्राप्त करता है।

पाठ के बाद डेटा निकालें

वहां एक निश्चित टेक्स्ट स्ट्रिंग के बाद सबकुछ प्राप्त करने का भी अर्थ है। लेकिन इस बार राइट मदद नहीं करेगा। इसके बजाय, REGEXREPLACE अपनी बारी लेता है।

युक्ति। REGEXREPLACE रेगुलर एक्सप्रेशन का उपयोग करता है। यदि आप उनसे निपटने के लिए तैयार नहीं हैं, तो नीचे वर्णित एक बहुत आसान समाधान है। REGEXREPLACE(टेक्स्ट, रेगुलर_एक्सप्रेशन, रिप्लेसमेंट)

  • टेक्स्ट एक स्ट्रिंग या सेल है जहाँ आप परिवर्तन करना चाहते हैं
  • रेगुलर_एक्सप्रेशन का संयोजन है वर्ण जो उस पाठ के एक भाग के लिए खड़े हैं जिसे आप ढूंढ रहे हैं
  • प्रतिस्थापन वह है जो आप उस पाठ
के बजाय प्राप्त करना चाहते हैं

तो, आप मेरे उदाहरण में एक निश्चित पाठ — 'ea' के बाद डेटा निकालने के लिए इसका उपयोग कैसे करते हैं?

आसान - इस सूत्र का उपयोग करके:

=REGEXREPLACE(A2,"(.*)ea(.*)","$2")

मुझे समझाएं कि यह फ़ॉर्मूला वास्तव में कैसे काम करता है:

  1. A2 एक सेल है जिसे मैं निकाल रहा हूं से डेटा।
  2. "(.*)ea(.*)" मेरा नियमित हैअभिव्यक्ति (या आप इसे एक मुखौटा कह सकते हैं)। मैं 'ई' की तलाश करता हूं और अन्य सभी पात्रों को कोष्ठक में रखता हूं। वर्णों के 2 समूह हैं - 'ea' से पहले सब कुछ पहला समूह (.*) है और 'ea' के बाद सब कुछ दूसरा (.*) है। पूरे मास्क को दोहरे-उद्धरणों में रखा गया है।
  3. "$2" वह है जो मैं प्राप्त करना चाहता हूं - दूसरा समूह (इसलिए इसकी संख्या 2) पिछले तर्क से।

युक्ति। इस विशेष पृष्ठ पर रेगुलर एक्सप्रेशन में प्रयुक्त सभी वर्ण एकत्र किए जाते हैं।

Google पत्रक कक्षों से संख्याएँ निकालें

क्या होगा यदि आप केवल संख्याएँ निकालना चाहते हैं जब उनकी स्थिति और जो कुछ भी & after कोई फर्क नहीं पड़ता?

Masks (उर्फ रेगुलर एक्सप्रेशन) भी मदद करेंगे। वास्तव में, मैं वही REGEXREPLACE फ़ंक्शन लूंगा और रेगुलर एक्सप्रेशन बदलूंगा:

=REGEXREPLACE(A2,"[^[:digit:]]", "")

  1. A2 है एक सेल जहां से मैं उन नंबरों को प्राप्त करना चाहता हूं। वह ^कैरेट प्रतीक है जो अंकों के लिए एक अपवाद बनाता है।
  2. "" संख्यात्मक वर्णों को छोड़कर "कुछ नहीं" के साथ सब कुछ बदल देता है। या, दूसरे शब्दों में, इसे पूरी तरह से हटा देता है, कोशिकाओं में केवल संख्याएं छोड़ देता है। या, संख्याएं निकालता है:)

संख्याओं और अन्य वर्णों को अनदेखा करते हुए पाठ निकालें

इसी तरह से, आप Google पत्रक कक्षों से केवल वर्णानुक्रमिक डेटा निकाल सकते हैं। नियमित अभिव्यक्ति के लिए संकुचन किपाठ के लिए खड़ा है तदनुसार कहा जाता है - अल्फा:

=REGEXREPLACE(A2,"[^[:alpha:]]", "")

यह सूत्र सब कुछ लेता है लेकिन अक्षर (A-Z, a-z) और शाब्दिक रूप से इसे "कुछ नहीं" से बदल देता है . या, इसे दूसरे तरीके से रखने के लिए, केवल अक्षरों को निकालता है।

Google पत्रक कक्षों से डेटा निकालने के सूत्र-मुक्त तरीके

यदि आप एक आसान सूत्र-मुक्त तरीका ढूंढ रहे हैं विभिन्न प्रकार के डेटा निकालें, आप सही जगह पर आए हैं। हमारे पावर टूल्स ऐड-ऑन में सिर्फ काम के लिए उपकरण हैं।

पावर टूल्स ऐड-ऑन का उपयोग करके विभिन्न प्रकार के डेटा निकालें

पहला टूल जो मैं आपको बताना चाहता हूं उसे एक्सट्रेक्ट कहा जाता है . यह ठीक वही करता है जो आप इस लेख में खोज रहे हैं — Google पत्रक सेल से विभिन्न प्रकार के डेटा निकालता है।

उपयोगकर्ता के अनुकूल सेटिंग्स

मैंने जिन मामलों को ऊपर कवर किया है वे सभी नहीं हैं ऐड-ऑन के साथ ही हल किया जा सकता है। उपकरण उपयोगकर्ता के अनुकूल है इसलिए आपको केवल उस श्रेणी का चयन करना है जिसे आप संसाधित करना चाहते हैं और आवश्यक चेकबॉक्स को बंद कर दें। कोई सूत्र नहीं, कोई रेगुलर एक्सप्रेशन नहीं।

REGEXREPLACE और रेगुलर एक्सप्रेशंस के साथ इस लेख का दूसरा बिंदु याद रखें? ऐड-ऑन के लिए यह कितना आसान है:

अतिरिक्त विकल्प

जैसा कि आप देख सकते हैं, कुछ अतिरिक्त विकल्प हैं (सिर्फ चेकबॉक्स) कि आप सबसे सटीक परिणाम प्राप्त करने के लिए तुरंत चालू/बंद कर सकते हैं:

  1. केवल आवश्यक टेक्स्ट केस के स्ट्रिंग प्राप्त करें।
  2. प्रत्येक से सभी घटनाओं को बाहर निकालेंसेल और उन्हें एक सेल या अलग कॉलम में रखें।
  3. स्रोत डेटा के दाईं ओर परिणाम के साथ एक नया कॉलम डालें।
  4. स्रोत डेटा से निकाले गए टेक्स्ट को साफ़ करें।

विभिन्न डेटा प्रकार निकालें

न केवल Power Tools कुछ टेक्स्ट स्ट्रिंग्स और पहले/अंतिम N वर्णों से पहले/बाद/बीच में डेटा निकालता है; लेकिन यह निम्नलिखित को भी निकालता है:

  1. दशमलव/हजारों विभाजकों को बरकरार रखते हुए उनके दशमलव के साथ संख्याएँ:

  • N वर्ण एक सेल में एक निश्चित स्थान से शुरू करना।
  • हाइपरलिंक्स (टेक्स्ट + लिंक), यूआरएल (लिंक), ईमेल पते।
  • हर जगह से डेटा के किसी भी स्ट्रिंग को निकालें

    वहाँ है अपना खुद का सटीक पैटर्न सेट करने और निष्कर्षण के लिए इसका उपयोग करने का विकल्प भी। मास्क द्वारा एक्सट्रेक्ट करें और इसके वाइल्डकार्ड कैरेक्टर — * और ? — ट्रिक करें:

    • उदाहरण के लिए, आप बाहर ला सकते हैं निम्नलिखित मास्क का उपयोग करके कोष्ठक के बीच सब कुछ: (*)
    • या उन SKU को प्राप्त करें जिनके आईडी में केवल 5 नंबर हैं: SKU?????
    • या, जैसा कि मैंने नीचे स्क्रीनशॉट पर दिखाया है, प्रत्येक सेल में प्रत्येक 'ईए' के ​​बाद सब कुछ खींच लें: ea*

    टाइमस्टैंप से दिनांक और समय निकालें

    बोनस के रूप में, एक छोटा टूल है जो टाइमस्टैम्प से दिनांक और समय निकालेगा — इसे स्प्लिट डेट और amp; Time.

    हालांकि इसे पहली बार टाइमस्टैम्प को विभाजित करने के लिए बनाया गया था, यह पूरी तरह से हैव्यक्तिगत रूप से वांछित इकाइयों में से एक को प्राप्त करने में सक्षम:

    Google पत्रक में टाइमस्टैम्प से आप क्या निकालना चाहते हैं - दिनांक या समय - के आधार पर बस एक चेकबॉक्स का चयन करें और हिट करें विभाजित करें । आवश्यक इकाई को एक नए कॉलम में कॉपी किया जाएगा (या यदि आप अंतिम चेकबॉक्स भी चुनते हैं तो यह मूल डेटा को बदल देगा):

    यह टूल भी इसका हिस्सा है पावर टूल्स ऐड-ऑन इसलिए एक बार जब आप इसे Google पत्रक कक्षों से कोई भी डेटा प्राप्त करने के लिए स्थापित करते हैं, तो यह आपको पूरी तरह से कवर कर लेता है। यदि नहीं, तो कृपया एक टिप्पणी छोड़ें और हम आपकी सहायता करेंगे :)

    माइकल ब्राउन सॉफ्टवेयर टूल्स का उपयोग करके जटिल प्रक्रियाओं को सरल बनाने के जुनून के साथ एक समर्पित प्रौद्योगिकी उत्साही है। टेक उद्योग में एक दशक से अधिक के अनुभव के साथ, उन्होंने माइक्रोसॉफ्ट एक्सेल और आउटलुक के साथ-साथ गूगल शीट्स और डॉक्स में अपने कौशल को निखारा है। माइकल का ब्लॉग अपने ज्ञान और विशेषज्ञता को दूसरों के साथ साझा करने के लिए समर्पित है, उत्पादकता और दक्षता में सुधार के लिए आसान-से-अनुसरण युक्तियाँ और ट्यूटोरियल प्रदान करता है। चाहे आप एक अनुभवी पेशेवर हों या नौसिखिए, माइकल का ब्लॉग इन आवश्यक सॉफ़्टवेयर उपकरणों से अधिकाधिक लाभ उठाने के लिए मूल्यवान अंतर्दृष्टि और व्यावहारिक सलाह प्रदान करता है।