استخراج البيانات من جداول بيانات Google: نص معين من السلاسل وعناوين URL من الروابط والمزيد

Michael Brown

الجزء التالي من عملياتنا مع النص في جداول البيانات مكرس للاستخراج. اكتشف طرقًا لاستخراج البيانات المختلفة - النصوص والأحرف والأرقام وعناوين URL وعناوين البريد الإلكتروني والتاريخ وأمبير ؛ الوقت ، وما إلى ذلك - من مواضع مختلفة في عدة خلايا جداول بيانات Google في وقت واحد.

    صيغ جداول بيانات Google لاستخراج النص والأرقام من السلاسل

    الصيغ في Google الأوراق هي كل شيء. بينما تضيف بعض المجموعات نصًا & أمبير ؛ الأرقام وإزالة الأحرف المختلفة ، بعضها أيضًا يستخرج نصًا وأرقامًا وأحرفًا منفصلة ، إلخ.

    استخراج البيانات حسب الموضع: الأحرف الأولى / الأخيرة / الوسطى N

    أسهل الوظائف للتعامل معها عندما تكون على وشك سحب البيانات من خلايا "جداول بيانات Google" هي LEFT و RIGHT و MID. يحصلون على أي بيانات حسب الموضع.

    استخراج البيانات من بداية الخلايا في جداول بيانات Google

    يمكنك بسهولة سحب الأحرف N الأولى باستخدام الوظيفة LEFT:

    LEFT (سلسلة ، [number_of_characters])
    • السلسلة هي النص الذي تريد استخراج البيانات منه.
    • number_of_characters هو عدد الأحرف التي يجب إخراجها في البداية من اليسار.

    إليك أبسط مثال: لنخرج رموز البلدان من أرقام الهواتف:

    كما ترى ، البلد تأخذ الرموز 6 رموز في بداية الخلايا ، لذا فإن الصيغة التي تحتاجها هي:

    =LEFT(A2,6)

    نصيحة. ArrayFormula سيجعل من الممكن الحصول على 6 أحرف من ملفالنطاق بالكامل مرة واحدة:

    =ArrayFormula(LEFT(A2:A7,6))

    استخراج البيانات من نهاية الخلايا في جداول بيانات Google

    لسحب آخر حرف N من الخلايا ، استخدم الدالة RIGHT بدلاً من ذلك:

    RIGHT (سلسلة ، [number_of_characters])
    • السلسلة لا تزال هي النص (أو مرجع خلية) لاستخراج البيانات من.
    • 1 3>

      يأخذون حرفين فقط وهذا بالضبط ما أذكره في الصيغة:

      =RIGHT(A2,2)

      نصيحة. ستساعدك ArrayFormula أيضًا على استخراج البيانات من نهاية جميع خلايا جداول بيانات Google في وقت واحد:

      =ArrayFormula(RIGHT(A2:A7,2))

      استخراج البيانات من منتصف الخلايا في جداول بيانات Google

      إذا كانت هناك وظائف لاستخراج البيانات من بداية الخلايا ونهايتها ، فيجب أن تكون هناك وظيفة لاستخراج البيانات من الوسط أيضًا. ونعم - هناك واحد.

      يسمى MID:

      MID (سلسلة ، ابتداءً من ، extract_length)
      • سلسلة - النص الذي تريد إزالته الجزء الأوسط من.
      • start_at - موضع الحرف الذي تريد بدء الحصول على البيانات منه.
      • extract_length - الرقم من الأحرف التي تحتاج إلى سحبها.

      من خلال مثال أرقام الهواتف نفسها ، دعنا نجد أرقام الهواتف نفسها بدون رموز البلدان والبلدالاختصار:

      نظرًا لأن رموز البلدان تنتهي بالحرف السادس والسابع هي الشرطة ، سأقوم بسحب الأرقام بدءًا من الرقم الثامن. سأحصل على إجمالي 8 أرقام:

      =MID(A2,8,8)

      نصيحة. سيؤدي تغيير خلية واحدة إلى النطاق بالكامل ولفها في ArrayFormula إلى تزويدك بالنتيجة لكل خلية في وقت واحد:

      =ArrayFormula(MID(A2:A7,8,8))

      استخراج النص / الأرقام من السلاسل

      في بعض الأحيان ، لا يعد استخراج النص حسب الموضع (كما هو موضح أعلاه) خيارًا. قد توجد السلاسل المطلوبة في أي جزء من خلاياك وتتكون من عدد مختلف من الأحرف التي تجبرك على إنشاء صيغ مختلفة لكل خلية.

      لكن جداول بيانات Google لن تكون جداول بيانات Google إذا لم يكن بها وظائف أخرى من شأنها أن تساعد في استخراج النص من السلاسل.

      دعونا نراجع بعض الطرق الممكنة التي تقدمها جداول البيانات.

      متى أردت تريد استخراج البيانات التي تسبق نصًا معينًا ، استخدم LEFT + SEARCH:

      • LEFT يُستخدم لإرجاع عدد معين من الأحرف من بداية الخلايا (من اليسار)
      • SEARCH يبحث عن أحرف / سلاسل معينة ويحصل على مواقعها.

      ادمج هذه - وسيعرض LEFT عدد الأحرف التي اقترحها البحث.

      إليك مثال: كيف يمكنك استخراج الرموز النصية قبل كل 'ea'؟

      هذه هي الصيغة التي ستساعدك فيالحالات:

      =LEFT(A2,SEARCH("ea",A2)-1)

      إليك ما يحدث في الصيغة:

      1. SEARCH ("ea"، A2 ) يبحث عن "ea" في A2 ويعيد الموضع الذي يبدأ فيه "ea" لكل خلية - 10.
      2. لذا فإن الموضع العاشر هو المكان الذي توجد فيه "e". ولكن بما أنني أريد كل شيء قبل "ea" ، فأنا بحاجة لطرح 1 من هذا الموضع. خلاف ذلك ، سيتم إرجاع "e" أيضًا. لذا أحصل على 9 في النهاية.
      3. LEFT ينظر إلى A2 ويحصل على الأحرف التسعة الأولى.

      استخراج البيانات بعد النص

      هناك هي أيضًا وسيلة للحصول على كل شيء بعد سلسلة نصية معينة. لكن هذه المرة ، لن يساعد RIGHT. بدلاً من ذلك ، يأخذ REGEXREPLACE دوره.

      نصيحة. يستخدم REGEXREPLACE التعبيرات العادية. إذا لم تكن مستعدًا للتعامل معها ، فهناك حل أسهل بكثير موصوف أدناه. REGEXREPLACE (النص ، التعبير العادي ، الاستبدال)

      • النص عبارة عن سلسلة أو خلية تريد إجراء التغييرات فيها
      • تعبير_العادي هو مزيج من الأحرف التي تمثل جزءًا من النص الذي تبحث عنه
      • الاستبدال هو كل ما تريد الحصول عليه بدلاً من ذلك النص

      إذن ، كيف تستخدمه لاستخراج البيانات بعد نص معين - 'ea' في المثال الخاص بي؟

      سهل - باستخدام هذه الصيغة:

      =REGEXREPLACE(A2,"(.*)ea(.*)","$2")

      دعني أوضح كيف تعمل هذه الصيغة تمامًا:

      1. A2 هي خلية أقوم باستخراجها البيانات من.
      2. "(. *) ea (. *)" هي بياناتي العاديةالتعبير (أو يمكنك تسميته قناع). أبحث عن "ea" وأضع جميع الشخصيات الأخرى بين قوسين. هناك مجموعتان من الأحرف - كل شيء قبل "ea" هو المجموعة الأولى (. *) وكل شيء بعد "ea" هو المجموعة الثانية (. *). يتم وضع القناع بأكمله في علامات اقتباس مزدوجة.
      3. "$ 2" هو ما أريد الحصول عليه - المجموعة الثانية (ومن ثم الرقم 2) من الوسيطة السابقة.

      نصيحة. يتم جمع جميع الأحرف المستخدمة في التعبيرات العادية في هذه الصفحة الخاصة.

      استخراج الأرقام من خلايا جداول بيانات Google

      ماذا لو كنت تريد استخراج الأرقام فقط عند وضعها وأي شيء يحدث قبل & amp؛ after doesn't matter؟

      الأقنعة (الملقب بالتعبيرات العادية) ستساعد أيضًا. في الواقع ، سآخذ نفس وظيفة REGEXREPLACE وأغير التعبير العادي:

      =REGEXREPLACE(A2,"[^[:digit:]]", "")

      1. A2 هو خلية أريد الحصول على هذه الأرقام منها.
      2. "[^ [: digit:]]" هو تعبير عادي يأخذ كل شيء ما عدا الأرقام. رمز علامة الإقحام هذا هو ما يجعل استثناءً للأرقام.
      3. "" يستبدل كل شيء باستثناء الأحرف الرقمية بـ "لا شيء". أو بعبارة أخرى ، تزيلها تمامًا ، تاركةً أرقامًا فقط في الخلايا. أو ، استخراج الأرقام :)

      استخراج النص الذي يتجاهل الأرقام والأحرف الأخرى

      بطريقة مماثلة ، يمكنك استخراج البيانات الأبجدية فقط من خلايا جداول بيانات Google. تقلص التعبير النمطي أنيرمز إلى النص وفقًا لذلك - alpha:

      =REGEXREPLACE(A2,"[^[:alpha:]]", "")

      تأخذ هذه الصيغة كل شيء ما عدا الأحرف (A-Z ، a-z) وتستبدلها حرفياً بـ "لا شيء" . أو ، بعبارة أخرى ، أخرج الأحرف فقط.

      طرق خالية من الصيغة لاستخراج البيانات من خلايا جداول بيانات Google

      إذا كنت تبحث عن طريقة سهلة خالية من المعادلات استخراج أنواع مختلفة من البيانات ، لقد وصلت إلى المكان الصحيح. تحتوي الوظيفة الإضافية Power Tools على الأدوات اللازمة للمهمة فقط.

      استخراج أنواع مختلفة من البيانات باستخدام الوظائف الإضافية Power Tools

      تسمى الأداة الأولى التي أرغب في معرفتها باسم Extract . إنه يفعل بالضبط ما جئت تبحث عنه في هذه المقالة - يستخرج أنواعًا مختلفة من البيانات من خلايا جداول بيانات Google.

      الإعدادات سهلة الاستخدام

      جميع الحالات التي غطيتها أعلاه ليست كذلك فقط قابل للحل مع الوظيفة الإضافية. الأداة سهلة الاستخدام لذلك كل ما عليك فعله هو تحديد النطاق الذي تريد معالجته وتحديد مربعات الاختيار المطلوبة. لا توجد صيغ ، ولا توجد تعابير عادية.

      هل تتذكر النقطة الثانية من هذه المقالة مع REGEXREPLACE والتعبيرات العادية؟ إليك مدى بساطة الوظيفة الإضافية:

      خيارات إضافية

      كما ترى ، هناك بعض الخيارات الإضافية (مربعات اختيار فقط) التي يمكنك تشغيل / إيقاف تشغيل بسرعة للحصول على النتيجة الأكثر دقة:

      1. احصل على سلاسل حالة النص المطلوبة فقط.
      2. اسحب جميع التكرارات من كل منهاخلية ووضعها في خلية واحدة أو أعمدة منفصلة.
      3. أدخل عمودًا جديدًا مع النتيجة على يمين البيانات المصدر.
      4. امسح النص المستخرج من البيانات المصدر.

      استخراج أنواع بيانات مختلفة

      ليست أدوات الطاقة فقط تستخرج البيانات قبل / بعد / بين سلاسل نصية معينة وأول / آخر حرف N ؛ ولكنه يحذف أيضًا ما يلي:

      1. الأرقام مع الكسور العشرية التي تحافظ على الفواصل العشرية / الآلاف كما هي:

    • N حرفًا بدءًا من موضع معين في الخلية.
    • الارتباطات التشعبية (نص + ارتباط) وعناوين URL (ارتباط) وعناوين البريد الإلكتروني.
    • استخراج أي سلسلة من البيانات من كل مكان

      هناك أيضًا خيار لإعداد النمط الدقيق الخاص بك واستخدامه في الاستخراج. استخراج بالقناع وأحرف البدل الخاصة به - * و ؟ - نفذ الحيلة:

      • على سبيل المثال ، يمكنك إبراز كل شيء بين الأقواس باستخدام القناع التالي: (*)
      • أو احصل على وحدات SKU التي تحتوي على 5 أرقام فقط في معرّفاتها: SKU ؟؟؟؟؟
      • أو ، كما أعرض في لقطة الشاشة أدناه ، اسحب كل شيء بعد كل "عصام" في كل خلية: ea *

      استخراج التاريخ والوقت من الطوابع الزمنية

      كمكافأة ، هناك أداة أصغر ستستخرج التاريخ والوقت من الطوابع الزمنية - تسمى Split Date & amp؛ الوقت.

      على الرغم من أنه تم إنشاؤه لتقسيم الطوابع الزمنية في المقام الأول ، إلا أنه مثاليقادر على الحصول على إحدى الوحدات المطلوبة بشكل فردي:

      ما عليك سوى تحديد أحد مربعات الاختيار بناءً على ما تريد استخراجه - التاريخ أو الوقت - من الطوابع الزمنية في جداول بيانات Google واضغط انقسام . سيتم نسخ الوحدة المطلوبة إلى عمود جديد (أو ستحل محل البيانات الأصلية إذا حددت مربع الاختيار الأخير أيضًا):

      هذه الأداة هي أيضًا جزء من الوظيفة الإضافية Power Tools ، فبمجرد تثبيتها للحصول على أي بيانات من خلايا Google Sheets ، ستوفر لك التغطية بالكامل. إذا لم يكن كذلك ، فالرجاء ترك تعليق وسنساعدك :)

    مايكل براون متحمس للتكنولوجيا ولديه شغف لتبسيط العمليات المعقدة باستخدام أدوات البرمجيات. مع أكثر من عشر سنوات من الخبرة في صناعة التكنولوجيا ، صقل مهاراته في Microsoft Excel و Outlook ، بالإضافة إلى جداول بيانات Google والمستندات. مدونة مايكل مكرسة لمشاركة معرفته وخبرته مع الآخرين ، وتقديم نصائح ودروس تعليمية سهلة المتابعة لتحسين الإنتاجية والكفاءة. سواء كنت محترفًا متمرسًا أو مبتدئًا ، تقدم مدونة مايكل رؤى قيمة ونصائح عملية للحصول على أقصى استفادة من أدوات البرامج الأساسية هذه.