Google Analytics के लिए Regex Filters कैसे लिखें और परीक्षण करें (उदाहरणों के साथ)

रेगुलर एक्सप्रेशंस रेगेक्स गूगल एनालिटिक्स फिल्टर

यहाँ मेरे कई लेखों के साथ, मैं एक ग्राहक के लिए कुछ शोध करता हूं और फिर यहां इसके बारे में लिखता हूं। ईमानदार होने के लिए, कुछ कारण हैं ... पहला यह है कि मेरे पास एक भयानक स्मृति है और अक्सर जानकारी के लिए अपनी खुद की वेबसाइट पर शोध करते हैं। दूसरा उन लोगों की मदद करना है जो जानकारी की तलाश में भी हो सकते हैं।

एक नियमित अभिव्यक्ति (रेगेक्स) क्या है?

रेगेक्स पाठ के भीतर वर्णों के एक पैटर्न को खोजने और पहचानने के लिए या तो पाठ को बदलने या बदलने के लिए एक विकास विधि है। सभी आधुनिक प्रोग्रामिंग लैंग्वेज रेगुलर एक्सप्रेशंस को सपोर्ट करती हैं।

मुझे नियमित अभिव्यक्ति पसंद है (regex) लेकिन वे सीखने और परीक्षण करने के लिए थोड़े निराश या पीड़ित हो सकते हैं। Google विश्लेषिकी में कुछ अद्भुत क्षमताएं हैं ... जहाँ आप नियमित अभिव्यक्तियों के साथ दृश्य बना सकते हैं या अपने डेटा को नियमित अभिव्यक्तियों में फ़िल्टर कर सकते हैं।

उदाहरण के लिए, यदि मैं अपने टैग पृष्ठों पर केवल ट्रैफ़िक देखना चाहता / चाहती हूं, तो मैं अपनी पर्मलिंक संरचना में / टैग / के लिए फ़िल्टर कर सकता हूं:

/tag\/

वाक्यविन्यास वहाँ महत्वपूर्ण है। अगर मैं सिर्फ "टैग" का उपयोग करता हूं, तो मुझे उन सभी शब्दों के साथ टैग मिल जाएंगे। अगर मैंने "/ टैग" का उपयोग किया है तो टैग के साथ शुरू होने वाले किसी भी URL को शामिल किया जाएगा, जैसे / टैग-प्रबंधन क्योंकि Google Analytics नियमित अभिव्यक्ति के बाद किसी भी वर्ण को शामिल करने के लिए डिफ़ॉल्ट है। इसलिए, मुझे यह सुनिश्चित करने की आवश्यकता है कि मेरे पास निम्नलिखित स्लैश शामिल हैं ... लेकिन इसमें एक भागने का चरित्र होना चाहिए।

पृष्ठ फ़िल्टर regex

रेगेक्स सिंटेक्स बेसिक्स

वाक्य - विन्यास विवरण
^ साथ शुरू होता है
$ इसी के साथ समाप्त होता है
. किसी भी वर्ण के लिए एक वाइल्डकार्ड
* पिछले आइटम का शून्य या अधिक
.* में किसी भी वर्ण से मेल खाता है
? शून्य या पिछले आइटम का एक समय
+ पिछले आइटम का एक या अधिक बार
| OR ऑपरेटर
[एबीसी] A या b या c (किसी भी संख्या में वर्ण हो सकते हैं)
[az] Z की सीमा (किसी भी वर्ण की संख्या हो सकती है)
[AZ] A से Z की सीमा (पूंजीकृत)
[0 - 9] 0 से 9 की सीमा (किसी भी संख्या में हो सकती है)
[A-zA-Z] Z या A से Z तक की सीमा
[ए-जेडए-जेड0-9] सभी अल्फ़ान्यूमेरिक वर्ण
1 {} बिल्कुल 1 उदाहरण (कोई भी संख्या हो सकती है)
{१-४} 1 से 4 उदाहरणों की सीमा (कोई भी संख्या हो सकती है)
{1,} 1 या अधिक उदाहरण (कोई भी संख्या हो सकती है)
() अपने नियम समूह बनाएं
\ विशेष वर्ण से बचो
\d अंक चरित्र
\D गैर-अंक चरित्र
\s सफेद जगह
\S गैर-सफेद स्थान
\w शब्द
\W गैर-शब्द (विराम चिह्न)

Google Analytics के लिए रेगेक्स उदाहरण

तो चलिए कुछ उदाहरणों को कुछ के लिए वहाँ रख देते हैं कस्टम फ़िल्टर। मेरे एक सहकर्मी ने मुझसे पथ के साथ एक आंतरिक पृष्ठ की पहचान करने के लिए सहायता मांगी / सूचकांक उन सभी ब्लॉग पोस्टों के अलावा, जिन्हें वर्ष में पर्मलिंक में लिखा गया था:

फ़िल्टर क्षेत्र के लिए मेरा कस्टम फ़िल्टर पैटर्न अनुरोध Url:

^/(index|[0-9]{4}\/)

मूल रूप से एक अनुगामी स्लैश के साथ समाप्त होने वाले / सूचकांक या किसी भी 4-अंकीय संख्यात्मक पथ को देखने के लिए कहा जाता है। मैंने Analytics में एक दृश्य बनाया और इसे फ़िल्टर के रूप में जोड़ा:

Google Analytics व्यू फ़िल्टर

यहाँ कुछ और उदाहरण दिए गए हैं:

  • आपके पास URL पर्मलिंक पथ में वर्ष के साथ एक ब्लॉग है और आप किसी भी वर्ष सूची को फ़िल्टर करना चाहते हैं। तो मैं किसी भी 4 अंक के बाद एक अनुगामी स्लैश चाहता हूं। URL फ़िल्टर पैटर्न का अनुरोध करें:

^/[0-9]{4}\/

  • आप अपने सभी पृष्ठों की तुलना करना चाहते हैं जहाँ शीर्षक है प्रमाण पत्र or प्रमाणीकरण उस में. पृष्ठ शीर्षक फ़िल्टर पैटर्न:

(.*)certificat(.*)

  • आप अपने अभियान माध्यम पर आधारित दो लैंडिंग पृष्ठों की तुलना करना चाहते हैं Google Analytics अभियान URL asm_medium = के रूप में सीधा संदेश or प्रदत्त खोज.

(direct\smail|paid\ssearch)

  • आप उन सभी उत्पादों की तुलना करना चाहते हैं जो URL पथ पर आधारित पुरुषों की शर्ट हैं। URL फ़िल्टर पैटर्न का अनुरोध करें:

^/mens/shirt/(.*)

  • आप उन सभी पृष्ठों की तुलना करना चाहते हैं जो संख्या के साथ समाप्त होने वाले URL पथ की संख्या रखते हैं। URL फ़िल्टर पैटर्न का अनुरोध करें:

^/page/[1-9]*/$

  • आप IP पते की एक श्रेणी को बाहर करना चाहते हैं। IP एड्रेस फ़िल्टर पैटर्न को छोड़ दें:

123\.456\.789\.[0-9]

  • आप एक thankyou.html पृष्ठ को शामिल करना चाहते हैं, जहां क्वेरिस्ट्रिंग सफलता = सत्य के आधार पर एक सबमिशन सफल रहा। URL फ़िल्टर पैटर्न का अनुरोध करें:

thankyou\.html\?success=true

अपने रेक्सएक्स एक्सप्रेशंस का परीक्षण कैसे करें

Google Analytics के भीतर परीक्षण और त्रुटि के बजाय, मैं अक्सर बस कूदता हूं रेगेक्स101, अपने नियमित अभिव्यक्ति के परीक्षण के लिए एक शानदार उपकरण। यह आपके लिए आपके सिंटैक्स को भी तोड़ता है और आपकी नियमित अभिव्यक्ति का विवरण प्रदान करता है:

नियमित अभिव्यक्ति regex101

बिल्ड, टेस्ट और डीबग रेगेक्स

तुम्हें क्या लगता है?

यह साइट स्पैम को कम करने के लिए अकिस्मेट का उपयोग करती है। जानें कि आपका डेटा कैसे संसाधित किया जाता है.