कैसे एक बड़ी साइट क्रॉल करने के लिए और चीखना मेंढक के एसईओ स्पाइडर का उपयोग करके डेटा निकालें

चीखना मेंढक एसईओ स्पाइडर

हम अभी कई ग्राहकों की सहायता कर रहे हैं बाजारू पलायन. चूंकि बड़ी कंपनियां इस तरह के उद्यम समाधानों का उपयोग करती हैं, यह एक मकड़ी के जाले की तरह है जो वर्षों से प्रक्रियाओं और प्लेटफार्मों में खुद को बुनता है ... जब तक कि कंपनियां हर टचपॉइंट से अवगत नहीं होती हैं।

मार्केटो जैसे एंटरप्राइज मार्केटिंग ऑटोमेशन प्लेटफॉर्म के साथ, फॉर्म पूरे साइट और लैंडिंग पेज पर डेटा का प्रवेश बिंदु हैं। कंपनियों के पास अक्सर अपनी साइटों में हजारों पृष्ठ और सैकड़ों फ़ॉर्म होते हैं जिन्हें अपडेट करने के लिए पहचानने की आवश्यकता होती है।

इसके लिए एक बढ़िया टूल है चीखना मेंढक का एसईओ स्पाइडर... शायद साइट से डेटा क्रॉल करने, ऑडिट करने और निकालने के लिए बाज़ार में सबसे लोकप्रिय मंच। प्लेटफ़ॉर्म सुविधा-संपन्न है और आपके लिए आवश्यक प्रत्येक कार्य के लिए सैकड़ों विकल्प प्रदान करता है।

चीखना मेंढक एसईओ मकड़ी: क्रॉल और निकालें

फ्रॉगिंग एसईओ स्पाइडर की एक प्रमुख विशेषता यह है कि आप इसके आधार पर कस्टम एक्सट्रैक्ट कर सकते हैं regex, XPathया, सीएसएसपाथ विशिष्टता। यह अत्यंत उपयोगी है क्योंकि हम क्लाइंट की साइटों को क्रॉल करना चाहते हैं और पृष्ठों से मुंचकिनआईडी और फॉर्मआईड मूल्यों को ऑडिट और कैप्चर करना चाहते हैं।

उपकरण के साथ, खोलें कॉन्फ़िगरेशन> कस्टम> निष्कर्षण उन तत्वों की पहचान करने के लिए जिन्हें आप निकालना चाहते हैं।

screamingfrog कस्टम निष्कर्षण

निष्कर्षण स्क्रीन लगभग असीमित डेटा संग्रह के लिए अनुमति देता है:

चीखना मेंढक एसईओ स्पाइडर एक्सट्रैक्शन नियम

रेगेक्स, XPath, और CSSPath एक्सट्रैक्शन

MunchkinID के लिए, पहचानकर्ता प्रपत्र स्क्रिप्ट के भीतर स्थित है जो पृष्ठ के भीतर है:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

हम फिर आवेदन करते हैं रेगेक्स नियम पृष्ठ में डाले गए स्क्रिप्ट टैग के भीतर से आईडी कैप्चर करने के लिए:

Regex: ["']id["']: *["'](.*?)["']

फॉर्म आईडी के लिए, डेटा मार्केटो फॉर्म में एक इनपुट टैग में है:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

हम एक लागू करते हैं XPath नियम पृष्ठ में डाले गए फॉर्म के भीतर से आईडी को कैप्चर करने के लिए। XPath क्वेरी के नाम से इनपुट वाले फॉर्म की तलाश करती है रूप में, तो निष्कर्षण बचाता है मूल्य:

XPath: //form/input[@name="formid"]/@value

चीखना मेंढक एसईओ स्पाइडर जावास्क्रिप्ट प्रतिपादन

स्क्रीमिंग फ्रॉग का एक और बढ़िया विकल्प यह है कि आप पेज में एचटीएमएल तक सीमित नहीं हैं, आप किसी भी जावास्क्रिप्ट को प्रस्तुत कर सकते हैं जो आपकी साइट के भीतर फॉर्म डालने जा रहा है। अंदर विन्यास> मकड़ी, आप रेंडरिंग टैब पर जा सकते हैं और इसे सक्षम कर सकते हैं।

चीखना मेंढक एसईओ स्पाइडर जावास्क्रिप्ट प्रतिपादन

बेशक, साइट को क्रॉल करने में थोड़ा अधिक समय लगता है, लेकिन आपको ऐसे फॉर्म मिलेंगे जो जावास्क्रिप्ट द्वारा क्लाइंट-साइड के साथ-साथ सर्वर-साइड डाले गए फॉर्म भी प्राप्त करेंगे।

हालांकि यह एक बहुत ही विशिष्ट एप्लिकेशन है, यह एक अविश्वसनीय रूप से उपयोगी है क्योंकि आप बड़ी साइटों के साथ काम कर रहे हैं। आप पूरी तरह से ऑडिट करना चाहेंगे कि आपके फ़ॉर्म पूरे साइट पर कहाँ एम्बेड किए गए हैं।

डाउनलोड चीखना मेंढक एसईओ स्पाइडर

तुम्हें क्या लगता है?

यह साइट स्पैम को कम करने के लिए अकिस्मेट का उपयोग करती है। जानें कि आपका डेटा कैसे संसाधित किया जाता है.