कैसे एक बड़ी साइट क्रॉल करने के लिए और चीखना मेंढक के एसईओ स्पाइडर का उपयोग करके डेटा निकालें

चीखना मेंढक एसईओ स्पाइडर

हम इस समय कई ग्राहकों की सहायता कर रहे हैं बाजारू पलायन। चूंकि बड़ी कंपनियां इस तरह से उद्यम समाधान का उपयोग करती हैं, यह एक मकड़ी के जाल की तरह है जो वर्षों तक प्रक्रियाओं और प्लेटफार्मों में खुद को बुनता है ... जब तक कि उस बिंदु को हर टचप्वाइंट के बारे में पता भी नहीं होता है।

मार्केटो जैसे एंटरप्राइज मार्केटिंग ऑटोमेशन प्लेटफॉर्म के साथ, फॉर्म पूरे साइट और लैंडिंग पेज पर डेटा का प्रवेश बिंदु हैं। कंपनियों के पास अक्सर अपनी साइटों में हजारों पृष्ठ और सैकड़ों फ़ॉर्म होते हैं जिन्हें अपडेट करने के लिए पहचानने की आवश्यकता होती है।

इसके लिए एक बढ़िया टूल है फ्रॉगिंग एसईओ स्पाइडर... शायद साइट से डेटा क्रॉल करने, ऑडिट करने और निकालने के लिए बाज़ार में सबसे लोकप्रिय मंच। प्लेटफ़ॉर्म सुविधा-संपन्न है और आपके लिए आवश्यक प्रत्येक कार्य के लिए सैकड़ों विकल्प प्रदान करता है।

चीखना मेंढक एसईओ मकड़ी: क्रॉल और निकालें

फ्रॉगिंग एसईओ स्पाइडर की एक प्रमुख विशेषता यह है कि आप इसके आधार पर कस्टम एक्सट्रैक्ट कर सकते हैं regex, XPathया, सीएसएसपाथ बारीकियों। यह बेहद उपयोगी है क्योंकि हम क्लाइंट की साइट्स को क्रॉल करना चाहते हैं और पन्नों से मुंचकिनिड और फॉर्मआईड मानों को कैप्चर करना चाहते हैं।

उपकरण के साथ, खोलें कॉन्फ़िगरेशन> कस्टम> निष्कर्षण उन तत्वों की पहचान करने के लिए जिन्हें आप निकालना चाहते हैं।

screamingfrog कस्टम निष्कर्षण

निष्कर्षण स्क्रीन लगभग असीमित डेटा संग्रह के लिए अनुमति देता है:

चीखना मेंढक एसईओ स्पाइडर एक्सट्रैक्शन नियम

रेगेक्स, XPath, और CSSPath एक्सट्रैक्शन

MunchkinID के लिए, पहचानकर्ता उस फ़ॉर्म स्क्रिप्ट के भीतर स्थित है जो पृष्ठ के भीतर है:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

हम फिर आवेदन करते हैं रेगेक्स नियम पृष्ठ में डाली गई स्क्रिप्ट टैग के भीतर से आईडी पर कब्जा करने के लिए:

Regex: ["']id["']: *["'](.*?)["']

फॉर्म आईडी के लिए, डेटा मार्केटो फॉर्म में एक इनपुट टैग में है:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

हम एक लागू करते हैं XPath नियम पेज में डाली गई फॉर्म के भीतर से आईडी कैप्चर करने के लिए। XPath क्वेरी एक नाम के साथ एक इनपुट के साथ एक फॉर्म के लिए दिखती है रूप में, तो निष्कर्षण बचाता है मूल्य:

XPath: //form/input[@name="formid"]/@value

चीखना मेंढक एसईओ स्पाइडर जावास्क्रिप्ट प्रतिपादन

चिल्लाहट मेंढक का एक और बढ़िया विकल्प यह है कि आप पृष्ठ में HTML तक सीमित नहीं हैं, आप किसी भी जावास्क्रिप्ट को प्रस्तुत कर सकते हैं जो आपकी साइट के भीतर फ़ॉर्म डालने जा रहा है। अंदर विन्यास> मकड़ी, आप रेंडरिंग टैब पर जा सकते हैं और इसे सक्षम कर सकते हैं।

चीखना मेंढक एसईओ स्पाइडर जावास्क्रिप्ट प्रतिपादन

यह साइट को क्रॉल करने में थोड़ा अधिक समय लेता है, लेकिन निश्चित रूप से आपको ऐसे फॉर्म मिलेंगे जो क्लाइंट-साइड जावास्क्रिप्ट द्वारा प्रदान किए जाते हैं और साथ ही ऐसे फॉर्म भी डाले जाते हैं जो सर्वर-साइड डाले जाते हैं।

हालांकि यह एक बहुत ही विशिष्ट अनुप्रयोग है, यह एक अविश्वसनीय रूप से उपयोगी है क्योंकि आप बड़ी साइटों के साथ काम कर रहे हैं। आप पूरी तरह से ऑडिट करना चाहेंगे कि आपके फॉर्म पूरी साइट पर कहाँ हैं।

डाउनलोड चीखना मेंढक एसईओ स्पाइडर

तुम्हें क्या लगता है?

यह साइट स्पैम को कम करने के लिए अकिस्मेट का उपयोग करती है। जानें कि आपका डेटा कैसे संसाधित किया जाता है.