जल यातना - एक विश्लेषिकी सादृश्य एक पुल बहुत दूर जाता है

ड्रिप एनालिटिक्स

डेटा, पानी की तरह, कई रूपों में आता है। मानव मन ज्यादातर डेटा को छानने के लिए विकसित हुआ है जो हमारे रास्ते में आता है क्योंकि वहाँ बस इतना ही है।

जब आप अपनी आंखें और कान खोलते हैं, तो डेटा हर जगह होता है। दीवार का रंग, एयर कंडीशनिंग की आवाज और आपके पड़ोसी की कॉफी की गंध को नमी की तरह माना जाता है। पानी हर समय हवा में रहता है लेकिन उस पर ज्यादा ध्यान देना उपयोगी नहीं है।

जब पानी कोहरे में घनीभूत होता है, तो यह आपको इसे देखने के लिए मजबूर करता है और आपके आस-पास की दुनिया को और अधिक कठिन बना देता है। अपूर्ण डेटासेट, दूषित डेटा, खराब विज्ञान, गलत निष्कर्ष और संज्ञानात्मक पूर्वाग्रह सभी आपको धुंध में अपना रास्ता खो देते हैं।

डेटा बारिश की तरह गिरता है। जब थोड़ा सा होता है, तो यह बेतहाशा असंतोषजनक होता है - बस आपकी कार को गंदा करने और बातचीत को भ्रमित करने के लिए पर्याप्त है। आप अपने आप को अपने चश्मे पर जगह को मिटाते हुए पाते हैं क्योंकि कोई व्यक्ति कुछ यादृच्छिक डेटा बिंदु, किसी अस्पष्ट स्रोत से प्राप्त होता है।

  • बासी पानी एक उथले तालाब में खतरनाक है। डेटा, एक अविश्वसनीय आपूर्ति से एकत्र किया गया, न तो साफ किया गया या सामान्य किया गया और स्थिर बढ़ने के लिए छोड़ दिया गया, आसानी से दोषपूर्ण निष्कर्ष हो सकता है।
  • A स्थिर चाल पानी केवल एक कैंटीन को भरने या एक वुडलैंड पारिस्थितिकी तंत्र को बनाए रखने के लिए पर्याप्त हो सकता है। बस तीन डेटा पॉइंट (भेजे गए, बनाम खोले गए, बनाम क्लिक किए गए ईमेल की संख्या) मार्केटिंग प्रोग्राम को बनाए रख सकते हैं।
  • A स्वस्थ प्रवाह एक छोटी क्रीक के रूप में डेटा का उपयोग स्नान के लिए किया जा सकता है। एक सतत डेटा प्रवाह बेंचमार्किंग और ऐतिहासिक तुलना की अनुमति देता है। लैंडिंग पृष्ठ अनुकूलन को स्थिर रूपांतरण डेटा के साथ पूरा किया जा सकता है।
    A मामूली नदी देखा लकड़ी या गेहूं को पीसने के लिए एक चक्की को बिजली कर सकते हैं। एक सिफारिश इंजन को शॉपिंग कार्ट के मूल्य में वृद्धि प्रदान करने के लिए मुट्ठी भर सहायक नदियों से केवल विश्वसनीय योगदान की आवश्यकता होती है।
  • A झरना एक विशाल वाटरव्हील और सूचना का पर्याप्त प्रवाह एक वास्तविक समय, गतिशील सामग्री प्रणाली को चला सकता है।
  • A नदी यह इतना चौड़ा और गहरा है कि पूरे परिवहन उद्योग का समर्थन कर सकता है। विज्ञापन नेटवर्क, लॉयल्टी कार्ड प्रोग्राम डेटा एग्रीगेटर्स और डेटा ब्रोकर्स से कुकीज़ के संग्रह के आकार में पर्याप्त डेटा बार्ज और कार्गो जहाजों को तैर ​​सकता है।

जब डेटा अनुमानित समय पर अपेक्षित मात्रा में आता है, तो इसे कैप्चर किया जा सकता है, चैनल किया जा सकता है और उपयोग किया जा सकता है। सिंचाई प्रणाली, बांध और जलाशय नियंत्रण की भावना प्रदान करते हैं और नहरों, तालों और बांधों के साथ एक कभी-चौड़ी अवसंरचना के निर्माण की अनुमति देते हैं। कम भरोसेमंद प्रवाह पर डेटा वेयरहाउस बनाए गए हैं।

स्वच्छता, भक्ति से भी बढ़कर है

स्वच्छ जल जीवन, सिंचाई, बिजली संयंत्र चलाने आदि की सफलता के लिए महत्वपूर्ण है। इस उद्देश्य के लिए 'स्वच्छ' की परिभाषा बदल सकती है; यह ठीक है अगर पानी में शैवाल है जो एक बिजली संयंत्र को ठंडा करता है और यह स्वीकार्य नहीं है यदि पीने के पानी में प्रति अरब आर्सेनिक के 10 से अधिक भाग हैं।

डेटा वही है। सीधे मेल आवेदन में, चाहे आपके पास किसी व्यक्ति का शीर्षक (श्रीमान, श्रीमती, सुश्री) है, अप्रासंगिक है ... जब तक कि आप डॉक्टरों को मेल नहीं कर रहे हैं। लेकिन गंदा डेटा आपको हर बार परेशान करेगा।

अमेरिकी मुख्य डेटा वैज्ञानिक के रूप में, डीजे पाटिल, इसे पहले दौर के सीटीओ शिखर सम्मेलन में रखें, "यदि आप शुरू से ही अपने डेटा को साफ रखने के बारे में नहीं सोच रहे हैं, तो आप f^¢&ed हैं। मैं इसकी गारंटी देता हूं। तथ्य के बाद इसे साफ करने की कोशिश में कम से कम महीनों लगेंगे।"

यदि आप उबलते बिंदु तक पानी गर्म करते हैं, तो यह संपूर्ण औद्योगिक क्रांति को शक्ति प्रदान कर सकता है। डेटा एक ही काम कर रहा है। जिस क्षण से कंप्यूटर स्टोर कर सकते हैं और साथ ही गणना कर सकते हैं, डेटा संग्रहण के रूप में तेजी से एकत्र किया गया है ताकि ऐसा करने के लिए भंडारण उपकरण बनाया जा सके।

डेटा झील

चूंकि इन सहायक नदियों के डेटा मिल इंजन के माध्यम से चकराते हैं, यह सभी बांध के पीछे झील में समाप्त होता है। जैसा कि डेटा को नियंत्रित तरीके से बाहर जाने दिया जाता है, यह डेटा उद्योग के टर्बाइनों को शक्ति देता है; Google और फेसबुक जैसे नामों के साथ डेटा प्रोसेसिंग के वे विशाल इंजन। यहां सूखा नहीं पड़ेगा।

और, अंत में, पानी का एक गहरा कुंड है, जो विश्लेषक के गोता लगाने की प्रतीक्षा कर रहा है। हाथ में स्कूबा गियर और स्पीयर गन, विश्लेषक गहरे की जांच करता है, नई जमीन का नक्शा बनाता है और नई प्रजातियों की खोज करता है। डेटा एक्सप्लोरर बनने का यह एक बहुत ही रोमांचक समय है।

इसलिए उनमें से बहुत से लोग के लिए दिखाई दे रहे हैं ईमेट्रिक्स समिट 2002 के बाद से। अगला अवसर बोस्टन में, 27 सितंबर से 1 अक्टूबर, 2015 तक है।

eMetrics शिखर सम्मेलन पंजीकरण

एक पुल बहुत दूर

और अगले ग्रैंड कैन्यन को तराशने के लिए डेटा की शक्ति का क्या? संरचित डेटा के ग्लेशियल पिघलने के बारे में क्या? हम दुनिया में अपशिष्ट जल को अधिक से अधिक गोपनीयता के प्रति जागरूक कैसे मानते हैं?

वे पुल के नीचे एक और समय और पानी के लिए सवाल हैं।

तुम्हें क्या लगता है?

यह साइट स्पैम को कम करने के लिए अकिस्मेट का उपयोग करती है। जानें कि आपका डेटा कैसे संसाधित किया जाता है.