जल यातना - एक विश्लेषिकी सादृश्य एक पुल बहुत दूर जाता है

ड्रिप एनालिटिक्स

डेटा, पानी की तरह, कई रूपों में आता है। मानव मन ज्यादातर डेटा को छानने के लिए विकसित हुआ है जो हमारे रास्ते में आता है क्योंकि वहाँ बस इतना ही है।

जब आप अपनी आँखें और कान खोलते हैं, तो डेटा हर जगह होता है। दीवार का रंग, एयर कंडीशनिंग की आवाज और आपके पड़ोसी की कॉफी की गंध को नमी की तरह व्यवहार किया जाता है। पानी हर समय हवा में रहता है लेकिन इस पर ज्यादा ध्यान देना उपयोगी नहीं है।

जब पानी कोहरे में घनीभूत होता है, तो यह आपको इसे देखने के लिए मजबूर करता है और आपके आस-पास की दुनिया को और अधिक कठिन बना देता है। अपूर्ण डेटासेट, दूषित डेटा, खराब विज्ञान, गलत निष्कर्ष और संज्ञानात्मक पूर्वाग्रह सभी आपको धुंध में अपना रास्ता खो देते हैं।

बारिश की तरह गिरता है डेटा जब बस थोड़ी सी है, यह बेतहाशा असंतोषजनक है - बस अपनी कार को गंदा करने और बातचीत को भ्रमित करने के लिए पर्याप्त है। आप अपने आप को अपने चश्मे पर जगह को मिटाते हुए पाते हैं क्योंकि कोई व्यक्ति किसी यादृच्छिक डेटा बिंदु को टटोलता है, जो किसी अस्पष्ट स्रोत से चमकता है।

  • बासी पानी एक उथले तालाब में खतरनाक है। डेटा, एक अविश्वसनीय आपूर्ति से एकत्र किया गया, न तो साफ किया गया या सामान्य किया गया और स्थिर बढ़ने के लिए छोड़ दिया गया, आसानी से दोषपूर्ण निष्कर्ष हो सकता है।
  • A स्थिर चाल पानी केवल एक कैंटीन को भरने या एक वुडलैंड पारिस्थितिकी तंत्र को बनाए रखने के लिए पर्याप्त हो सकता है। बस तीन डेटा पॉइंट (भेजे गए, बनाम खोले गए, बनाम क्लिक किए गए ईमेल की संख्या) मार्केटिंग प्रोग्राम को बनाए रख सकते हैं।
  • A स्वस्थ प्रवाह एक छोटी क्रीक के रूप में डेटा का उपयोग स्नान के लिए किया जा सकता है। एक सतत डेटा प्रवाह बेंचमार्किंग और ऐतिहासिक तुलना की अनुमति देता है। लैंडिंग पृष्ठ अनुकूलन को स्थिर रूपांतरण डेटा के साथ पूरा किया जा सकता है।
    A मामूली नदी देखा लकड़ी या गेहूं को पीसने के लिए एक चक्की को बिजली कर सकते हैं। एक सिफारिश इंजन को शॉपिंग कार्ट के मूल्य में वृद्धि प्रदान करने के लिए मुट्ठी भर सहायक नदियों से केवल विश्वसनीय योगदान की आवश्यकता होती है।
  • A झरना एक विशाल वाटरव्हील और सूचना का पर्याप्त प्रवाह एक वास्तविक समय, गतिशील सामग्री प्रणाली को चला सकता है।
  • A नदी यह विस्तृत और गहरा है जो एक संपूर्ण परिवहन उद्योग का समर्थन कर सकता है। पर्याप्त डेटा विज्ञापन नेटवर्क, लॉयल्टी कार्ड प्रोग्राम डेटा एग्रीगेटर्स, और डेटा ब्रोकरों से कुकीज़ के संग्रह के आकार में बजरों और कार्गो जहाजों को तैर ​​सकता है।

जब डेटा अनुमानित समय पर अपेक्षित मात्रा में आता है, तो इसे कैप्चर किया जा सकता है, चैनल किया जा सकता है और उपयोग किया जा सकता है। सिंचाई प्रणाली, बांध और जलाशय नियंत्रण की भावना प्रदान करते हैं और नहरों, तालों और बांधों के साथ एक कभी-चौड़ी अवसंरचना के निर्माण की अनुमति देते हैं। कम भरोसेमंद प्रवाह पर डेटा वेयरहाउस बनाए गए हैं।

स्वच्छता, भक्ति से भी बढ़कर है

स्वच्छ जल जीवन की सफलता के लिए महत्वपूर्ण है, सिंचाई, बिजली संयंत्र, आदि। 'स्वच्छ' की परिभाषा उद्देश्य के लिए बदल सकती है; यह ठीक है अगर पानी में शैवाल है जो एक बिजली संयंत्र को ठंडा करता है और यह स्वीकार्य नहीं है अगर पीने के पानी में प्रति अरब आर्सेनिक के 10 से अधिक हिस्से हैं।

डेटा वही है। एक सीधे मेल आवेदन में, चाहे आपके पास एक व्यक्ति का शीर्षक (श्री, श्रीमती, सुश्री) असंगत हो ... जब तक आप डॉक्टरों को मेल नहीं कर रहे हों। लेकिन गंदा डेटा हर बार आपको यात्रा करेगा।

अमेरिकी मुख्य डेटा वैज्ञानिक के रूप में, डीजे पाटिल, इसे पहले राउंड के CTO समिट में डालें, “यदि आप शुरू से ही अपने डेटा को साफ रखने के तरीके के बारे में नहीं सोच रहे हैं, तो आप f ^ you're & ed हैं। मैं इसकी गारंटी देता हूं। इस तथ्य के बाद इसे साफ करने की कोशिश में कम से कम महीने लगेंगे। ”

यदि आप उबलते बिंदु तक पानी गर्म करते हैं, तो यह संपूर्ण औद्योगिक क्रांति को शक्ति प्रदान कर सकता है। डेटा एक ही काम कर रहा है। जिस क्षण से कंप्यूटर स्टोर कर सकते हैं और साथ ही गणना कर सकते हैं, डेटा संग्रहण के रूप में तेजी से एकत्र किया गया है ताकि ऐसा करने के लिए भंडारण उपकरण बनाया जा सके।

डेटा झील

चूंकि इन सहायक नदियों के डेटा मिल इंजन के माध्यम से चकराते हैं, यह सभी बांध के पीछे झील में समाप्त होता है। जैसा कि डेटा को नियंत्रित तरीके से बाहर जाने दिया जाता है, यह डेटा उद्योग के टर्बाइनों को शक्ति देता है; Google और फेसबुक जैसे नामों के साथ डेटा प्रोसेसिंग के वे विशाल इंजन। यहां सूखा नहीं पड़ेगा।

और, अंत में, पानी का एक गहरा पूल है, विश्लेषक गोता लगाने के लिए प्रतीक्षा कर रहा है। हाथ में स्कूबा गियर और भाला बंदूक, विश्लेषक गहरे, नए नक्शे का पता लगाता है और नई प्रजातियों को खोजता है। यह एक डेटा एक्सप्लोरर होने के लिए एक बहुत ही रोमांचक समय है।

यही कारण है कि उनमें से कई के लिए दिखा रहा है ईमेट्रिक्स समिट 2002 के बाद से। अगला अवसर बोस्टन में, 27 सितंबर से 1 अक्टूबर, 2015 तक है।

eMetrics शिखर सम्मेलन पंजीकरण

एक पुल बहुत दूर

और अगले ग्रैंड कैन्यन को तराशने के लिए डेटा की शक्ति का क्या? संरचित डेटा के ग्लेशियल पिघलने के बारे में क्या? हम दुनिया में अपशिष्ट जल को अधिक से अधिक गोपनीयता के प्रति जागरूक कैसे मानते हैं?

वे पुल के नीचे एक और समय और पानी के लिए सवाल हैं।

तुम्हें क्या लगता है?

यह साइट स्पैम को कम करने के लिए अकिस्मेट का उपयोग करती है। जानें कि आपका डेटा कैसे संसाधित किया जाता है.