के 'बिस्त डाटा' ठीक छ?

र यो किन ठूलो सौदा छ?

'बिग डेटा' असंगत डेटा को ठूलो मात्रा को अध्ययन गरेर समझ को बारे मा समझने र भविष्यवाणी को नयाँ विज्ञान हो। ठूलो डेटा पनि 'भविष्यवाणी विश्लेषिकी' को रूपमा पनि भनिन्छ।

ट्विटर पोष्टहरू, फेसबुक फिडहरू, ईबे खोजीहरू, GPS ट्र्याकरहरू र एटीएम मशीनहरू विश्लेषण गर्दै केही ठूला डेटा उदाहरणहरू छन्। सुरक्षा भिडियोहरू, ट्राफिक डाटा, मौसमको ढाँचा, उडान आविष्कारहरू, सेल फोन टावर लगहरू, र हृदय दर ट्रयाकहरू अन्य प्रकारका छन्। ठूलो डेटा गन्दा नयाँ विज्ञान हो जसले साप्ताहिक परिवर्तन गर्दछ, र केहि विशेषज्ञहरूले यो सबै बुझ्दछन्।

नियमित जीवनमा ठूला डेटाका केही उदाहरणहरू के हुन्?

स्क्रिनशट http://project.wnyc.org/transit-time

जबकि ठूला डेटा परियोजनाहरू धेरै अस्पष्ट छन्, ठूला डेटाका सफल उदाहरणहरू व्यक्ति, कम्पनीहरू र सरकारहरूका दैनिक जीवनलाई असर पार्छन्:

भाइरस प्रकोपको भविष्यवाणी: सामाजिक- राजनीतिक डेटा, मौसम र जलवायु डेटा, र अस्पताल / क्लिनिकल डेटाको अध्ययन गरेर, यी वैज्ञानिकहरू अब 4 हप्ता अघिल्लो सूचनाको साथ डेंग बुखार प्रकोपहरूको भविष्यवाणी गर्दै छन्।

आत्मघाती घडी: यो ठूलो डेटा परियोजना प्रोफाईल हत्या पीडित, संदिग्ध, र अपराधी वाशिंगटन, डीसीमा प्रोफाइल। मृतकको सम्मान र मानिसहरूको जागरूकताको स्रोतको रूपमा दुबै तरिकाले यो ठूलो डाटा परियोजना आकर्षक छ।

ट्रांजिट ट्रेवल प्लान्ट, एन एन सी: डब्लुएनवाईसी रेडियो प्रोग्रामर स्टीव मेलेन्डेज यात्रा यात्रा कार्यक्रम सफ्टवेयर संग अनलाइन सबवे शेड्यूल को संयुक्त। उनको सृष्टिलाई न्यूयर्कले नक्सामा आफ्नो स्थानमा क्लिक गर्न दिन्छ, र रेल र मेट्रोको लागि यात्रा समयको भविष्यवाणी देखा पर्नेछ।

जेरोक्सले आफ्नो कार्यशैली हानि घटाउनुभयो: कल केन्द्र काम भावनात्मक रूपमा समाप्त हुन्छ। जेरोक्सले पेशेवर विश्लेषकहरूको सहयोगको साथ डेटा को रेज अध्ययन गरेको छ, र अब उनी भविष्यवाणी गर्न सक्छन् जुन कल केन्द्र टायर कम्पनी सबैभन्दा लामो समयसम्म रहन सक्छ।

काउन्टर-आतंकवादलाई समर्थन गर्दै : सोशल मिडिया, वित्तीय रेकर्डहरू, उडान सम्बन्धी आरक्षण र सुरक्षा डेटा अध्ययन गरेर कानून प्रवर्तनले भविष्यवाणी गर्न सक्दछ र उनीहरूको दुष्ट कार्यहरू गर्नु अघि आतंकवादी शंकास्पदहरू पत्ता लगाउन सक्छ।

सोशल मिडिया समीक्षाहरूमा आधारित ब्रान्ड मार्केटिङ समायोजन : निस्सन्देह र चाँडै आफ्नो अनलाइन विचार पब, रेस्टुरेन्ट, वा फिटनेस क्लबमा साझेदारी गर्नुहोस्। यो लाखौं सोशल मिडिया पोष्टहरू अध्ययन गर्न सम्भव छ र मानिसहरूका सेवाहरूको बारे सोच्ने कुरामा कम्पनीलाई प्रतिक्रिया दिनुहोस्।

कसले बिग डाटा प्रयोग गर्दछ? तिनीहरूले के यो के साथ गर्छन्?

धेरै मोनलिथिक निगमहरूले उनीहरूको प्रस्ताव र मूल्य समायोजन गर्न ठूलो डाटा प्रयोग गर्छन् ग्राहकको सन्तुष्टिलाई अधिकतम गर्न।

किन बिग डाटा यस्तो ठूलो सम्झौता छ?

4 चीजहरू ठूलो डेटा महत्त्वपूर्ण बनाउँछन्:

1. डेटा ठूलो छ। यो एकल हार्ड ड्राइभमा उपयुक्त हुनेछैन, एक USB छडी धेरै। डाटाको भोल्युम भन्दा बढि मानव मान कुन कुराले बुझ्न सक्छ (एक अरब बिलियन मेगाबिटको बारेमा सोच्नुहोस्, र त्यसपछि धेरै अरबौं द्वारा गुणा)।

2. डाटा गन्दा र असंगत छ। 50% बाट 80% ठूला डेटा कार्य परिवर्तन र जानकारी सफा गर्ने छ जुन खोजीयोग्य र क्रमबद्ध छ। हाम्रो ग्रहमा मात्र केही हजार विशेषज्ञहरूले यो डेटा क्लीनअप कसरी गर्ने भनेर जान्दछन्। यी विशेषज्ञहरूले पनि एचपीई र ह्यापूप जस्ता धेरै विशेष उपकरणहरू चाहिन्छ, उनीहरूको शिल्प गर्न। सायद 10 वर्षमा ठूला डेटा विशेषज्ञहरूले एक दर्जन दर्जन बन्नेछन्, तर अहिलेका लागि, तिनीहरू विश्लेषकको धेरै दुर्लभ प्रजाति हुन् र तिनीहरूको काम अझै अस्पष्ट र थोरै छ।

3. डाटा एउटा वस्तु बनिरहेको छ ** कि बेच्न र खरिद गर्न सकिन्छ। डाटा बजार ठाउँहरू जहाँ कम्पनी र व्यक्तिहरूले सामाजिक सञ्जाल र अन्य डेटाको टेराबाइटहरू खरीद गर्न सक्छन्। अधिकांश डाटा क्लाउड-आधारित हो, किनकि यो कुनै पनि हार्ड डिस्कमा फिट गर्न ठूलो छ। डाटा खरिद गर्दा सामान्यतया एक सदस्यता शुल्क समावेश गर्दछ जहाँ तपाईं क्लाउड सर्भर फारममा प्लग गर्नुहुन्छ।

** ठूलो डाटा उपकरण र विचारका नेताहरू अमेजन, गुगल, फेसबुक र याहू हुन्। किनकि यी कम्पनीहरूले आफ्नो लाखौं मानिसहरूको अनलाइन सेवाको साथ सेवा गर्छन्, यो अर्थ बुझ्छ कि तिनीहरू सङ्कलन बिन्दु र ठूलो डाटा एनालिटिक्स पछि दृष्टिगत हुनेछ।

4. ठूलो डेटाको सम्भावना अनन्त छन्। सायद डाक्टरहरू एक दिन हुने गर्नाले ती व्यक्तिहरू हप्ता अघि हप्ताका लागि हार्दिक हमला र स्ट्रोकहरूको भविष्यवाणी गर्छन्। हवाई जहाज र मोटरब्याक दुर्घटनाहरू उनीहरूको मेकेनिकल डाटा र ट्राफिक र मौसमको ढाँचाको अनुमानित विश्लेषण द्वारा कम हुन सक्छ। अनलाइन डेटिङ सुधार गर्नका लागि तपाईलाई उपयुक्त व्यक्तित्वहरू को ठूलो डेटा भविष्यवाचकहरू द्वारा सुधार गर्न सकिन्छ। सङ्गीतकारहरूले लक्षित सङ्गीतको परिवर्तनशील स्वादको लागि कुन संगीत रचना सबैभन्दा मनपर्ने कुरामा अन्तरदृष्टि पाउन सक्छ। पोषण विशेषज्ञहरूले भविष्यवाणी गर्न सक्नेछन् कि भण्डार-खरीदा फूडहरूको कुन संयोजनले व्यक्तिको मेडिकल सर्तहरू बढावा दिन मद्दत गर्नेछ। सतह मात्र खरोंच भएको छ, र ठूलो डेटामा खोजहरू हरेक हप्ता हुन्छ।

ठूलो डेटा गन्दा छ

मन्टे रकससेन / गेटी

ठूलो डेटा भविष्यवाणी विश्लेषणात्मक छ: खोजयोग्य र क्रमबद्ध गर्न केहि ठूलो असंगत डेटा को रूपान्तरण। यो गन्दा र अराजक ठाउँ हो जसले विशेष प्रकारको ज्ञान र धैर्यको आवश्यकता पर्दछ।

उदाहरणको लागि मोनलिथिक यूपीएस डिलीवरी सेवा लिनुहोस्। यूपीएसका प्रोग्रामरहरू तिनीहरूको ड्राइभरका जीपीएस र स्मार्टफोनबाट ट्राफिक भित्रीतामा अनुकूलन गर्ने सबै भन्दा राम्रा तरिकाहरू विश्लेषण गर्न डेटाहरू अध्ययन गर्दछ। यो जीपीएस र स्मार्टफोन डेटा ग्याङ्गन्ट्युन हो, र स्वचालित रूपमा विश्लेषणको लागी तयार छैन। यस डेटाले विभिन्न स्मार्टफोन हार्डवेयर यन्त्रहरूमार्फत विभिन्न GPS र नक्सा डेटाबेसबाट ड्रेस गर्दछ। यूपीएस एनालिस्टर्सहरूले यी डेटाहरूलाई सबै ढाँचामा रूपान्तरण गर्न सक्दछन् जुन सजिलै खोजी गर्न र क्रमबद्ध गर्न सकिन्छ। यो प्रयास यसको लायक छ, यद्यपि। आज, यूपीएसले 8 मिलियन गैलन ईननबाट बचाउनु भएको छ किनकि तिनीहरूले यी ठूला डाटा विश्लेषण प्रयोग गर्न थाले।

किनकि ठूलो डेटा गन्दा छ र सफ्टअप गर्न र उपयोगको लागि तयारी गर्न आवश्यक छ, डाटा वैज्ञानिकहरूले सबै थोरै काम गर्ने कामका लागि 'डाटा डेलिभिजन' उपनाम पाएको छ।

ठूलो डेटा र अनुमानित विश्लेषणको विज्ञान हरेक हप्तामा सुधार भएको छ। ठूलो डेटा आशा गर्नुहोस् कि वर्ष 2025 सम्म सबैलाई सजिलै पहुँचयोग्य हुन सक्छ।

गोपनीयता नीतिको लागि बिग डेटा एक घुमक्कड खतरा होइन?

Feingersh / Getty

हो, यदि हाम्रो कानुन र व्यक्तिगत गोपनीयताको सुरक्षा सावधानीपूर्वक व्यवस्थित छैन भने, त्यसपछि ठूलो डेटा व्यक्तिगत गोपनीयतामा घुमाउँछ। यो खडा हुँदा, Google र YouTube र फेसबुकले पहिले नै तपाइँको दैनिक अनलाइन बानीहरू ट्रयाक गर्दछ । तपाईंको स्मार्टफोन र कम्प्युटिङ जीवनले हरेक दिन डिजिटल फुटपिट छोड्दछ, र परिष्कृत कम्पनीहरूले ती पदचिन्हहरू पढिरहेका छन्।

ठूलो डेटा वरिपरि कानूनहरू विकसित हुँदैछन्। गोपनीयता यो एक स्थिति हो जुन तपाईले अब व्यक्तिगत जिम्मेवारी लिनु पर्दछ, किनकि तपाइँ अब यसलाई पूर्वनिर्धारित अधिकारको अपेक्षा गर्न सक्नुहुन्न।

तपाइँ आफ्नो गोपनीयताको सुरक्षा गर्न के गर्न सक्नुहुन्छ:

तपाईले लिन सक्नुहुने सबैभन्दा ठूलो एकल चरण एक VPN सञ्जाल जडान प्रयोग गरी आफ्नो दैनिक बानीहरू हटाउनको लागि हो । एक वीपीएन सेवाले तपाईंको सिग्नललाई परिमार्जित गर्नेछ ताकि तपाईंको पहिचान र स्थान कम्तीमा आंशिक रूपमा ट्रयाकहरूबाट मास्क गरिएको हो। यसले तपाइँलाई 100% गुमनाम बनाउँदैन, तर एक VPN ले विश्वव्यापी तपाइँको अनलाइन बानी कसरी देख्न सक्छ भन्ने कुरा कम गर्नेछ।

मलाई ठूलो डेटाको बारेमा थप जान्न सक्छु?

मोन्टी Raskusen / Getty

ठूलो डेटा विश्लेषणात्मक दिमागहरू र प्रविधिको लागि प्रेमको लागि एक आकर्षक कुरा हो। यदि यो हो भने, त्यस पछि निश्चित रूपमा रोचक ठूला डाटा परियोजनाहरूको यो पृष्ठमा जानुहोस्।