विभेदको बीच सम्बन्ध रिजर्भेसन विश्लेषण गर्दछ
एक डेटासेट निर्दिष्ट गरिएको संख्यात्मक मानहरू ( निरन्तर मूल्यहरू भनिन्छ) को दायरा अनुमान गर्न प्रयोग गरिएको डेटा खनन प्रविधी हो। उदाहरण को लागी, रिजर्भेसन को उपयोग गर्न को लागी एक उत्पादन या सेवा को लागत को पूर्वानुमान गर्न को लागी, अन्य चर दिए।
व्यापार र मार्केटिंग योजना, वित्तीय भविष्यवाणी, पर्यावरण मोडेलिंग र प्रवृत्तहरुको विश्लेषण को लागी एकाधिक उद्योगहरुमा रेजिजन प्रयोग गरिन्छ।
रिज्रेस बनाउ वर्गीकरण
रिजर्भेसन र वर्गीकरणले समान समस्या समाधान गर्न प्रयोग गरिने डेटा खनन प्रविधिहरू छन्, तर तिनीहरू प्रायः भ्रमित हुन्छन्। भविष्यवाणी को विश्लेषण मा दुवै प्रयोग गरिन्छ, तर वर्गीकरण को सांख्यिक या निरंतर मूल्य को पूर्वानुमान गर्न को लागी प्रयोग गरिन्छ जबकि वर्गीकरण असाइन डेटा असतत श्रेणियों मा प्रस्तुत गर्दछ।
उदाहरणका लागि, रिजर्भेसन यसको स्थानमा आधारित गृहको मूल्य अनुमान गर्न प्रयोग गरिनेछ, वर्ग फुट, मूल्य बेच्दा मूल्य, समान घरहरूको मूल्य, र अन्य कारकहरू। वर्गीकरणमा क्रमबद्ध हुनेछ यदि तपाईं घरको सट्टा व्यवस्थित गर्न चाहानुहुन्छ, जस्तै हिड्ने क्षमता, धेरै आकार वा अपराध दरहरू।
रिग्रेसन टेक्निक्स को प्रकार
रिफ्रेस को सरल र सबै भन्दा पुराना रूप रैखिक रिप्रेशन दुई चर को बीच एक सम्बन्ध को अनुमान गर्न को लागी प्रयोग गरिन्छ। यो प्रविधिले सीधा रेखा (y = mx + b) को गणितीय सूत्र प्रयोग गर्दछ। सादा सर्तहरूमा, यो मात्र मतलब छ कि, Y र एक एक्स-अक्षको साथ ग्राफ दिईएको छ, एक्स र Y बीचको सम्बन्ध केही बाहिरका साथ सिधा रेखा हो। उदाहरणको लागि, हामी मान्न सक्छौं कि जनसंख्यामा वृद्धि दिईएको, खाद्य उत्पादनले उस्तै दरमा वृद्धि गर्नेछ - यो दुई तथ्याङ्कहरू बीचको बलियो, रैखिक सम्बन्धको आवश्यकता पर्दछ। यो दृश्यावलोकन गर्नको लागि, ग्राफमा विचार गर्नुहोस् जसमा Y-axis जनसंख्या बढ्ने ट्रयाक छ, र एक्स-अक्षले खाना उत्पादन पटर गर्दछ। Y मूल्य वृद्धिको रूपमा, X मानले उनीहरूको सीधा रेखा बीचको सम्बन्ध बनाउनेछ।
उन्नत प्रविधि, जस्तै एकाधिक रिप्रेशन, बहु चरको बीच सम्बन्धको भविष्यवाणी गर्दछ - उदाहरणका लागि, आय, शिक्षा र जहाँ बाँच्ने छनौट गर्न को लागी एक सम्बन्ध छ? अधिक चर को अतिरिक्त भविष्यवाणी को जटिलता बढ जान्छ। मानक, पदानुक्रिक, सेटअप र चरणवाट सहित एकाधिक रिप्रेशन प्रविधिका थुप्रै प्रकारहरू छन्, प्रत्येकको आफ्नै आवेदनको साथ।
यस बिन्दुमा, हामी भविष्यमा ( भविष्यमा निर्भर वा पूर्वानुमानित चर) को अनुमान लगाउने प्रयास गर्दछौं र हामी भविष्यवाणी (स्वतन्त्र वा भविष्यवाचक चर) गर्न प्रयोग गरिरहनु भएको डेटा महत्त्वपूर्ण छ। हाम्रो उदाहरणमा, हामी आय र शिक्षा (दुवै भविष्यवाचक चर) को लागी स्थानमा जहाँ एक लाइभ ( अनुमानित चर) छनौट गर्न चाहानुहुन्छ भविष्यवाणी गर्न चाहन्छु।
- मानक बहुविध रिजर्भेसनले एकै समयमा सबै अनुमानकर्ता चरहरू मान्दछ। उदाहरणको लागि 1) आय र शिक्षा बीचको सम्बन्ध के हो (भविष्यवाचक) र सस्थाको छनौट (भविष्यवाणी); र 2) व्यक्तिगत भविष्यवाचक प्रत्येक कुन डिग्री को सम्बन्ध मा त्यो सम्बन्ध मा योगदान गर्दछ?
- चरणगत बहुविध रिफरेशनले पूरै फरक प्रश्नको उत्तर दिन्छ। एक चरणवर्ती रिफ्रेसन एल्गोरिदमले विश्लेषण गर्नेछ कि कुन भविष्यवाचकहरू सँधै छनौटको छनौट गर्नका लागी प्रयोग गरिन्छ - अर्थमा कि सार्थक मोडले भविष्यवाचक चरको महत्वको मूल्यांकन गर्दछ र त्यसपछि एउटा प्रासंगिक सबसेट चयन गर्दछ। यस प्रकारको द्रष्टव्य समस्याले रिग्रेसन समीकरणको विकास गर्न "चरण" प्रयोग गर्दछ। यस प्रकारको रिफिगरेसनलाई दिइएको छ, सबै भविष्यवाचकहरू अन्तिम रिफ्रेस समीकरणमा पनि देखा पर्न सक्दछ।
- पदानुक्रमिक रिप्रेशन , चरणवर्ती जस्तै, एक अनुक्रमित प्रक्रिया हो, तर भविष्यवाचक चरहरू अग्रिममा परिभाषित पूर्व-निर्दिष्ट आदेशमा मोडेलमा प्रवेश गरिन्छ, यदी एल्गोरिदममा क्रम निर्धारण गर्न समीकरणको सेट-इन सेट समावेश गर्दछ जसमा भविष्यसूचक प्रविष्ट गर्नुहोस्। यो प्रायः प्रयोग गरिन्छ जब व्यक्ति रिजेशन समीकरण को क्षेत्र को विशेषज्ञ ज्ञान छ।
- सेट्वेवाई रिफ्रेसन पनि कदमवार को लागी समान छ तर अलग-अलग चर को बजाय चर को सेट विश्लेषण गर्दछ।