के-क्लस्टर गर्ने के हो?

के-एल्गोरिथ्मसँग डाटा खनन

K- अर्थ क्लस्टरिंग एल्गोरिथ्म एक डेटा खनन र मेशिन सिकाउने उपकरण हो जुन तिनीहरूका सम्बन्धहरूको कुनै पूर्व जानकारी बिना सम्बन्धित अवलोकनहरूको समूहमा क्लस्टर अवलोकन गर्न प्रयोग गरिन्छ। नमूना गरेर, कुन श्रेणी, वा क्लस्टरमा देखाउन एल्गोरिदम प्रयास गर्दा क्लस्टरहरूको संख्या मान के द्वारा परिभाषित गरिएको हो

K- साधन एल्गोरिदम एक सरल क्लस्टरिंग प्रविधि हो र यसलाई सामान्य इमेजिङ, बायोमेटिक्स र सम्बन्धित फिल्डहरूमा प्रयोग गरिन्छ। K- अर्थ क्लस्टरिंगको फाइदा यो हो कि यो सुरुमा डेटाको बारेमा एल्गोरिदम निर्देशन (एल्गोरिदमको निरीक्षण गरिएको फारम प्रयोग गरी) तपाईको डाटाको बारेमा (यसको असुरक्षित फाराम प्रयोग गरी) को बारेमा बताउँछ।

यो कहिले काहीं लोयड को एल्गोरिथ्म को रूप मा उल्लेख गरिएको छ, विशेष रूप देखि कम्प्यूटर साइन्स सर्कलहरुमा किनकी मानक एल्गोरिदम पहिले 1 9 57 मा स्टुअर्ट लयड द्वारा प्रस्तावित गरिएको थियो। "कश्मीर को मतलब" शब्द जेम्स मैक्यूक्मेन द्वारा 1 9 67 मा सम्बद्ध गरियो।

के के अर्थ एल्गोरिदम प्रकार्य कसरी

के- अर्थ एल्गोरिदम एक विकासवादी एल्गोरिथ्म हो जसले यसको नामले यसको सञ्चालनको विधिबाट प्राप्त गर्दछ। कल् समूहहरूमा एल्गोरिदम क्लस्टर अवलोकनहरू, जहाँ k लाई इनपुट प्यारामिटरको रूपमा उपलब्ध गराइएको छ। त्यसोभए प्रत्येक अवलोकनले क्लस्टरको अर्थलाई अवलोकनको निकटताको आधारमा क्लस्टरहरूलाई समेटाउँछ। क्लस्टरको अर्थ त्यसपछि पुनः उत्तिकै छ र प्रक्रिया फेरि सुरु हुन्छ। यहाँ कसरी एल्गोरिदम काम गर्दछ:

  1. एल्गोरिदमले प्रारम्भिक क्लस्टर केन्द्रहरूको रूपमा (बिन्दुहरू) को रूपमा बिन्दुहरू चयन गर्दछ।
  2. डाटासेटको प्रत्येक बिन्दु प्रत्येक क्लस्टर र प्रत्येक क्लस्टर केन्द्रको बीच ईक्लिडेन दूरीमा आधारित बन्द क्लस्टरमा नियुक्त गरिएको छ।
  3. प्रत्येक क्लस्टर केन्द्र त्यो क्लस्टरमा बिन्दुहरूको औसतको रूपमा पुनःसंकुचित हुन्छ।
  4. क्लस्टरहरूको अभिकर्ता नभएसम्म चरण 2 र 3 दोहोर्याउनुहोस्। कन्भरेसनले कार्यान्वयनको आधारमा फरक रूपमा परिभाषित गर्न सकिन्छ, तर यो सामान्यतया अर्थ छ कि कुनै पनि अवलोकन क्लस्टरहरू परिवर्तन गर्दा 2 र 3 चरणहरू दोहोर्याउँदछ, वा परिवर्तनहरू क्लस्टरहरूको परिभाषामा भौतिक फरक पार्दैन।

क्लस्टरहरूको संख्या छनौट गर्नुहोस्

एक क्लस्टरिंग को मुख्य कारण को एक तथ्य यो तथ्य हो कि तपाईं क्लस्टर को संख्या एल्गोरिदम को इनपुट को रूप मा निर्दिष्ट गर्नु पर्छ। डिजाइनको रूपमा, एल्गोरिदमले क्लस्टरहरूको उपयुक्त संख्या निर्धारण गर्न सक्षम छैन र यो अग्रिम पहिचान गर्न प्रयोगकर्तामा निर्भर गर्दछ।

उदाहरणका लागि, यदि तपाईसँग व्यक्तिको समूह थियो जुन पुरुष वा महिलाको रूपमा बिनियर लिङ्ग पहिचानको आधारमा क्लस्टर गरिएको हुनुपर्छ, इनपुट k = 3 को प्रयोग गरेर के- एल्गोरिथ्मलाई कल गर्दा मानिसहरूले तीनवटा समूहलाई मात्र बल दिन्छन् जब मात्र दुई, वा k = 2 को इनपुट, थप प्राकृतिक फिट प्रदान गर्नेछ।

त्यसै गरी, यदि व्यक्तिको समूहले गृह अवस्थाको आधारमा सजिलै क्लस्टर गरिएको थियो र तपाइँले k = 20 को साथ k- साधन एल्गोरिथ्म भनिन्छ , परिणामहरू प्रभावकारी हुन धेरै सामान्यकृत हुन सक्छ।

यस कारणको लागि, यो प्राय: तपाईंको डेटा सूट गर्ने मान पहिचान गर्न कश्मीरको विभिन्न मानहरूसँग प्रयोग गर्न एक राम्रो विचार हो। तपाईं पनि मिसिन-सिक्ने ज्ञानको लागि तपाइँको खोजमा अन्य डेटा खनन एल्गोरिदमहरूको प्रयोग अन्वेषण गर्न चाहन सक्नुहुन्छ।