निर्मितीमाध्यमिक शिक्षण आणि शाळा

जवळच्या शेजारी पद्धत: काम उदाहरण

जवळच्या शेजारी पद्धत विविध वस्तू सारखेपणा मूल्यमापन आधारित आहे सर्वात सोपा मेट्रिक वर्गीकरण आहे.

विश्लेषण ऑब्जेक्ट ते प्रशिक्षण नमुना विषय संबंधित जे वर्ग आहे. आम्हाला आहे जवळच्या शेजारी बाहेर शोधू द्या. क्लिष्ट बाब, विविध तंत्रज्ञानांचा उदाहरणे समजून करण्याचा प्रयत्न करा.

गृहीते पद्धत

जवळच्या शेजारी पद्धत वर्गीकरण वापरले सर्वात सामान्य अल्गोरिदम म्हणून मानले जाऊ शकते. वर्गीकरण सुरू ऑब्जेक्ट, जे जवळचा ऑब्जेक्ट x_i नमुना शिकत वर्ग y_i मालकीची आहे.

पद्धती जवळच्या शेजारी विशिष्टता

जवळच्या शेजारी पद्धत वर्गीकरण अचूकता सुधारू शकता, वा. विश्लेषण ऑब्जेक्ट, त्याच्या शेजारी बल्क म्हणून, एकाच वर्गात मालकीचे आहे की, तो विश्लेषण नमुना x_i वस्तू बंद के. शेजारी संख्या दोन वर्ग समस्या सोडवणे, संदिग्धता एक परिस्थिती टाळण्यासाठी विचित्र असेल शेजारी समान संख्या भिन्न वर्ग संबंधित असेल तर.

निलंबित शेजारी तंत्र

Postgresql-विश्लेषण पद्धत वर्ग तीन किमान संख्या, आणि आपण एक विचित्र नंबर वापरू शकत नाही तेव्हा tsvector जवळच्या शेजारी वापरले जाते. पण संदिग्धता या प्रकरणांमध्ये उद्भवली आहे. मग, मी व्या शेजारी शेजारी रँक मी कमी जे w_i वजन, नाही. हे ऑब्जेक्ट वर्ग, बंद शेजारी आपापसांत जास्तीत जास्त एकूण वजन असेल संदर्भित.

compactness गृहीते

वरील पद्धती सर्व हृदय compactness गृहीते आहे. हे वस्तू सारखेपणा उपाय आणि एकाच वर्गात त्यांच्या राहण्याचे संबंध सूचित करते. या परिस्थितीत, विविध प्रकारच्या सीमारेषा एक साधी फॉर्म आहे, आणि जागा संक्षिप्त मोबाइल क्षेत्र वस्तूंची वर्ग तयार करा. अशा भागात अंतर्गत गणिती विश्लेषण एक बंद bounded संच याचा अर्थ असा करण्यात आली आहे. या गृहीतकावर शब्द दररोज समज संबंधित नाही.

मूलभूत सूत्र

आम्हाला अधिक जवळच्या शेजारी परीक्षण करू या. तर प्रस्तावित प्रशिक्षण नमुना प्रकार "ऑब्जेक्ट-प्रतिसाद» एक्स ^, m = \ {(x_1, y_1), \ ठिपके, (x_m, y_m) \}; वस्तू एक अनेकत्व अंतर कार्य \ RHO (x, X ') परिभाषित करण्यासाठी तर कार्याचे मूल्य वाढवून वस्तू एक पुरेसा मॉडेल सारखेपणा स्वरूपात प्रस्तुत केले जाते जे, वस्तू दरम्यान नाम, नाम सारखेपणा कमी'.

कोणत्याही ऑब्जेक्ट, नाम एक प्रशिक्षण नमुना नाम करण्यासाठी अंतर वाढत x_i आक्षेप तयार होईल:

\ RHO (यू, x_ {1; नाम}) \ leq \ RHO (यू, x_ {2; नाम}) \ leq \ cdots \ leq \ RHO (यू, x_ {मीटर; नाम}),

जेथे x_ {मी; नाम} नाम मी व्या शेजारी स्रोत ऑब्जेक्ट आहे ऑब्जेक्ट शिक्षण नमुना, characterizes. अशा नोटेशन आणि वापर मी व्या शेजारी प्रत्युत्तर देण्यात: y_ {मी; नाम}. एक परिणाम म्हणून, आम्ही कोणत्याही ऑब्जेक्ट नाम स्वत: च्या नमुना renumbering वाद घालणे असे.

शेजारी संख्या के निश्चित

जवळच्या शेजारी पद्धत तेव्हा के = 1 नाही फक्त वस्तू-उत्सर्जन, पण जवळ आहेत की इतर वर्ग, एक चुकीचा वर्गीकरण देत करण्यास सक्षम आहे.

आम्ही k = m असेल तर, अल्गोरिदम म्हणून स्थिर होईल आणि एक स्थिर मूल्य मध्ये भ्रष्ट आहे. विश्वसनीयता अत्यंत निर्देशांक k टाळणे महत्वाचे आहे का आहे.

सराव, चांगल्या निर्देशांक के वापरले म्हणून निकष नियंत्रण सरकता.

स्क्रिनिंग उत्सर्जन

अभ्यास वस्तू मुख्यत्वे असमान आहेत, पण त्यापैकी एक वर्ग वैशिष्ट्ये आहेत आणि मानके म्हणून उल्लेख आहेत, ज्यांना. या वर्गात राहण्याचे त्याच्या उच्च संभाव्यता आदर्श मॉडेल अधीन शेजारी आहे.

कसे rezultativen जवळच्या शेजारी पद्धत? एक उदाहरण वस्तू गौण आणि बोधप्रद नसलेल्या श्रेणी आधारावर पाहिले जाऊ शकते. हे या वर्गाचे ऑब्जेक्ट इतर प्रतिनिधी दाट वातावरण आहे असे गृहीत धरले आहे. आपण दु: ख नाही गुणवत्ता नमूना वर्गीकरण त्यांना काढतो.

नमुने एक वर्ग "जमिनीवर" आहेत मे आवाज रंग निश्चित संख्या मध्ये मिळवा. वर्गीकरण गुणवत्ता सेवनाने सकारात्मक परिणाम काढत आहे.

नमुना uninformative आणि दूर आवाज वस्तू घेतले असल्यास, आपण एकाच वेळी काही सकारात्मक परिणाम मोजू शकता.

प्रथम च्या प्रक्षिप्त पद्धत जवळच्या शेजारी वर्गीकरण, गुणवत्ता सुधारण्यासाठी पुढील मानके निवड खर्च आहे वर्गीकरण, वेळ कमी, संचयित केलेला डेटा कमी परवानगी देते.

अल्ट्रा-मोठ्या नमुने वापर

जवळच्या शेजारी पद्धत शिक्षण वस्तू वास्तविक स्टोरेज आधारित आहे. एक तांत्रिक समस्या वापरून फार मोठ्या प्रमाणात नमुने तयार करण्यासाठी. उद्देश फक्त माहिती लक्षणीय रक्कम जतन करु नका, पण वेळ किमान रक्कम मध्ये नाम जवळचा शेजारी आपापसांत k कोणत्याही ऑब्जेक्ट शोधण्यासाठी वेळ आहे.

हे कार्य सह झुंजणे करण्यासाठी, दोन पद्धती वापरली जातात:

  • स्त्राव होणारा गैर-डेटा वस्तू द्वारे thinned नमुना;
  • प्रभावी वापर विशेष डेटा रचना आणि जवळच्या शेजारी झटपट शोध कोड.

निवड पद्धती नियम

वरील वर्गीकरण मानले होते. जवळचे शेजारी पद्धत आगाऊ ओळखले अंतर कार्य \ RHO आहे व्यावहारिक अडचणी, सोडवणे वापरले जाते (x, X '). वर्णन वस्तू संख्यात्मक vectors एक Euclidean मेट्रिक वापरा. ही निवड विशेष समर्थन आहे, पण सर्व चिन्हे मोजमाप यांचा समावेश आहे "त्याच प्रमाणात आहे." या घटक खात्यात घेतले नाही, तर मेट्रिक वैशिष्ट्य सर्वाधिक अंकीय मूल्य येत वरचढ आहे.

वैशिष्ट्ये एक खारा रक्कम, विशिष्ट लक्षणे बदल बेरीज अंतर गणना आहे, तर गंभीर समस्या आकारमान दिसतात.

एकमेकांना इतर सर्व वस्तू दूर उच्च मितींच्या पोकळीत. शेवटी, कोणताही नमुना पुढील ऑब्जेक्ट अभ्यास जात के शेजारी असेल. ही समस्या दूर करण्यासाठी माहितीपूर्ण वैशिष्ट्ये एक लहान संख्या निवडले. अंदाज गणना अल्गोरिदम चिन्हे विविध संच आधारावर तयार, आणि प्रत्येक त्यांच्या शेजारी कार्य तयार.

निष्कर्ष

गणिती गणिते अनेकदा त्यांच्या स्वत: च्या विशिष्ट वैशिष्ट्ये, फायदे आणि तोटे आहे की तंत्र विविध वापर समावेश. पाहिलेले जवळच्या शेजारी पद्धत संपुष्टात गणितीय वस्तूंचे गुणधर्म, यापैकी गंभीर समस्या सोडवू शकतो. विश्लेषण पद्धत आधारित प्रायोगिक संकल्पना, सक्रियपणे कृत्रिम बुद्धिमत्ता मध्ये वापरले जात आहे.

तज्ज्ञ प्रणाली तो फक्त वस्तू वर्गीकरण करण्यासाठी नाही, पण वापरकर्ता प्रश्न वर्गीकरण स्पष्टीकरण दाखवा आवश्यक आहे. या पद्धती मध्ये, या इंद्रियगोचर स्पष्टीकरण एक विशिष्ट वर्ग ऑब्जेक्ट तसेच वापरले नमुना त्याच्या स्थान नातेवाईक संबंधात व्यक्त आहेत. कायदेशीर उद्योग विशेषज्ञ, भूवैज्ञानीक, चिकित्सक, या "पायंडा" तर्कशास्त्र सक्रियपणे त्यांच्या संशोधन ते वापरू घ्या.

करण्यासाठी पद्धत सर्वात इच्छित परिणाम देत, विश्वसनीय कार्यक्षम, आपण किमान आकृती के, तसेच विश्लेषण वस्तू आपापसांत उत्सर्जन टाळण्यासाठी असताना घेणे आवश्यक आहे विश्लेषण करणे. आहे मानके वापर आणि निवड पद्धत, तसेच ऑप्टिमायझेशन मेट्रिक्स का.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 mr.atomiyme.com. Theme powered by WordPress.