FormaasjeFuortset ûnderwiis en skoallen

Tichtstby buorman metoade: foarbyld fan wurk

it tichtstby lizzende buorman metoade is de maklikste Metric Klasse dat is basearre op de evaluaasje fan de gelikensens fan 'e ferskate foarwerpen.

Analysearre foarwerp heart ta de klasse dêr't se hearre ûnderwerpen fan de oplieding sample. Lit ús fine út dat it tichtstby buorman. Besykje te begripen it komplisearre matearje, foarbylden fan ferskillende techniken.

hypteze metoade

tichtstby lizzende buorman metoade kin beskôge wurde as de meast foarkommende algoritme brûkt foar klassifikaasje. Objekt ûndergiet yndieling heart ta de klasse y_i, dêr't it tichtst foarwerp learen x_i stekproef.

Spesifisiteit fan metoaden tichtst buorlju

k tichtstby lizzende buorman metoade kin ferbetterje de krektens fan de klassifikaasje. Analysearre foarwerp heart ta deselde klasse as it grutste part fan syn buorlju, dat wol sizze, k ticht by it foarwerpen fan de analysearre sample x_i. It oplossen fan problemen mei twa klassen fan it oantal buorlju sille wêze ûneven te kommen dat in situaasje fan ambiguïteit, as it selde oantal buorlju thúsheart oan ferskillende klassen.

De technyk of suspended buorlju

PostgreSQL-analysearre metoade tsvector tichtst buorlju wurdt brûkt as it oantal klassen op syn minst trije, en jo kinne gjin gebrûk meitsje fan in ûneven getal. Mar ambiguïteit ûntstiet ek yn dy gefallen. Dan, de i-th buorman krijt w_i gewicht, dy't ôfnimt mei de buorman rang i. It ferwiist nei de klasse fan it foarwerp, dat sil hawwe in maksimale totaal gewicht ûnder tichtby buorlju.

De hypoteze fan compactness

By it hert fan alle fan boppeneamde metoaden is de hypoteze fan compactness. It suggerearret in ferbining tusken de miette fen 'e gelikensens fan objekten en harren dy't ta deselde klasse. Yn dizze situaasje, de grins tusken de ferskate types is in ienfâldige foarm, en meitsje klassen fan de objekten yn de romte kompakt mobile gebiet. Under sokke gebieten yn wiskundige analyse nommen te betsjutten in sletten begrinzge set. Dizze hypteze is net besibbe oan it deistich belibbing fan it wurd.

De basis Formule

Lit ús ûndersykje mear tichtstbye buorman. As de foarnommen training sample type "object-antwurd» X ^ m = \ {(x_1, y_1), \ stippen, (x_m, y_m) \}; as in mearfâldichheid fan foarwerpen te beskiede hokker ôfstân funksje \ Rho (x, x '), dat is fertsjintwurdige yn de foarm fan in adekwaat model gelikensens fan' e objekten troch it fergrutsjen fan de wearde fan 'e funksje nimt ôf oerienkomst tusken objekten x, x'.

Foar eltse foarwerp, u sil bouwe in training sample foarwerpen x_i mei tanimmende ôfstannen oan u:

\ Rho (u, x_ {1; u}) \ leq \ Rho (u, x_ {2; u}) \ leq \ cdots \ leq \ Rho (u, x_ {m; u}),

dêr't x_ {i; u} karakterisearret it foarwerp learen sample, dat is i-th buorman boarne foarwerp u. Sa'n skriuwwize en it gebrûk om antwurd te i-th buorman: y_ {i; u}. As gefolch, wy fine dat eltse foarwerp u ret renumbering eigen stekproef.

Bepaling fan it oantal k fan buorlju

tichtstby lizzende buorman metoade doe't k = 1 is steat fan it jaan fan in ferkearde ferzje ta gefolgen klassifikaasje, net allinne op foarwerpen-útstjit, mar ek foar oare klassen dy't tichtby.

As wy nimme k = m, it algoritme sil wêze as stabyl en sil degenerearret yn in konstante wearde. Dêrom Zuverlässigkeit is wichtich foar te kommen ekstreme Indices k.

Yn de praktyk, sa't it optimale yndeks k brûkt kritearium sliding kontrôle.

fertoand útstjit

De objekten fan stúdzje binne foar it grutste part ûngelikense, mar ûnder har dêr binne guons, dy hawwe de skaaimerken fan in klasse en wurde oantsjut as noarmen. By neite fan it ûnderwerp oan 'e ideale model fan syn hege kâns dy't ta dizze klasse.

Hoe rezultativen metoade fan tichtst buorlju? In foarbyld is te sjen oan 'e basis fan perifeare en net-ynformative kategoryen fan objekten. Oannomd wurdt ticht omjouwing fan it objekt oare fertsjintwurdigers fan dizze klasse. As jo se fuortsmite fan de yndieling fan sampling de kwaliteit sil net lije.

Get yn in bepaald oantal fan gebrûk meie lawaai bursts dy't "op 'e grûn" fan in klasse. It fuortsmiten substantially positive ynfloed op de kwaliteit fan de yndieling.

As de stekproef nommen út 'e uninformative en elimineren lûd objekten, kinne jo rekkenje op in pear positive resultaten tagelyk.

De earste interpolation metoade fan de tichtst neiste klassifikaasje makket it mooglik om it ferbetterjen fan de kwaliteit, ferlytsje it bedrach fan bewarre data, ferminderje de tiid fan yndieling, dy't bestege wurdt oan 'e kar fan' e folgjende noarmen.

It brûken fan ultra-grutte fan gebrûk

tichtstby lizzende buorman metoade is basearre op it wiere opslach fan learen foarwerpen. Te meitsjen hiel grutskalich gebrûk mei help fan in technysk probleem. Doel is net samar te bewarjen in wichtige bedrach fan ynformaasje, mar ek yn it minimumbedrach fan tiid ta tiid hawwe te finen hokker foarwerp u k ûnder de neiste buorlju.

Om omgaan met dizze taak, twa metoaden wurde brûkt:

  • thinned stekproef fia de floed net-data objekten;
  • effektyf gebrûk spesjale gegevens struktuer en koades foar Instant sykjen fan de tichtstbye buorlju.

Regels fan 'e seleksje metoades

It boppesteande klassifikaasje waard beskôge. Nearest buorman metoade wurdt brûkt by it oplossen praktyske problemen, dat is bekend fan tefoaren de fierte funksje \ Rho (x, x '). By de beskriuwing fan foarwerpen numeryk Vectors brûke in Euclidean metryske. Dizze kar hat gjin spesjale ferantwurding, mar giet it om it mjitten fan alle tekens "yn deselde skaal." As dizze faktor is gjin rekken holden, dan it metryk sil oerwicht funksje hawwende heechste nûmerike wearden.

As der in substansjeel bedrach fan funksjes, berekkenjen fan de ôfstân ta de som fan de ôfwikingen op spesifike symptomen ferskine serieus probleem diminsje.

Yn hege dimensionale romte fier út inoar sille alle objekten. Uteinlik, eltse stekproef sil neist it objekt wurdt bestudearre k buorlju. selektearre in lyts oantal ynformative mooglikheden te elimineren dit probleem. Algoritmen foar berekkenje skattings bouwen op grûn fan ferskate sets fan teikens, en foar elk yndividu bouwe harren neite funksje.

konklúzje

Wiskundige berekkeningen faak belûke it gebrûk fan in ferskaat oan techniken dy't hawwe harren eigen karakteristike eigenskippen, foar- en neidielen. Besjoen tichtstby lizzende buorman metoade kin oplosse nochal in earnstich probleem, fanwege de skaaimerken fan wiskundige foarwerpen. It eksperimintele konsept, basearre op de analysearre metoade wurdt aktyf brûkt yn 'e keunstmjittige yntelliginsje.

Yn de Expert systemen is it nedich net allinne te klassifisearjen objekten, mar ek sjen litte de brûker in útlis fan 'e yndieling yn kwestje. Yn dizze metoade, in útlis fan dit ferskynsel wurde útdrukt yn relaasje ta it objekt fan in bepaalde klasse en ek de lizzing ten opsichte fan de stekproef brûkt wurdt. Wetlike yndustry spesjalisten, geologen, dokters, nim dit "precedent" logika aktyf brûke it yn harren ûndersyk.

Om wurde analysearre metoade wie it meast betrouber, doelmjittige, it jaan fan de winske resultaten, moatte jo nimme in minimale figuer k, wylst ek foarkomme dat útstjit ûnder de analysearre objekten. Dat is wêrom it brûken fan noarmen en de seleksje metoade, en ek it optimalisearjen metrics.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 fy.atomiyme.com. Theme powered by WordPress.