Fuzzy K-tähendab klastreerimist Mahoutis

See ajaveeb tutvustab Apache Mahoutis asuvaid Fuzzy K-Means klastreid.



Fuzzy K-Means on täpselt sama algoritm nagu K-tähendab, mis on populaarne lihtne klastritehnika. Ainus erinevus on see, et selle asemel, et määrata punkt ainult ühele klastrile, võib sellel olla mingisugune hägusus või kattuvus kahe või enama klastri vahel. Järgnevalt on toodud Fuzzy K-vahendeid kirjeldavad põhipunktid:



teisenda kahekordne int-ks
  • Erinevalt K-Meansist, mis otsib tugevat klastrit, kus kõik punktid kuuluvad ühte klastrisse, otsib Fuzzy K-Means pehmemaid klastreid kattumiseks.
  • Pehme klastri üks punkt võib kuuluda mitmesse klastrisse, millel on teatud afiinsusväärtus iga punkti suhtes.
  • Afiinsus on proportsionaalne selle punkti kaugusega klastri tsentroidist.
  • Sarnaselt K-Meansiga töötab ka Fuzzy K-Means objektidel, millel on määratletud kaugusemõõt ja mida saab n- dimensiooniline vektorruum.

Fuzzy K-Means MapVoolu vähendamine

MapReduce'i K-Means'i ja Fuzzy K-Means-i voos pole palju erinevusi. Mõlema rakendamine Mahoutis on sarnane.

Järgmised on olulised parameetrid Fuzzy K-Means rakendamiseks:



  • Sisestamiseks vajate vektoriandmekomplekti.
  • Algsete k klastrite külvamiseks peab olema RandomSeedGenerator.
  • Kauguse mõõtmiseks on vajalik ruut SquaredEuclideanDistanceMeasure.
  • Konvergentsiläve suur väärtus, näiteks –cd 1.0, kui on kasutatud kaugusemõõdu ruutu väärtust
  • MaxIterations väärtus on vaikeväärtus -x 10.
  • Normaliseerimiskoefitsient või hägusustegur, mille väärtus on suurem kui -m 1,0

Kas teil on meile küsimus? Mainige neid kommentaaride jaotises ja võtame teiega ühendust.

Seonduvad postitused

kõne viitega c ++



Juhendatud õppimine Apache Mahoutis