K-Kümelenmə nə deməkdir?

K-vasitə alqoritmi ilə məlumatların hazırlanması

K- kümelenme alqoritmi bu əlaqələrin əvvəlcədən məlumatlandırılmaması ilə əlaqədar müşahidələrin qruplarına müşahidələrin qruplaşdırılmasında istifadə edilən bir məlumat mədəniyyəti və maşın öyrənmə vasitədir. Nümunə alaraq, alqoritm məlumatın hansı kategoriyada və ya kümədə olduğunu göstərmək üçün çalışır, k kəmiyyəti ilə müəyyən edilmiş qrupların sayı ilə .

K- alqoritm ən sadə kümeleme üsullarından biridir və tibbi baxımda, biometriyada və əlaqədar sahələrdə yaygın olaraq istifadə olunur. K- kümelenmənin üstünlüyü, məlumatların başlanğıcdakı alqoritmini (alqoritmi nəzarət edilmiş formasını istifadə edərək) öyrətməməyiniz əvəzinə, məlumatlarınızı (yoxlanılmamış forma istifadə edərək) bildirdiyidir.

Bəzən Lloyd's alqoritmi, xüsusən də kompüter elm dairələrində adlandırılır, çünki standart alqoritm 1957-ci ildə Stuart Lloyd tərəfindən təklif edilmişdir. "K-vasitə" termini 1967-ci ildə James McQueen tərəfindən hazırlanmışdır.

K-Alqoritmi funksiyaları necədir

K- alqoritmi öz adını fəaliyyət metodundan əldə edən bir təkamül alqoritmidir. Alqoritm qrupları müşahidələri k qruplarına daxil edir, burada k parametri giriş parametri kimi təqdim olunur. Daha sonra müşahidənin klasterin ortasına yaxınlığına əsaslanan hər bir müşahidəni qruplara verir. Kümənin ortalaması daha sonra recomputed və prosesi yenidən başlayır. Alqoritmanın necə işlədiyi:

  1. Alqoritm özbaşına ilkin klaster mərkəzləri (vasitələri) kimi k nöqtələrini seçir.
  2. Dataset hər bir nöqtə hər bir nöqtə və hər bir Klaster mərkəzi arasında Öklidyan məsafəsinə əsaslanan qapalı klasterə təyin edilir.
  3. Hər klaster mərkəzi həmin qrupdakı balların ortalaması kimi yenidən qiymətləndirilir.
  4. Kümeler bir-birinə yaxınlaşana qədər 2 və 3 addımları təkrarlayın. Uyğunlaşma tətbiqə bağlı olaraq fərqli olaraq müəyyən edilə bilər, ancaq normal olaraq ya 2 və 3-cü addımlar təkrar edildikdə və ya dəyişikliklər qrupların müəyyənləşdirilməsində əhəmiyyətli bir dəyişiklik olmadığı təqdirdə ya müşahidələr qrupları dəyişdirməyəcəkdir.

Cluster sayı seçilməsi

K- əsas mənfi cəhətlərdən biri kümelenmə deməkdir ki, alqoritmə giriş kimi qrupların sayını təyin etməlisiniz. Alqoritm nəzərdə tutulduğu kimi, müvafiq qrup sayını müəyyən etməyə qadir deyil və istifadəçini əvvəlcədən təyin etmək üçün asılıdır.

Məsələn, kişi və ya qadın kimi ikitərəfli gender şəxsiyyətinə əsaslanan qruplaşmaq üçün bir qrup insan varsa, k = 3 girişini istifadə edərək alqoritmi çağıraraq k = alətini yalnız iki və ya iki k = 2 girişi, daha təbii uyğunluq təmin edəcəkdir.

Eynilə, əgər bir qrup şəxs asanlıqla ev vəziyyətinə əsaslansa və giriş k = 20 ilə k- vasitə alqoritmini adlandırdıysanız nəticələr effektiv olmaq üçün çox ümumi ola bilər.

Buna görə də, məlumatlarınıza ən uyğun dəyəri müəyyən etmək üçün müxtəlif dəyərlər ilə sınaqdan keçmək yaxşı bir fikirdir. Ayrıca, maşın məlumatı bilmək üçün axtarışda digər məlumatların alınması alqoritmlərinin istifadəsini araşdırmaq isteyebilirsiniz.