- Wikisun
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) - Sıxlığa əsaslanan bir klasterləmə alqoritmi. Tarix 1996-cı ildə Martin Ester, Hans-Peter Kriegel, Jörg Sander və Xiaowei Xu tərəfindən təqdim edilmişdir. Mahiyyəti DBSCAN, verilənlər toplusunda sıxlıq əsaslı klasterləri müəyyənləşdirərək, səs-küy (noise) və kənar dəyərləri aşkar etməyə imkan verir. DBSCAN məlumatları iki əsas parametrdən istifadə edərək qruplaşdırır - Epsilon – bir nöqtənin qonşuluğunu təyin edən maksimal məsafə. - MinPts (Minimal Nöqtə Sayı) – bir nöqtənin əsas nöqtə (core point) kimi qəbul edilməsi üçün tələb olunan minimal qonşu nöqtə sayı. DBSCAN üç növ nöqtə müəyyən edir: - Əsas nöqtələr (Core Points): Əgər bir nöqtənin ε daxilində ən az MinPts sayda qonşusu varsa, o, əsas nöqtə kimi qəbul edilir. - Kənar nöqtələr (Border Points): Əsas nöqtələrin ε qonşuluğunda yerləşən, lakin özü əsas nöqtə olmayan nöqtələr. - Səs-küy nöqtələri (Noise Points): Hər hansı klasterə aid edilməyən nöqtələr. İş prinsipi - Məlumatlar toplusundan təsadüfi bir nöqtə seçilir. - Bu nöqtənin epsilon radiusundakı qonşuları müəyyən edilir. - Əgər qonşuların sayı MinPts-dən azdırsa, nöqtə səs-küy kimi qeyd olunur. Əks halda, yeni bir klaster formalaşdırılır. - Klasterə daxil edilən hər nöqtə üçün prosesi davam etdirərək qonşular genişləndirilir. - Bütün nöqtələr yoxlanıldıqdan sonra proses başa çatır. Üstünlükləri Klasterlərin formasından asılı deyil və qeyri-sferik formalı qrupları da tanıya bilər. Səs-küy və kənar dəyərləri müəyyənləşdirmək qabiliyyətinə malikdir. Klasterlərin sayını əvvəlcədən təyin etməyə ehtiyac yoxdur İstifadəsi - Coğrafi məlumat analizi (xəritə üzərində qruplaşmaların müəyyən edilməsi) - Sosial şəbəkə analizi - Fırıldaqçılığın aşkarlanması - Tibbi diaqnostika (məsələn, xəstəliklərin qruplaşdırılması) - Anomaliya aşkarlanması
https://en.wikipedia.org/wiki/DBSCAN
https://www.sciencedirect.com/science/article/abs/pii/S2352152X24029797
https://pmc.ncbi.nlm.nih.gov/articles/PMC9322930/
https://www.kdd.org/News/view/2014-sigkdd-test-of-time-award
https://academic.oup.com/comjnl/article-abstract/15/4/326/351493?redirectedFrom=fulltext&login=false
https://blog.dailydoseofds.com/p/the-limitations-of-dbscan-clustering
Tarix : 6 fevral 2025