- Wikisun
"Outlier" (kənarlaşma) - Statistikada, verilənlər toplusundakı normal paylanmadan və ya əksər verilənlərdən fərqlənən qiymətlərə verilən ad. "Outlier", verilənlərdəki anormal və ya gözlənilməz dəyərləri təmsil edir və analiz prosesində həm əhəmiyyətli bir məlumat mənbəyi, həm də səhvlərin və ya qeyri-adi vəziyyətlərin göstəricisi ola bilər. Kənarlaşmaların düzgün təhlili, düzgün qərarların verilməsi və verilənlərdən doğru nəticələr çıxarılması üçün kritikdir. Hər bir çıxıntı nümunəsi, analiz edilməli və onun səbəbləri araşdırılmalıdır. "Outlier" nədir? "Outlier" adətən verilənlər dəstində olan və digər qiymətlərdən kəskin şəkildə fərqlənən bir dəyərdir. Kənarlaşmalar, verilənlərdəki əsas tendensiyalardan və ya paylamalardan ciddi şəkildə kənara çıxmış müşahidələrdir. Bu cür dəyərlər statistik analizlərdə düzgün nəticələrin əldə edilməsində problem yarada bilər, çünki onlar verilənlərin normallığına və ya paylanmasına zidd gəlir. Təsnifatı 1. Yuxarı kənarlaşma (High Outliers). Bu, verilənlər toplusunda gözlənilən dəyərlərdən daha yüksək olan qiymətlərdir. Məsələn, bir şəhərdə gəlir səviyyəsinin çox yüksək olduğu bir halda, bu fərdi şəxsin gəliri ümumi əhalinin gəlirindən çox yüksəkdir və bu, kənarlaşma kimi qəbul edilir. 2. Aşağı kənarlaşma (Low Outliers). Bu, verilənlər toplusunda gözlənilən dəyərlərdən daha aşağı olan qiymətlərdir. Məsələn, bir təhsil müəssisəsində tələbələrin ən aşağı bal aldığı bir test nəticəsi, həmin sinifdəki əksər tələbələrin nəticələrindən çox aşağıdır. "Outlier"lərin təyin edildiyi üsullar 1. Boxplot (Qutu Diagramı): Verilənlərin minimum, maksimum, medyan, 1-ci kvartil (Q1) və 3-cü kvartil (Q3) ilə sıx şəkildə təsvir etdiyi bir qrafikdir. Çıxıntılar, Q1 - 1.5 * IQR və Q3 + 1.5 * IQR arasındakı sərhədləri aşan dəyərlər kimi müəyyən edilir. Burada IQR (interquartile range), yəni 1-ci və 3-cü kvartillər arasındakı məsafə, çıxıntıları müəyyən etmək üçün istifadə olunur. 2. Z-Skoru: Hər bir verilən nöqtəsinin ortalama və standart sapmaya olan fərqini ölçür. Z-skoru 3-dən böyük olan dəyərlər (yəni ortalamadan 3 standart sapma daha uzaq olan dəyərlər) çıxıntı olaraq qəbul edilə bilər. Bu üsul əsasən normal paylanma tələb edən verilənlər üçün uyğundur. 3. IQR (Interquartile Range): Q1 və Q3 arasındakı məsafə olan IQR istifadə edərək çıxıntılar təyin edilə bilər. IQR-ın 1.5 qatından kənara çıxan dəyərlər adətən outlier kimi qiymətləndirilir. "Outlier" nümunələrinin səbəbləri 1. Səhvlər və ya yalnız qeydlər: Verilənlər toplama və ya qeyd etmə prosesində səhvlər meydana gələ bilər. Bu zaman outlier nümunələri, səhv daxil edilmiş məlumatlardan qaynaqlanır. 2. Müşahidə edilən qeyri-adi və ya nadir hadisələr: Bəzi çıxıntı nümunələri, həqiqətən nadir və qeyri-adi hadisələri əks etdirir. Məsələn, bir anketdə çox yüksək qiymət alan bir işçi, müəyyən bir sahədəki mükəmməlliklə bağlı xüsusi vəziyyətləri göstərə bilər. 3. Modelin uyğun olmaması: Bəzi hallarda, statistik model verilənlərə uyğun olmaya bilər və bu səbəbdən normadan kənar olan dəyərlər outlier kimi görünə bilər. Əhəmiyyəti və təhlili Outlier nümunələri, statistik analizlərdə kritik rol oynayır. "Outlier"lərin təhlili, həm xəta analizi, həm də doğru nəticələrin əldə edilməsi üçün vacibdir. "Outlier"lərin analizi aşağıdakı hallarda mühüm ola bilər: 1. Verilənlərin səhvlərini tapmaq: Əgər kənarlaşmada anormal dəyərlər səhvən daxil edilibsə, onları çıxarmaq verilənlər bazasının təmizlənməsini təmin edə bilər. 2. Yeni və yaradıcı məlumatlar aşkar etmək: Bəzi kənarlaşmalar yeni və faydalı məlumatların göstəricisi ola bilər. Məsələn, müəyyən bir marketinq kampaniyasının qeyri-adi uğuru, gələcəkdə tətbiq edilə biləcək yeni strategiyaların yaranmasına səbəb ola bilər. 3. Statistik modelin təkmilləşdirilməsi: Kənarlaşmalar, statistik modelin doğruluğunu və uyğunluğunu sınamaq üçün istifadə edilə bilər. Əgər model çox sayda outlier yaradırsa, bu, modelin daha yaxşı tərtib edilməsi və ya fərqli yanaşma ilə yenidən qurulması ehtiyacını göstərə bilər. Kənarlaşmaları aradan qaldırmaq və ya inklüziv yanaşma 1. "Outlier"lərin aşkarlanması və təmizlənməsi: "Outlier"lər məlum səhvlərdən qaynaqlanırsa, onları analizdən çıxarmaq yaxşı olar. Məsələn, anket məlumatlarındakı səhv daxil edilmiş yaş və ya gəlir dəyərləri düzəldilə bilər. 2. "Outlier"ləri inklüziv yanaşma ilə təhlil etmək: Əgər "Outlier"lər təbiətində qeyri-adi və əhəmiyyətli məlumatlar əks etdirirsə, onlar modelə daxil edilə bilər və yeni yanaşmaların yaradılmasına kömək edə bilər.
https://statisticsbyjim.com/basics/outliers/
https://en.wikipedia.org/wiki/Outlier
https://www.sciencedirect.com/topics/social-sciences/outlier
https://www.merriam-webster.com/dictionary/outlier
Tarix : 30 noyabr 2024