- Wikisun
Yarım strukturlaşdırılmış məlumat - Məlumatların təşkilatlandırılmış şəkildə saxlanıldığı, amma bu strukturun daha sərt qaydalara tabe olmadığı bir məlumat növü. Mahiyyəti Məlumatlar, müəyyən etiketlər və meta-məlumatlar ilə təqdim olunur, lakin onların müəyyən bir hissəsi qeyri-müəyyən və elastikdir. Bu cür məlumatlar, həm strukturlaşdırılmış verilənlər bazalarında saxlanılan məlumatlara, həm də tamamilə sərbəst mətnlərə bənzəməyən bir aralıqda mövcuddur. Strukturlaşdırılmış, Strukturlaşdırılmamış və Yarım Strukturlaşdırılmış Məlumatların Fərqləri Strukturlaşdırılmış məlumat (Structured Data): Hər hansı bir VB-də saxlanılan məlumatlardır və müəyyən qaydalara, sütunlara, sətirlərə və cədvəllərə tabe olur. Məsələn, MySQL, PostgreSQL və ya Oracle kimi verilənlər bazalarında saxlanılan məlumatlar bu kateqoriyaya aiddir. Strukturlaşdırılmamış məlumat (Unstructured Data): Məlumatlar heç bir müəyyən quruluşu olmayan və ya formal şəkildə təşkil edilməyən məlumatlardır. Məsələn, sərbəst yazılmış mətnlər, video və şəkillər bu kateqoriyaya aiddir. Yarım strukturlaşdırılmış məlumat (Semi-Structured Data): Bu cür məlumatlar müəyyən bir struktur təşkil edir, lakin tam olaraq strukturlaşdırılmış verilənlər bazası qaydalarına tabe olmur. Məlumatların müəyyən hissələri etiketlərlə təchiz edilib, lakin başqaları daha qeyri-müəyyən və dinamikdir. Məsələn, XML, JSON və YAML formatları buna misal göstərilə bilər. Xüsusiyyətləri -Fleksibilik və elastiklik: Yarım strukturlaşdırılmış məlumat, məlumatların çevik bir şəkildə saxlanmasına imkan verir. Məlumatın bir hissəsi müntəzəm olaraq dəyişə bilər, digərləri isə sabit qalar. Bu, məlumatları dəyişən və ya inkişaf edən tələblərə uyğunlaşdırmağı asanlaşdırır. -Meta-məlumat və etiketlər: Bu cür məlumatlar çox vaxt etiketlər (tags), atributlar və meta-məlumatlar ilə təmin olunur. Meta-məlumatlar məlumatın mənasını açıqlamaq üçün istifadə edilir. Məsələn, JSON və XML-də məlumat bir "ana etiket" ilə təşkil olunur, hansı ki, məlumatın xüsusiyyətlərini müəyyənləşdirir. -Hibrid təbiət: Yarım strukturlaşdırılmış məlumat, həm strukturlaşdırılmış, həm də strukturlaşdırılmamış elementləri özündə birləşdirə bilər. Məsələn, bir XML sənədində məlumat strukturludur, lakin etiketlərin içindəki dəyərlər elastikdir və dəyişə bilər. Formatlar 1. XML (Extensible Markup Language): XML, məlumatın strukturlaşdırılmasında istifadə edilən geniş yayılmış bir dil və formatdır. XML sənədində məlumat elementlərə və atributlara ayrılır və məlumatlar bir-birinə müəyyən bir qaydada bağlanır. XML formatı çox çevikdir və hər cür məlumatı saxlayır, lakin o, digər formatlarla müqayisədə daha mürəkkəb və həcmlidir. 2. JSON (JavaScript Object Notation): JSON formatı, XML-ə nisbətən daha yüngül və daha sadədir. Bu formatın əsas üstünlüyü onun insan tərəfindən oxunabilir olmasıdır. JSON, əsasən JavaScript dilində istifadə edilir, lakin çoxlu digər proqramlaşdırma dilləri də onu dəstəkləyir. Məlumat JSON-da açar-dəyər (key-value) cütləri şəklində təqdim olunur. 3. YAML (YAML Ain’t Markup Language):YAML formatı JSON-a bənzəyir, lakin daha sadə və human-readable formatda yazılır. YAML, konfiqurasiya fayllarında və tətbiq parametrlərində tez-tez istifadə olunur. Həmçinin, yarım strukturlaşdırılmış məlumatlar üçün CSV (Comma Separated Values), Avro, Parquet və Protocol Buffers kimi formatlar da istifadə edilə bilər. Bunlar müxtəlif tətbiq sahələrinə uyğun olaraq seçilir. Üstünlüklər -Elastiklik və dinamiklik:Yarım strukturlaşdırılmış məlumat, məlumatların təbiətinin dəyişə biləcəyini nəzərə alaraq daha elastikdir. Bu məlumatların yeni sahələr əlavə etmək və ya mövcud sahələri dəyişdirmək çox asandır. -Fərqli formatlarla inteqrasiya:Yarım strukturlaşdırılmış məlumat müxtəlif sistemlər və platformalar arasında məlumat mübadiləsini asanlaşdırır. Müxtəlif proqramlar və xidmətlər arasında məlumat ötürülməsi bu formatlarda daha rahat həyata keçirilir. -Təhlilin sadələşdirilməsi:Müxtəlif yarım strukturlaşdırılmış formatlar məlumatın daha səmərəli və asan şəkildə təhlil edilməsini təmin edir. JSON, XML və YAML formatları insan tərəfindən oxuna bilir və mütəxəssislər tərəfindən asanlıqla başa düşülür. Çətinliklər -Məlumatın interpretasiyası və idarə edilməsi:Yarım strukturlaşdırılmış məlumatın təhlil edilməsi və idarə edilməsi, strukturlaşdırılmış VB ilə müqayisədə daha çətin ola bilər. Məlumatın mürəkkəbliyi və qeyri-müəyyənliyi təhlil prosesini çətinləşdirə bilər. -Standartlaşdırma və uyğunlaşma problemləri:Hər bir format fərqli strukturlar və metodlarla işləyir. Bu, müxtəlif sistemlər arasında məlumat inteqrasiyasını çətinləşdirə bilər.
https://en.wikipedia.org/wiki/Semi-structured_data
chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://homepages.inf.ed.ac.uk/opb/papers/PODS1997a.pdf
http://infolab.stanford.edu/lore/home/index.html
https://www.snowflake.com/guides/semi-structured-data-101/#:~:text=What%20Is%20Semi%2DStructured%20Data,hierarchies%20of%20records%20and%20fields.
https://www.geeksforgeeks.org/what-is-semi-structured-data/
https://www.teradata.com/glossary/what-is-semi-structured-data
https://atlan.com/what-is/semi-structured-data/
https://redis.io/glossary/semi-structured-data/
https://www.altexsoft.com/blog/semi-structured-data/
https://www.sciencedirect.com/topics/computer-science/semistructured-data
https://www.starburst.io/data-glossary/unstructured-data/
https://www.indeed.com/career-advice/career-development/semi-structured-data
https://www.educba.com/semi-structured-data/
https://mycloudwiki.com/san/data-and-information-basics/
https://10senses.com/blog/structured-vs-semi-structured-vs-unstructured-data/
https://www.docsumo.com/blogs/data-extraction/structured-vs-unstructured-vs-semistructured
https://rathi-ankit.medium.com/decoding-structures-of-data-14675a8e0dab
https://k21academy.com/microsoft-azure/dp-900/structured-data-vs-unstructured-data-vs-semi-structured-data/
https://www.iunera.com/kraken/fabric/an-easy-guide-to-structured-unstructured-and-semi-structured-data/
https://studyopedia.com/data-science/types-of-big-data/
https://www.researchgate.net/figure/The-taxonomy-of-Information-Extraction-b-Semi-Structured-Data-Semi-structure-means-that_fig1_224351589
https://www.alibabacloud.com/blog/the-practice-of-semi-structured-data-processing-based-on-maxcompute-sql_598381
Tarix : 31 yanvar 2025
Əksi qeyd olunmayıbsa, bu məzmun CC BY-SA 4.0 çərçivəsində yayımlanır.