- Wikisun
FASTA - Bioinformatika sahəsində geniş istifadə olunan bir format və alqoritm. Mahiyyəti O, əsasən DNT, RNT və zülal ardıcıllıqlarının saxlanması, emalı və müqayisəsi üçün tətbiq olunur. Bu format, sadə və oxunaqlı olduğu üçün müxtəlif bioinformatik proqramlarda və VB-də geniş istifadə edilir. FASTA həmçinin eyni adlı ardıcıllıq müqayisə alqoritminin adıdır. Bu alqoritm, biomolekulyar ardıcıllıqlar arasında oxşarlıq tapmaq üçün istifadə olunur və BLAST kimi daha inkişaf etmiş metodların əsasını təşkil edir. Tarix FASTA formatı və alqoritmi 1985-ci ildə Devid J. Lipman və Uilyam R. Pearson tərəfindən təqdim edilmişdir. Onların məqsədi DNT və protein ardıcıllıqlarını daha effektiv və sürətli müqayisə edə bilən bir metod yaratmaq idi. Başlanğıcda, FASTA proqramı ardıcıllıqların müqayisəsi üçün nəzərdə tutulmuşdu. Sonralar onun fayl formatı daha populyar oldu və bioinformatikada standartlardan birinə çevrildi. FASTA formatı iki əsas hissədən ibarətdir: Başlıq Sətiri: ">" simvolu ilə başlayır və ardıcıllıq haqqında məlumatları ehtiva edir. Ardıcıllıq sətirləri: Nukleotid və ya amin turşusu ardıcıllığını göstərir. Məsələn, DNT ardıcıllığı üçün FASTA faylı belə görünə bilər: >gene1 Homo sapiens hypothetical protein ATGCGTACGTAGCTAGCTAGCTAGCTAGCTGACTGATCGATCGTAGCTGATCGTAGCTGA CTGATCGTACGATCGATCGTACGTAGCTAGCTAGCTGACTGATCGATCGTAGCTGA Zülal (protein) ardıcıllığı üçün isə: >sp|P69905|HBA_HUMAN Hemoglobin subunit alpha - Homo sapiens (Human). MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHG KKVADALTAVGHGGQ Başlıq sətrində aşağıdakı məlumatlar ola bilər: "sp" – Swiss-Prot verilənlər bazasını göstərir. "P69905" – Unikal protein identifikatoru. "HBA_HUMAN" – Zülalın adı və mənşəyi. Ardıcıllıq sətirləri isə nukleotidlərdən (A, T, C, G) və ya amin turşularından (M, V, L, S və s.) ibarətdir. İstifadə sahələri 1. Genomika və proteomika DNT, RNT və zülal ardıcıllıqlarının saxlanması və emalı. Mutasiyaların və genetik fərqlərin təhlili. Genomik tədqiqatlarda böyük verilənlər bazalarının idarə olunması. 2. Bioinformatik verilənlər bazaları FASTA formatı bir çox beynəlxalq bioloji verilənlər bazasında istifadə olunur: GenBank (NCBI) – Nukleotid ardıcıllıqları üçün. UniProt – Zülal ardıcıllıqları üçün. EMBL – Avropa Molekulyar Biologiya Laboratoriyasının verilənlər bazası. 3. Ardıcıllıq uyğunlaşdırılması və müqayisə FASTA formatı ardıcıllıqların müqayisə edilməsi üçün istifadə olunan proqramlarla işləyir: BLAST (Basic Local Alignment Search Tool) Clustal Omega (Çoxlu ardıcıllıq uyğunlaşdırılması üçün) MUSCLE (Proteomik və genomik tədqiqatlar üçün) 4. Təkamül və filogenetik araşdırmalar FASTA formatında saxlanılan ardıcıllıqlar təkamül əlaqələrinin təhlili və filogenetik ağacların qurulması üçün istifadə olunur. Bu üsullar müxtəlif canlılar arasında genetik oxşarlıqları müəyyən etməyə kömək edir. FASTA yalnız bir fayl formatı deyil, həm də ardıcıllıq müqayisəsi üçün xüsusi bir alqoritmdir. FASTA alqoritminin əsas məqsədi iki biomolekulyar ardıcıllıq arasında oxşarlıqları tapmaqdır.
https://en.wikipedia.org/wiki/FASTA
https://pmc.ncbi.nlm.nih.gov/articles/PMC280013/
https://www.ebi.ac.uk/jdispatcher/
https://web.archive.org/web/20000304113005/http://fasta.bioch.virginia.edu/
https://en.wikipedia.org/wiki/FASTA_format
https://zhanggroup.org/FASTA/
https://www.masswerk.at/nowgobang/2019/dec-crt-typography
https://www.vt100.net/dec/vt220/glyphs
https://softwareengineering.stackexchange.com/questions/148677/why-is-80-characters-the-standard-limit-for-code-width
https://www.loc.gov/preservation/digital/formats/fdd/fdd000622.shtml
https://ncbi.github.io/cxx-toolkit/pages/ch_demo#ch_demo.id1_fetch.html_ref_fasta
https://web.archive.org/web/20120914234405/http://www.ncbi.nlm.nih.gov/staff/tao/tools/tool_lettercode.html
https://en.wikipedia.org/wiki/National_Center_for_Biotechnology_Information
https://web.archive.org/web/20110811073845/http://www.dna.affrc.go.jp/misc/MPsrch/InfoIUPAC.html
https://mafft.cbrc.jp/alignment/software/anysymbol.html
https://academic.oup.com/bioinformatics/article/37/16/2225/6135077?login=false
https://web.archive.org/web/20220815104407/https://compbio.soe.ucsc.edu/a2m-desc.html
https://github.com/soedinglab/hh-suite/blob/master/scripts/reformat.pl
Tarix : 1 fevral 2025
Əksi qeyd olunmayıbsa, bu məzmun CC BY-SA 4.0 çərçivəsində yayımlanır.