FASTA
| FASTA | |
|---|---|
| Pengembang | |
| Sistem operasi | |
| Jenis | Bioinformatics |
| Lisensi | apache2.0 |
| Situs web | |
| Repositori | |
FASTA adalah paket perangkat lunak penyelarasan urutan DNA dan protein yang pertama kali dijelaskan oleh David J. Lipman dan William R. Pearson pada tahun 1985, sehingga peneliti dapat menentukan apakah penyelerasan tersebut terjadi secara kebetulan atau dapat digunakan untuk menyimpulkan homologi.[1] Warisannya adalah format FASTA yang sekarang ada di mana-mana dalam bioinformatika, di mana program pangkalan data similaritas ini menggunakan strategi "memotong" (hashing) untuk mencari rangkaian pendek yang disebut k-tuples atau ktups yang mirip dengan kata pada BLAST,[2] Istilah ktup sendiri merupakan rangkaian residu yang berasal dari sekuen kueri yang dipecah menjadi pola sekuens atau kata-kata agar bisa digunakan sekuens target untuk menentukan kesamaan di antara keduanya. Rangkaian ini biasanya terdiri dari dua residu untuk sekuens protein dan enam residu untuk sekuens DNA. sekuens target dicari berdasarkan k-tuple ini untuk menemukan kesamaan di antara keduanya.[3]
Saat ini, paket FASTA tersedia dari Universitas Virginia[4] dan Institut Bioinformatika Eropa.[5]

Sejarah
Awalnya, program ini dirancang untuk pencarian kesamaan urutan protein. Karena informasi genetik yang berkembang secara eksponensial dan keterbatasan kecepatan serta memori komputer, pada tahun 1980-an, metode heuristik diperkenalkan untuk menyelaraskan urutan kueri dengan seluruh basis data. Program yang dibuat padsa tahun 1987 ini mampu melakukan pencarian DNA dengan DNA, menerjemahkan pencarian protein dengan DNA, dan juga menyediakan program pengacakan yang lebih canggih untuk mengevaluasi signifikansi statistik.[6] TSaat ini, peningkatan kinerja komputer memungkinkan pencarian untuk deteksi penyelarasan lokal dalam basis data menggunakan algoritma Smith–Waterman.
FASTA diucapkan "fast A", dan merupakan singkatan dari "FAST-All", karena dapat digunakan dengan alfabet apa pun, sebuah pengembangan dari alat penyelarasan "FAST-P" (protein) dan "FAST-N" (nukleotida) asli.
Saat ini, format berkas FASTA banyak digunakan oleh alat pencarian basis data sekuens lainnya (seperti BLAST) dan program penyelarasan sekuens (Clustal, T-Coffee, dll.).
Proses[2]
Identifikas dan pemetaan ktups
Dalam tahap ini, ktups diidentifikasi dengan metode hashing, yaitu kontruksi tabel hash posisi residu ktups dari kueri dan urutan pangkalan data kandidat, di mana metode ini dilakukan terhadap seluruh posisi pada pasangan urutan hingga seluruh ktups dipetakan. Dari tabel hash tersebut, perbedaan posisi setiap residu antar pasangan urutan dapat dipetakan dengn menghitung selisih posisi antara urutan kueri dengan urutan pangkalan data, di mana ktups yang memiliki selisih yang sama digabung untuk memperlihatkan daerah dengan residu identik antar pasangan urutan. Umumnya, ada banyak variasi panjang ktups yang terpetakan sebagai garis diagonal dalam matriks perbandingan pasangan urutan.
Penyaringan atau seleksi ktups
Pada tahap ini, seluruh ktups akan dihitung skornya menggunakan matriks substitusi tertentu dan hanya ktups dengan nilai di atas ambang minimal saja yang dipertahankan dalam matriks.
Penggabungan ktups
Pada tahap ini, ktups yang terletak pada satu diagonal akan digabungkan dan dioptimasi dengan metode pemrograman dinamis untuk memberikan jajaran pasangan urutan beserta skor similaritasnya dengan urutan kueri.
Referensi
- ^ Lipman, DJ; Pearson, WR (1985). "Rapid and sensitive protein similarity searches". Science. 227 (4693): 1435–41. Bibcode:1985Sci...227.1435L. doi:10.1126/science.2983426. PMID 2983426.
- ^ a b Aprilyanto, Victor; Sembiring, Langkah (2017). Bioinformatika. Yogyakarta: Innosain. ISBN 9786026542328. Pemeliharaan CS1: Status URL (link)
- ^ Aryal, Sagar; PhD (2023-08-03). "What are FASTA and BLAST? An Introduction". microbenotes.com (dalam bahasa American English). Diakses tanggal 2025-10-27.
- ^ "FASTA Programs". Diarsipkan dari asli tanggal 2000-03-04.
- ^ "FASTA/SSEARCH/GGSEARCH/GLSEARCH < Sequence Similarity Searching < EMBL-EBI".
- ^ Pearson, WR; Lipman, DJ (1988). "Improved tools for biological sequence comparison". Proceedings of the National Academy of Sciences of the United States of America. 85 (8): 2444–8. Bibcode:1988PNAS...85.2444P. doi:10.1073/pnas.85.8.2444. PMC 280013. PMID 3162770.
Content Disclaimer
Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.
- The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
- There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
- It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
- Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
- Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.