Analisis Multiple Alignment pada Penyebaran Covid-19 Varian E. dengan Metode Maximum Likelihood Nelly Alviana Program Studi Matematika. FMIPA. Universitas Islam Darul AoUlum Lamongan email: nelly. 2020@mhs. Abstract. One method that can be used to construct a phylogenetic tree is the maximum likelihood method. This study was conducted to determine how to identify the spread of the covid virus variant E. 5 using the maximum likelihood method. The results of the mutation area network analysis show that the spread of the Covid19 E. 5 epidemic originated from South Jakarta (EPI_ISL_17664. and from the phylogenetic tree analysis with maximum likelihood it is known that there are 16 clades with 6 large clades in the covid-19 variant E. 5 virus spread cluster. Keyword: maximum likelihood method, phylogenetics tree. Covid-19 var E. Abstrak. Salah satu metode yang dapat digunakan untuk mengkonstruksi pohon filogenetik adalah maximum likelihood method. Penelitian ini dilakukan untuk mengetahui bagaimana mengidentifikasi suatu penyebaran virus covid varian E. menggunakan metode maximum likelihood. Hasil analisa jaringan wilayah mutasi menunjukkan bahwa penyebaran epidemi Covid-19 E. 5 berasal dari Jakarta Selatan (EPI_ISL_17664. dan dari analisis pohon filogenetik dengan maximum likelihood diketahui ada 16 klad dengan 6 klad besar pada kluster penyebaran virus covid-19 varian E. Kata kunci : metode maximum likelihood, pohon filogenetik. Covid-19 varian E. 1 Pendahuluan Filogenetik molekuler merupakan cabang ilmu yang sedang sangat berkembang, digunakan pada hampir seluruh cabang ilmu biologi. Filogenetik molekuler merupakan teknik yang mengkombinasikan metode molekuler dan statistik dalam menentukan hubungan kekerabatan secara evolusi antar organisme atau gen menggunakan struktur dan fungsi molekul beserta informasi perubahannya terhadap waktu. Kemajuan teknologi dan algoritma-algoritma statistik yang telah diciptakan membuat proses sequencing genom menjadi lebih cepat, murah, dan Dengan banyaknya data genom yang dipublikasikan, hal ini membuat filogenetik molekuler terus berkembang dan memberikan banyak aplikasi. Tujuan utama analisis filogenetik molekuler adalah menganalisis adanya proses evolusi dan menyajikannya dalam bentuk pohon filogenetik yang secara grafis menunjukkan kekerabatan antar spesies atau gen terhadap waktu . Pohon filogenetik dikenal pula dengan istilah filogeni. Filogeni merupakan diagram berupa pohon yang menunjukkan garis evolusi dari spesies, organisme, atau gen berbeda dari suatu nenek moyang bersama. Filogeni sangat bermanfaat dalam mengetahui diversitas biologis, menyusun klasifikasi, dan menjelaskan fenomena yang terjadi selama proses evolusi . Hubungan kekerabatan antar spesies atau gen dapat dijelaskan dengan filogeni yang merupakan hasil analisis filogenetik molekuler. Oleh karena itu, filogenetik molekuler digunakan sebagai pendekatan untuk membandingkan susunan gen atau genom antar organisme, dalam percobaan ini adalah bakteri yang belum teridentifikasi. Informasi yang tersedia merupakan sequences nukleotida gen hasil sequence DNA dari suatu sampel bakteri. Salah satu metode yang digunakan dalam menentukan pohon filogenetik adalah metode maximum likelihood . Covid- 19 varian E. 5 adalah salah satu contoh kasus yang dapat diidentifikasi dengan pohon filogenetik ini, dimana pola penyebaran virus corona ini diperkirakan menjadi pohon filogenetik yang menghubungkan semua virus covid varian terbaru satu sama lain. Virus ini bermula muncul di China dan beberapa penelitian menemukan adanya varian terbaru yang tersebar di beberapa negara termasuk Indonesia. Salah satu penelitian mengenai analisis filogenetik pada virus covid varian omicron dan delta yang menunjukkan hasil perbedaan genetik yang cukup signifikan . Selain itu, ada penelitian yang menganalisis anaisis mengenai mutasi varian dan rekonstruksi filogenetik menggunakan berbasis jarak dan algoritma neighbour joining yang disimulasikan di Phylip dan untuk multiple alignment menggunakan CLustalW . , . Dan ada penelitian lain yang dilakukan oleh . mengenai analisis virus SARS menggunakan metode maximum likelihood. Pada penelitian tersebut menunjukkan bahwa nilai maximum likelihood adalah 269135,56466 yang dapat digunakan untuk menentukan pohon dengan penyelarasan urutan dengan lebih baik. Sehubungan dengan penelitian yang telah dilakukan diatas, penulis melakukan penelitian yang menjelaskan cara mengidentifikasi penyebaran covid19 varian E. 5 melalui pembentukan pohon filogenetik menggunakan metode maximum likelihood serta analisisnya. Tinjauan Pustaka 1 Sequence DNA Sequence DNA, deoxyribonucleic acid, . elanjutnya hanya akan disebut dengan sequenc. adalah barisan dari empat macam nucleotide, yaitu adenine (A), cytosine (C), guanine (G), dan thymine (T) . Sebagai contoh. TGTTCTCGATAGTACTTGCA adalah sequence yang terdiri dari dua puluh Dari sequence yang sudah ada, dapat terbentuk sequence baru apabila terjadi suatu mutasi pada nucleotide-nucleotide dari sequence tersebut. Secara umum, terdapat empat tipe mutasi yang bisa terjadi yaitu . Mutasi tipe 1, adalah mutasi yang disebabkan suatu nucleotide berubah menjadi nucleotide lainnya, misalnya A pada TGTTCAGTA berubah menjadi G sehingga didapat TGTTCGGTA. Mutasi tipe 2, adalah mutasi yang disebabkan suatu nucleotide bertukar posisi dengan nucleotide didepan atau dibelakangnya, misalnya A bertukar posisi dengan C pada sequence TGTTCAGTA sehingga didapat TGTTACGTA. Mutasi tipe 3, adalah mutasi yang disebabkan adanya suatu nucleotide yang disisipkan pada sequence, misalnya G disisipkan pada TGTTCAGTA sehingga didapat TGTGTCAGTA. Mutasi tipe 4, adalah mutasi yang disebabkan adanya suatu nucleotide pada sequence yang dihapus, misalnya T pada TGTTCAGTA dihapus sehingga didapat TGTCAGTA. Selanjutnya, sembarang sequence dapat disimbolkan dengan si untuk suatu E C N dan nucleotide dari sequence adalah elemen dari N4 = {A. T}. 2 Multiple Sequence Alignment Secara umum, multiple sequence alignment adalah proses penjajaran n sequence, dimana n Ou 3. Perhatikan penjelasan secara matematis mengenai multiple sequence alignment berikut ini. Misalkan terdapat n sequence, yaitu s1, s2. , sn, yang tersusun dari elemenelemen dari N4. Kemudian disisipkan beberapa gap Au-Ay ke dalam s1, s2. , sn sehingga didapatkan n sequence, yaitu s1Ao, s2Ao. , snAo, yang tersusun dari elemenelemen dari N5 = {A. T, -}. Dimana . Sequence s1Ao disebut ekspansi dari s1 apabila s1E diperoleh dengan menyisipkan beberapa gap Au-Ay ke dalam s1. Sequence s1Ao, s2Ao disebut ekspansi dari s1, s2 apabila s1E, s2E berturut-turut adalah ekspansi dari s1, s2. Multiple sequence SE = . 1E, s2E. , snE} disebut ekspansi dari multiple sequence S = . 1, s2, . , sn } apabila setiap SE adalah ekspansi dari si. S disebut sequence asal dari SE apabila multiple sequence SE adalah ekspansi dari S. Kemudian dinotasikan sequence dalam SE dengan A A A ycycnA = ycycn,1 ycycn,2 . ycycn,ycoycn . Dimana Si,j C N . Multiple sequence SAo disebut multiple sequence alignment dari S jika l1= l2 =A = ln = L, jika SE adalah ekspansi dari S , dan jika terdapat salah satu dari s 1E,j, s2E,j. A snE,j, yang bukan merupakan gap Au-Ay untuk 1 O j O L . Multiple Sequence Alignment dilakukan dengan menggunakan program Clustal Omega . 3 Markov Chain Continuos Time Markov Chain Continuos Time merupakan proses skokastik dari variable random {X. , tOu. yang mempunyai sifat Markov. Dengan demikian, probabilitas transisi dari keadaan I ke keadaan j pada waktu tOu0, ycEycnyc yc. = ycE. = y. = IO) . dengan 0 O Pij O. Ocpij. =1. OAyc Matriks probabilitas transisi milik DNA yang memiliki empat nukleid, yaitu A. G, dan T yang dinotasikan oleh: PAA. PAC. PAG. PAT. PCA. PGA. PTA. PCC. PGC. PTC. PCG. PGG. PTG. PCT. PGT. PTT. Subtitusi nukleotid dari state i ke state j merupakan rantai Markov dengan waktu kontinu. Dengan begitu, perubahan nukleotid dari state i ke state j selama t s waktu itu berarti perubahan nukeotid dari state i ke state k selama t waktu, kemudian dilanjutkan state k ke state j selama s waktu. Dengan demikian, berdasarkan persamaan Chapman Kolmogorov dapat dituliskan bahwa, ycEyc . c ycI) = Oc ycEycyco . ycEycoyc . yco=1 Karena subtitusi nukleotid tersebut merupakan rantai Markov dengan waktu kontinu, dapat dikatakan sebagai rantai Markov dengan waktu kontinu regular . 4 Metode Maximum likelihood Pada evolusi, mutasi merupakan perubahan peristiwa. Probabilitas menemukan mutasi sepanjang satu cabang pada pohon filogenetik dapat dihitung dengan menggunakan metode maximum likelihood. Metode tersebut digunakan untuk menentukan topoogi pohon, panjang cabang, dan parameter dari model evolusi yang memaksimumkan probabilitas dari sequence . Dengan kata lain, fungsi likelihood adalah probabilitas bersyarat dari data yang diberikan. Dengan demikian, ya. uayuE ) = ycE . aycaycyca ya yua, yuE ) = P. lign sequence I pohon, model evous. MLE dari yua dan yuE yaitu yua^ adalah yuE, adalah membuat fungsi Likelihood sebisa mungkin menjadi, . ua^, yuE^) = ycaycyci yua,yuE ycoycaycu . ua, yuE ). Metode maximum likelihood untuk dua sequence ya = yucycu1 ycyycu1yc1 . yucycu2 ycEycu2yc2 . yucycuycu ycEycuycuycycu . Probabilitas transisi dari sequence sat uke sequence yang lain merupakan jumlah probabilitas dari semua kemungkinan jalur yang menghubungkan kedua sequence tersebut. Jalur khusus dari transisi satu sequence ke sequence yang lain dapat dinyatakan sebagai penyejajaran . Kemungkinan Pohon Likelihood Dalam rekontruksi filogenetik perlu menemukan pohon yang dapat memaksimalkan kemungkinan global dari semua struktur pohon. Sejumlah pohon topologi biner tidak berakar meningkat dengan sejumlah taksa . , yang dapat dihitung menurut: ycu 2 Oe5! ycycu = ycuOe3ycu = Oa 2ycu Oe 5 . cuOe. ! ycn=1 Saat menghitung pohon maximum likelihood, parameter model dadn panjang cabang harus dihitung untuk setiap pohon, kemudian pohon yang menghasilkan nilai likelihood tertinggi akan dipilih. Nilai MLE yang paling tinggi menandakan bahwa pohon tersebut dapat menjelaskan persejajaran sequence dengan lebih baik . Metode Penelitian 1 Dataset Data yang digunakan pada studi ini adalah 93 data DNA sequence dari virus covid-19 varian E. 5 yang tersaji pada Tabel 1. Data tersebut diambil dari Genbank yaitu database gen terbesar di dunia milik pemerintah Amerika Serikat. Pengambilan dilakukan dengan mengakses Pusat Informasi Bioteknologi Nasional yaitu w. gov dan GISAID w. org berupa fasta. 2 Multiple Alignment Alignment bertujuan untuk menata semua sequence agar satu sama lain diletakkan sesuai dengan posisi homologi antar sequence sehingga dapat File FASTA digunakan sebagai data input. Alignment total . o complete alignmen. dilakukan agar diperoleh file yang kompatibel untuk program Phylip. Untuk data sequence pasien yang terjangkit virus covid-19 varian E. 5 yang diambil di file FASTA akan dilakukan proses alignment di ClustalX 2. 1 dan Clustal Omega yang kemudian dilanjutkan dengan analisis virus menggunakan metode maximum likelihood menggunakan Phylip 3. 698, sehingga diperoleh pohon genetik dan analisis jaringan topologi, daerah mutasi, serta analisis sistem jaringan mode Hasil dan Pembahasan 1 Pembentukan Pohon Filogenetik dengan Metode Maximum likelihood Topologi pohon filogenetik yang dihasilkan bersifat monofiletik yang berarti bahwa kelompok virus covid-19 var E. 5 yang menyebar di Indonesia tersebut memiliki satu leluhur yang mewariskan sifat genetik, morfologi serta biokimia pada semua keturunannya. Hal tersebut membuat anggota monofiletik berkerabat sangat dekat satu dengan yang lain . Pernyataan tersebut sesuai dengan pohon filogenetik yang terbentuk, karena seluruh anggota dalam pohon filogenetik . ecuali out grou. berasal dari satu genus varian yang sama yakni covid-19 E. Gambar 1. Filogenetik Tree using Matlab 2017b Gambar 2. Phylogenetik Tree of Covid-19 Var E. Pohon Filogenetik dengan metode maximum likelihood pada Gambar 2 membentuk 16 kelompok in group yang terdiri dari 6 klad besar yakni klad I, klad II, klad IV, klad V, klad VII, dan klad XVI. Klad I terdiri dari 16 titik ditemukannya virus yakni di Jakarta (EPI_ISL_17664319/T) var E. Jakarta (EPI_ISL_17623747/Q) var E. Jakarta Selatan (EPI_ISL_17681322/W) var 5. Jakarta Selatan (EPI_ISL_17681321/V) var E. Jakarta Selatan (EPI_ISL_17518075/J) var E. Jakarta (EPI_ISL_17389270/E) var E. Jakarta (EPI_ISL_17630625/S) var E. Jakarta Pusat (EPI_ISL_17551421/N) var E. Jakarta (EPI_ISL_17686559/Y) var E. Jakarta Pusat (EPI_ISL_18165701/AT) var E. 5, dan Jakarta Utara (EPI_ISL_17997245/AO) var E. Klad II terdiri dari 16 titik ditemukannya virus yakni virus covid var E. di Jakarta Pusat (EPI_ISL_18165626/AS). Banjarbaru (EPI_ISL_17719629/AD). Jakarta Selatan (EPI_ISL_17797245/AK). Bali (EPI_ISL_17788302/AG). Surabaya (EPI_ISL_17470035/I). Jakarta Selatan (EPI_ISL_17468575/H). Medan (EPI_ISL_17717748/AB), Medan (EPI_ISL_17785375/AF), Bali (EPI_ISL_17788380/AJ). Bali (EPI_ISL_18537584/AZ). Bali (EPI_ISL_17788316/AH). Bali (EPI_ISL_18537583/AY). Bandung (EPI_ISL_18146931/AR), Bali (EPI_ISL_17525998/K). Jakarta (EPI_ISL_17774280/AE). Klad i terdiri dari 5 titik ditemukannya virus yakni virus covid var E. 5 di Jakarta (EPI_ISL_17686571/Z). Bogor (EPI_ISL_17681299/U). Jakarta (EPI_ISL_17389278 /F). Jakarta Barat (EPI_ISL_17372765/D), dan Jakarta (EPI_ISL_17308780/B). Klad i dan klad IV memiliki kesamaan yaitu pada semua titik mempunyai varian virus yang sama. Klad IV terdiri dari 8 titik yang ditemukan di kota Jakarta yakni di Jakarta Utara (EPI_ISL_17681388/X) Jakarta Timur (EPI_ISL_18465481/AV) var E. Jakarta Selatan (EPI_ISL_17719626/AC) Var E. Jakarta Utara (EPI_ISL_17835908/AL) Var E. Jakarta (EPI_ISL_17623756/R) var E. Jakarta Barat (EPI_ISL_18062407/AQ) var 1. Jakarta Selatan (EPI_ISL_18465500/AW) var E. 4, dan Jakarta (EPI_ISL_17308775/A) var E. Untuk klad V terdiri dari 6 titik daerah yaitu var E. 1 di kota Jakarta Selatan (EPI_ISL_17997197/AN). Jakarta (EPI_ISL_17389302/G). Jakarta Pusat (EPI_ISL_18639168/BB), dan Jakarta (EPI_ISL_17686580/AA) serta var HV. 1 di Surabaya (EPI_ISL_18705064/CI) dan Jakarta Utara (EPI_ISL_18673499/BV). Dan untuk Klad VI terdiri dari 4 titik kota yaitu var E. 1 yang ditemukan di kota Jakarta (EPI_ISL_17308785/C) dan Jakarta Barat (EPI_ISL_18062407/AQ) serta var E. 8 yang ditemukan di kota Jakarta Selatan (EPI_ISL_18673484/BU) Jakarta Selatan (EPI_ISL_18673536/BY). Klad VII terdiri dari 7 titik kota yaitu var JG. 3 di kota Jakarta Timur (EPI_ISL_18721886/CN). Surabaya (EPI_ISL_18705058/CG). Denpasar (EPI_ISL_18721815/CL). Denpasar (EPI_ISL_18721814/CK). Surabaya (EPI_ISL_18705068/CJ), dan Jakarta Utara (EPI_ISL_18639191/BI) serta var 3 yang ditemukan di kota Jakarta Utara (EPI_ISL_18639167/BA). Untuk klad VII terdiri dari 3 titik kota yaitu ditemukannya virus covid-19 var E. 1 di kota Surabaya (EPI_ISL_18705043/CD). Jakarta Utara (EPI_ISL_18639188/BH), dan kota Jakarta Utara (EPI_ISL_17835937/AM). Dan untuk Klad IX terdiri dari 2 titik kota yaitu kota Jakarta Selatan (EPI_ISL_18673534/BX) dan Jakarta Selatan (EPI_ISL_18673539/CA) berupa covid-19 var E. Untuk klad X. XI. XII. Xi. XIV, dan XV masing-masing terdiri dari 1 titik kota dan memiliki varian virus covid yang sama yakni var HK3, dimana klad X di kota Jakarta Pusat (EPI_ISL_18639169/BC), klad XI ditemukan di kota Surabaya (EPI_ISL_18705059/CH), klad XII di kota Jakarta Utara (EPI_ISL_18639180/BE), Jakarta Timur (EPI_ISL_18639205/BO), XIV Jakarta Utara (EPI_ISL_18639195/BK), dan klad XV ditemukan di kota Jakarta Selatan (EPI_ISL_18639204/BN). Klad XVI merupakan klad yang memiliki titik kota paling banyak yakni sebesar 20 titik, untuk titik kotanya yaitu var HK. 3 ditemukan di Jakarta Selatan (EPI_ISL_18673483/BT). Surabaya (EPI_ISL_17308785/C), Pekanbaru (EPI_ISL_18673439/BR). Jakarta Selatan (EPI_ISL_18639205/BO). Jakarta Selatan (EPI_ISL_18639198/BL). Jakarta Barat (EPI_ISL_18639191/BI). Jakarta Barat (EPI_ISL_18639194/BJ). Jakarta Barat (EPI_ISL_18465502/AX), dan Jakarta Utara (EPI_ISL_18639194/BL). Selain itu, ditemukan var HK. 1 di Jakarta Barat (EPI_ISL_18673407/BQ) dan var HK. 2 di Jakarta Selatan (EPI_ISL_18673548/CB), var HK3. 2 ditemukan di kota Jakarta Utara (EPI_ISL_18639170/BD). Jakarta Selatan (EPI_ISL_18639208/BP). Surabaya (EPI_ISL_18705048/CE). Jakarta Utara (EPI_ISL_18721860/CM). Jakarta Selatan (EPI_ISL_18639203/BM). Jakarta Selatan (EPI_ISL_18673537/BZ). Jakarta Utara (EPI_ISL_18639186/BG), dan Jakarta Utara (EPI_ISL_18639194/BJ). Serta ditemukan pula var E. 1 di kota Jakarta Selatan (EPI_ISL_18673529/BW). Jakarta Selatan (EPI_ISL_18639184/BF), dan Bandung (EPI_ISL_18693199/CC). Meskipun pada klad XVI terdapat tiga varian virus dan tidak berasal dari daerah yang berdekatan, namun titik tersebut merupakan satu kelompok klad yang sama karena kemiripan pada sequence nya. Selanjutnya muncul frekuensi dasar empiris untuk nucleotide dan didapatkan nilai In likelihood sebesar -44725. 41544 pada metode maximum Berikut dasar frekuensi empiris: Tabel 2. Frekuensi Dasar Empiris Nucleotide Frequencies Gambar 3. Output dari branch legth dan confidence limits Berdasarkan Gambar 3, nilai In likelihood sebesar -44725. 41544 merupakan nilai estimasi optimal . likelihood dilakukan sebesar 44725. Nilai ini menunjukkan besarnya nilai estimasi yang paling maksimum untuk cabang dan dapat digunakan untuk menentukan pohon yang dapat menjelaskan pohon filogenetik lebih baik. Meskipun nilai In likelihoodnya negatif, hal itu berarti probabilitas yang sesuai kurang dari 1 karena yang dilihat adalah nilai Selain itu, pada hasil output tersebut disebutkan antara dua percabangan terdapat panjang cabang . dengan EG51-JKT-EPI_ISL_17308775, panjang cabang 0. berada pada approximasi confidence limits tertentu, artinya jarak tersebut berada dalam interval konfidensi 0. 00007- 0. Nilai posistif pada interval konfidensi berarti pada percabangan tersebut tidak perlu di arrangement, karena nilai interval yang sempit menunjukkan panjang cabang lebih akurat yang diperkuat dengan nilai p<0,01. Meski demikian, pada beberapa percabangan pohon terdapat apromasisasi kondensi limitnya yang mempunyai signifikansi positif dengan P<0,05. Analisis metode maximum likelihood merekontruksikan kekerabatan antar spesies berdasarkan panjang garis cabang. Panjang yang berbeda menunjukkan tingkat evolusi masing-masing varian. Garis yang semakin panjang menunjukkan evolusi jarak semakin jauh, sedangkan garis yang lebih pendek menunjukkan dekatnya jarak evolusi varian . Berdasarkan Gambar 2, garis terpanjang dimiliki oleh EPI_ISL_18639194 di kota Jakarta Utara anggota klad 16, hal tersebut menunjukkan bahwa penyebaran virus covid di Jakarta Utara (EPI_ISL_18639. var HK3 merupakan spesies yang memiliki umur molekuler terlebih dahulu daripada covi-19 E. 5 varian lainnya. Dan untuk cabang lainnya yang lebih pendek menunjukkan bahwa varian lain memiliki evolusi pendek dengan sifat lebih maju, sehingga dianggap sebagai keturunan dari nenek moyangnya. 2 Analisis Penyejajaran Ganda Dari analisis penyejajaran ganda pada 93 sequence DNA pasien terinfeksi virus covid-19 varian E. 5 yang telah dilakukan, diperoleh analisis sistem jaringan topologi, sistem jaringan daerah mutasi, dan sistem jaringan mode mutasi yang dijelaskan sebagai berikut: Analisis Sistem Jaringan Topologi Sistem jaringan topologi yang dihasilkan oeh output penyejajaran ganda, yaitu G(W) = {M,V,W} dimana W adalah fungsi penalty dari output penyejajaran Dan matriks penalty diperoleh dari penyejajaran antar 2 sequence dengan menerapkan algoritma Needleman Wunch yang disimulasikan dalam Matlab sebagai berikut: Tabel 3. Needleman Wunch Dalam analisis sistem jaringan topologi juga diperoleh daerah stabil yang menunjukkan posisi nukleotid yang sama pada penyejajaran ganda dan daerah tidak stabil yang menunjukkan posisi nukleotid yang berbeda. Berikut adalah tabel daerah stabil dan tidak stabil pada penyejajaran ganda epidemi covid-19 E. Tabel 4. Daerah Stabil dan Tidak Stabil pada Penyejajaran Ganda Sequence Covid-19 E. Daerah Stabil Posisi nucleotida ke323-332, 335-344, 354-356, 369-373, 375-377, 381-393, 740-745, 747, 749-776, 779-814, 816-820, 831, 832, 947959, 961-1005, 1007-1011, 1013-1017, 1019-1075, 1077, 1181-1297, 1299-1303, 1336-1417, 1419-1439, 1546-1559, 1561-1572, 1574-1600, 1602-1676, 1678-1716, 1718-1798, 1812-1844, 1912-1944, 1946-1948, 1960-2009, 2015, 20202037, 2361-2339, 2600-2620, 2622-2686, 2773-2827, 28292841, 2843-2845, 2847-2861, 2863-2873, 2875-2900, 30223044, 3047-3053, 3055, 3059-385, 3165-3174, 3176-3230, 3232-3283, 3582-3610, 3612-3690, 3692-3693, 3695-3791, 4156-4168, 4173-4402, 4404-4501, 4585-4626, 4628-4651, 4653-4660, 4662-4670, 4672-4690, 4692-4753, 4755-4783, 4785-4801, 4803-4824, 4826-4854, 4856-4862, 4864-4902, 4986-5056, 5058-5108, 5179-5234, 5397-5443, 5445-5461, 5463-5621, 5623-5689, 5820-5918, 5920-5950, 5961-6100, 6105, 6107, 6162-6332, 6334-6374, 6376-6399, 6403-6438, 6440-6498, 6503-6568, 6570-6586, 6703-6778, 6780-6799, 6884-6888, 7656-7661, 7663-7672, 7740-7790, 7792-7813, 7861-7867, 8217-8232, 8234-8259, 8261-8268, 8270-8354, 8359-8411, 8413-8444, 8465-8493, 8495-8520, 8522-8550. Jumlah Prosentase 44,45% Daerah 8552-8556, 8558-8568, 8570-8577, 8579, 8601-8630, 86328682, 8684-8688, 8690, 8706, 8708-8762, 8764-8815, 88178847, 8849-8851, 8871-8872, 8874-8889, 8900-8941, 95649569, 9581-9576,9579- 9580, 9582-9601, 9603-9611, 96149621, 9624, 9626-9634, 9636-9657, 9659-9722, 9724-9740, 9742-9784, 9786-9799, 9801-9832, 9834-9836. 1-332, 333-334, 345-353, 357-368, 374, 378-380, 394-739, 746, 748, 777-778, 815, 821-830, 834-946, 960, 1006, 1012, 1018, 1076, 1078-1180, 1298, 1304-1335, 1418, 1440, 14611545, 1560, 1573, 1501, 1677, 1717, 1799-1811, 1845-1911, 1945, 1949-1959, 2010-2014, 2016-2019, 2018-2260, 23402599, 2621, 2687-2772, 2828, 2842, 2846, 2862, 2874, 29013023, 3045-3046, 3054, 3056-3058, 3086-3165, 3175, 3231, 3284-3581, 3611, 3691,3694, 3792-4155, 4169-4172, 4403, 4502-4584, 4627, 4652, 4661, 4671, 4691, 4754, 4784, 4802, 4825, 4855, 4863, 4903-4985, 5057, 5109-5178, 5235-5396, 5444, 5462, 5622, 5690, 5819, 5919, 5951-5960, 6101-6104, 6106, 6018-6160, 6161, 6333, 6375, 6400-6402, 6439 64996502, 6569, 6587-6702, 6779, 6800-6883, 6889-7655, 7662, 7673-7739, 7814-7860, 7868-8216, 8233, 8260, 8269, 83558358, 8412, 8445-8464, 8494, 8521, 8551, 8557, 8569, 8578, 8600, 8631, 8683, 8689, 8707, 8763, 8816, 8848, 8852-8870, 8873, 8899, 8942-9563, 9570, 9577, 9578, 9581, 9602, 9612, 9613, 9622, 9623, 9625 9635, 9658, 9723, 9741, 9785, 9800, 9833, 9837-9649. Panjang sequence 55,55% . Analisis Sistem Jaringan Daerah Mutasi Pada analisis sistem jaringan daerah mutasi dilakukan untuk membangun graf dan pohon filogenetik menggambarkan hubungan evolusi yang menunjukkan mutasi dari virus covid-19 yang tersebar di Indonesia. Berdasarkan Gambar 2 diperoleh hasil percabangan yang paling dekat yaitu OTU Jakarta (EPI_ISL_17664. dan Jakarta (EPI_ISL_17623. dengan jarak genetik masing-masing leaf yaitu bernilai 0. Karena Jakarta (EPI_ISL_17664. disinyalir sebagai host dari virus covid-19 varian E. 5, maka sequence yang paling dekat dengan host dianggap sebagai tempat penyebaran virus untuk pertama kali. Analisis Sistem Jaringan Mode Mutasi Sebelum melakukan analisis jaringan mode mutasi dari matriks penalti divisualisasi graf tidak berarah yang menunjukkan hubungan mutasi antar Notasi pada simpul menunjukkan nama sequence yang dikodekan sebagai huruf A. CO dengan masing-masing kode mewakili nama sequence sebagaimana tercantum pada pembahasan sebelumya. Dekomposisi penyebaran virus Dekomposisi penyebaran virus . Gambar 4. Dekomposisi Jaringan Mutasi Penyebaran Virus Covid-19 Varian E. Pada Gambar 4, label pada sisi menunjukkan banyaknya mutasi yang terjadi. Semakin tebal garis yang merepresentasikannya, maka semakin banyak mutasi yang terjadi antar simpul tersebut. Sebagaimana diketahui dari pembahasan sebelumnya, terdapat mutasi pada daerah tidak stabil yang berbeda terhadap 93 sequence DNA covid-19 varian E. 5 ini. Terlihat dari gambar terjadi beberapa mutasi terdapat 16 pembagian dalam penyebaran virus covid-19 varian E. 5 dan ada 374 aktor dan 470 hubungan di dalamnya. Pada dekomposisi penyebaran virus . menunjukkan penyebaran mutasi covid-19 di 7 titik kota di Indonesia dengan dua jenis varian baru yakni var JG. 3 yang mendominasi dan varian E. Kesimpulan Kontruksi filogenetik menggunakan maksimum likelihood ini dapat diterapkan pada kasus penyebaran covid-19 varian E. Metode berbasis probabilitas ini memungkinkan untuk akuisisi banyak topologi pohon dan karenanya memerlukan metode pencarian heuristik untuk mempersingkat waktu dalam memperoleh pohon filogenetik dengan nilai kemungkinan tertinggi. Hasil penelitian ini menunjukkan bahwa nilai maksimum likelihood sebesar -44725. 41544 dan terbagi menjadi 16 klad dengan 6 klad besar dalam cluster penyebaran virus covid-19 var E. Nilai ini digunakan untuk menentukan pohon mana yang dapat menjelaskan penyelarasan sequence dengan baik. Gambar 2 menunjukkan penyebaran awal epidemi covid-19 var E. 5 dimulai dari Jakarta, karena jarak genetik antara Jakarta (EPI_ISL_17664. dengan Jakarta (EPI_ISL_17623. yaitu bernilai 0,0000 Dan untuk analisis multiple alignment menunjukkan terdapat daerah tidak stabil 360, dimana terjadi mutasi dengan nomor nukleotida yang berbeda. Hasil analisa jaringan wilayah mutasi menunjukkan bahwa penyebaran epidermi Covid19 E. 5 berasal dari Jakarta Selatan dan mulai menyebar ke daerah sekitar Jakarta dan berlanjut ke Bali. Surabaya. Bandung, dan Pekanbaru. Daftar Pustaka