Jurnal Teknologi Informasi.
Komputer dan Aplikasinya (JTIKA) Vol.
No.
Maret 2026, (Terakreditasi Sinta-4.
SK No:164/E/KPT/2.
ISSN:2657-0327 PENGGUNAAN ALGORITMA TEXTRANK UNTUK PERINGKASAN OTOMATIS BERITA BAHASA INDONESIA (Using The Textrank Algorithm For Automatic Summarization Of Indonesian Language New.
I Putu Mahesa Kama Artha*.
Ni Wayan Jeri Kusuma Dewi.
Ni Luh Wiwik Sri Rahayu Ginantra.
,2,.
Informatic.
Institut Bisnis dan Teknologi Indonesia Jl.
Tukad Pakerisan no 97a.
Denpasar.
Bali.
INDONESIA Email: putu.
mahesa@instiki.
id, .
erikusumadewi, wiwi.
@ instiki.
Abstract Situs berita sering menyajikan paragraf atau kalimat yang panjang, disertai dengan berbagai detail tambahan yang tidak selalu relevan dengan kebutuhan informasi pembaca.
Oleh karena itu, diperlukan metode seperti Textrank untuk melakukan peringkasan otomatis.
Penelitian ini membahas penerapan algoritma Textrank dalam peringkasan otomatis berita berbahasa Indonesia.
Hasil evaluasi menunjukkan nilai ROUGE-1 dengan Precision 0.
Recall 0.
6930, dan F1Score 0.
ROUGE-2 dengan Precision 0.
Recall 0.
6212, dan F1-Score 0.
6480, serta ROUGE-L dengan Precision 7210.
Recall 0.
6465, dan F1-Score 0.
Hasil rata-rata matriks evaluasi ROUGE akhir sebesar 0.
mengindikasikan bahwa sistem memiliki performa yang baik dalam menghasilkan ringkasan.
Keywords: Peringkasan Berita.
Textrank.
Otomatis.
Bahasa Indonesia
*Corresponding Author
PENDAHULUAN
Kemajuan teknologi yang cepat mendorong meningkatnya kebutuhan akan informasi yang cepat dan akurat, kebutuhan akan informasi menjadi bagian penting yang tidak terpisahkan dari kehidupan seharihari.
Berbagai media, baik cetak maupun online, kini menyediakan akses informasi dengan mudah, seperti melalui artikel, blog, dan situs berita yang mencakup berbagai tema, termasuk olahraga, kesehatan, pendidikan, teknologi, dan politik.
Namun, sebagian besar masyarakat kini lebih memilih platform media online karena menawarkan kemudahan akses, memungkinkan informasi diperoleh dengan cepat, kapan saja dan di mana saja.
Selain itu, media online menyajikan informasi yang lebih beragam dan selalu diperbarui dibandingkan media cetak.
Meski demikian, panjangnya teks dalam artikel berita online, yang sering kali berisi banyak detail tambahan yang tidak selalu relevan dengan kebutuhan pembacanya.
Hal ini menyebabkan proses membaca dan memahami isi artikel menjadi kurang efisien, terutama bagi pembaca yang membutuhkan poin-poin utama secara cepat dan Sehingga, peringkasan teks otomatis .
utomatic text summarizatio.
digunakan untuk membantu pengguna memahami inti suatu berita http://jtika.
id/index.
php/JTIKA/ tanpa harus membaca keseluruhan teks secara manual .
Menurut .
masyarakat di Indonesia cenderung lebih memilih membaca berita melalui media online yaitu dengan nilai pembaca sebanyak 84%, sedangkan untuk media sosial dengan angka 65%, menonton televisi sebanyak 54% dan media cetak 15%.
Data tersebut menunjukkan jumlah pembaca berita online terus meningkat secara signifikan.
Namun hal tersebut tidak sel alu diimbangi dengan kualitas berita yang Banyaknya informasi yang tersedia sering kali mempersulit pembaca untuk menemukan berita dengan kualitas yang baik .
Text Summarization .
eringkasan tek.
adalah sebuah teknik yang digunakan untuk membuat ringkasan teks asli, dengan mengutip bagian penting dari satu atau lebih teks untuk menghasilkan teks yang lebih singkat.
Dalam penelitian ini, peringkasan teks akan menggunakan algoritma Textrank, dimana algoritma ini menghasilkan ekstraksi kata sampai kalimat dengan menentukan bobot setiap kalimatnya.
Dengan mengidentifikasi kalimat-kalimat yang paling penting untuk disusun menjadi ringkasan yang tetap mempertahankan isi dari teks aslinya .
Selain itu.
Jurnal Teknologi Informasi.
Komputer dan Aplikasinya (JTIKA) Vol.
No.
Maret 2026, (Terakreditasi Sinta-4.
SK No:164/E/KPT/2.
penelitian ini juga memanfaatkan similarity matriks untuk mengukur tingkat kemiripan antar kalimat berdasarkan hubungan kesamaan katanya.
Situs Katadata.
id digunakan sebagai sumber data dalam penelitian ini, dan politik merupakan topik artikel berita yang ditetapkan untuk pencarian dataset.
Kedua hal ini bertujuan untuk memfokuskan hasil ringkasan yang terstruktur dengan informasi yang jelas dan tepat sehingga dapat menyajikan inti dari berita politik dengan mempertimbangkan hubungan kemiripan antar kalimatnya .
Penelitian sebelumnya telah menunjukkan efektivitas algoritma Textrank dalam peringkasan teks otomatis untuk artikel berbahasa Indonesia dengan persentase ringkasan sebesar 6,9% lebih ringkas daripada artikel aslinya, ini menandakan Textrank memiliki efisiensi yang baik dalam mengurangi jumlah informasi tanpa mengurangi esensi utamanya .
Selain itu, penelitian lain mencatat akurasi evaluasi rouge sebesar 81%, yang menunjukkan kemampuan algoritma Textrank untuk menghasilkan ringkasan yang sangat baik, sehingga ini memperkuat algoritma Textrank dalam mendukung peringkasan teks secara otomatis, khususnya pada artikel berita berbahasa Indonesia .
Penelitian ini memberikan kontribusi yang lebih spesifik dibandingkan penelitian sebelumnya dalam beberapa aspek.
Pertama, dataset yang digunakan berfokus pada berita politik dari Katadata.
id yang memiliki karakteristik narasi analitis dan kompleks, berbeda dengan dataset umum yang banyak digunakan pada penelitian sebelumnya seperti berita teknologi atau berita umum.
Kedua, penelitian ini mengkaji penggunaan representasi non-word embeddings berbasis word frequencies yang dikombinasikan dengan similarity matriks sederhana.
Pendekatan ini memiliki keunggulan dari sisi efisiensi komputasi dan tidak memerlukan proses pelatihan model embedding, sehingga lebih ringan dan sesuai untuk implementasi praktis dibandingkan pendekatan berbasis embedding seperti Word2Vec atau BERT.
Ketiga, penelitian ini tidak hanya melakukan evaluasi terhadap hasil ekstraktif menggunakan Textrank, tetapi juga mengevaluasi penyempurnaan hasil ringkasan menggunakan model bahasa (Deepseek API) sebagai eksperimen tambahan.
Dengan demikian, penelitian ini memberikan perbandingan yang jelas antara metode ekstraktif murni dan pendekatan Keempat, penelitian ini menambahkan baseline sederhana berupa metode Lead-3 untuk memberikan pembanding performa yang lebih objektif terhadap hasil Textrank.
http://jtika.
id/index.
php/JTIKA/ ISSN:2657-0327 TINJAUAN PUSTAKA DAN TEORI PENUNJANG 1 Tinjauan Pustaka Penelitian yang dilakukan oleh Ilham berjudul Peringkasan Teks Otomatis dengan Algoritma Textrank untuk Berita Online.
Pada penelitian ini data artikel berita diambil dari situs kompas.
com dengan menerapkan tema teknologi.
Data teks berita online akan direpresentasikan dalam bentuk vektor Word2Vec.
Algoritma Textrank diterapkan untuk merangkum berita online, dan hasil evaluasi menggunakan ROUGE menunjukkan tingkat yang cukup baik, yaitu sebesar 81%, mendekati kategori sangat baik.
Penelitian yang dilakukan oleh Yovi berjudul Pengujian Algoritma Textrank dalam Merangkum Teks.
Penelitian ini menguji algoritma Textrank untuk peringkasan teks otomatis menggunakan pendekatan berbasis graf.
Algoritma ini mampu mengidentifikasi kalimat-kalimat penting dalam dokumen dengan mempertimbangkan hubungan dan bobot antar kata.
Dalam pengujian menggunakan teks berita, algoritma ini berhasil merangkum teks dari 111 kata menjadi 74 kata tanpa kehilangan informasi penting.
Dari penelitian yang dilakukan oleh Ferdian berjudul Peringkasan Teks Otomatis Dokumen Berita Menggunakan Metode K-Means Clustering.
Dalam penelitian ini, ringkasan diperoleh dengan memilih satu kalimat dari setiap klaster, yaitu kalimat yang memiliki jarak terdekat antara sentence embeddingsnya dengan centroid klaster tersebut.
Evaluasi hasil ringkasan dilakukan dengan membandingkan hasil ringkasan otomatis terhadap ringkasan manual buatan manusia menggunakan ROUGE, dengan F1-score sebagai metrik utama.
Metode ini menunjukkan kinerja yang cukup baik, tapi pada tingkat kompresinya rendah, dengan rata-rata F1-score sebesar 51,96% untuk tingkat kompresi 30%.
Sehingga hasil yang yang dicapai masih tergolong rendah.
Penelitian berjudul Peringkasan Artikel Online Berbasis Algoritma Textrank dan Similarity .
menunjukkan hasil peringkasan teks menggunakan algoritma Textrank dengan tingkat kompresi 50% yang didasarkan pada pemilihan ringkasan berdasarkan posisi ranking skor Textrank, di mana ringkasan yang diambil dari top-n ranking menghasilkan nilai f-score yang tinggi.
Berdasarkan evaluasi menggunakan confusion matrix, diperoleh nilai f-score sebesar 0,705, sedangkan pengukuran menggunakan ROUGE-1 menghasilkan nilai f-score sebesar 0,805.
Sehingga dengan hasil ini dapat dikatakan bahwa metode Textrank dengan pendekatan similarity menghasilkan ringkasan yang cukup baik.
Jurnal Teknologi Informasi.
Komputer dan Aplikasinya (JTIKA) Vol.
No.
Maret 2026, (Terakreditasi Sinta-4.
SK No:164/E/KPT/2.
Penelitian lain tentang Teks Ringkas Otomatis pada Portal Berita CNN Indonesia Menggunakan Algoritma Textrank .
Pada penelitian ini menunjukkan dimana hasil akhir yang diperoleh dari proses peringkasan teks otomatis menggunakan algoritma Textrank yaitu dengan penjumlahan score tiap kalimat sehingga diperoleh nilai terbesar yang dipilih sebagai kalimat Pengujian dalam penelitian ini mendapatkan hasil rata-rata presentase ringkasan sebesar 6,9% lebih ringkas dibandingkan artikel aslinya.
Hasil peringkasan teks menunjukkan bahwa algoritma Textrank efektif dalam meringkas teks berita berbahasa Indonesia.
Berdasarkan telaah terhadap penelitian terdahulu, algoritma Textrank telah menunjukkan kinerja yang baik dalam peringkasan teks berbahasa Indonesia dengan nilai evaluasi ROUGE yang relatif tinggi.
Berbagai pendekatan telah digunakan, seperti Word2Vec.
BM25, clustering, dan semantic network untuk meningkatkan kualitas ringkasan.
Namun demikian, masih terdapat beberapa celah Pertama, belum banyak penelitian yang secara khusus memfokuskan penerapan Textrank pada berita politik dari Katadata.
id yang memiliki karakteristik narasi dan kompleksitas informasi yang Kedua, evaluasi pendekatan berbasis word frequencies yang dikombinasikan dengan similarity matriks sederhana dalam konteks berita politik masih terbatas dibandingkan metode berbasis embedding.
Ketiga, sebagian besar penelitian hanya mengevaluasi hasil ekstraktif tanpa menganalisis aspek koherensi dan keterbacaan ringkasan.
Keempat, penggunaan data referensi .
old standar.
yang terbatas pada memengaruhi generalisasi hasil.
Berdasarkan celah tersebut, penelitian ini Textrank Katadata.
id menggunakan representasi word frequencies dan similarity matriks, serta melakukan evaluasi menggunakan metrik ROUGE.
Selain itu, penelitian ini mengintegrasikan penyempurnaan ringkasan melalui API Deepseek untuk meningkatkan koherensi kalimat, sehingga menawarkan pendekatan hibrida antara metode ekstraktif dan penyempurnaan berbasis model bahasa modern.
Selain pendekatan berbasis word embeddings, terdapat juga pendekatan non-word embeddings dalam peringkasan teks seperti penggunaan word frequencies.
TF-IDF, dan similarity matriks berbasis Jaccard atau cosine similarity.
Pendekatan ini tidak memerlukan proses pelatihan model representasi kata sehingga lebih ringan secara komputasi.
Beberapa penelitian menunjukkan bahwa metode non-word http://jtika.
id/index.
php/JTIKA/ ISSN:2657-0327 embeddings tetap mampu menghasilkan performa yang kompetitif, khususnya pada domain teks yang tidak terlalu kompleks atau memiliki struktur kalimat yang jelas seperti berita.
Selain itu, metode ini lebih mudah diimplementasikan dan tidak bergantung pada corpus besar untuk pelatihan.
Namun embeddings umumnya unggul dalam menangkap makna semantik yang lebih dalam.
Oleh karena itu, penelitian ini memilih pendekatan non-word embeddings sebagai baseline ringan yang kemudian dapat dikombinasikan dengan model bahasa untuk meningkatkan kualitas ringkasan.
2 Teori Penunjang 2 Peringkasan Text Otomatis Peringkasan teks merupakan salah satu metode dalam pemrosesan bahasa alami (NLP) yang bertujuan untuk menyederhanakan teks panjang dengan menyoroti poin-poin utama sehingga menghasilkan ringkasan yang ringkas dan jelas.
Sejak dikenalkan pada tahun 1950-an, metode peringkasan teks terus berkembang, dengan kontribusi dari berbagai bidang, termasuk ilmu perpustakaan, analisis linguistik, dan penerapan metode statistik.
Dalam konteks penelitian ini, peringkasan teks menjadi topik penting untuk dioptimalkan agar dapat menghasilkan ringkasan yang tidak hanya ringkas tetapi juga mampu mempertahankan makna serta relevansi informasi yang terdapat pada teks asli .
2 Textrank Textrank adalah sebuah algoritma yang digunakan untuk mengidentifikasi kalimat-kalimat mempertimbangkan hubungan antar kata dalam teks melalui representasi graf.
Algoritma ini dikenal sebagai metode ringkasan teks ekstraktif yang memanfaatkan model peringkat berbasis graf.
Selain itu, metode ini juga mampu menghasilkan ringkasan yang lebih baik karena tidak bergantung pada bahasa tertentu dan cukup fleksibel untuk diterapkan pada berita berbahasa Indonesia .
Dimana WS adalah weight sentence .
kor kalima.
d adalah dumping factor yang diisi dengan Vi adalah vertex yang akan dihitung skornya.
adalah vertex yang bertetanggaan dengan Vi.
adalah vertex yang bertetanggaan dengan Vj.
Wji adalah nilai jaccard similarity kalimat yang akan Jurnal Teknologi Informasi.
Komputer dan Aplikasinya (JTIKA) Vol.
No.
Maret 2026, (Terakreditasi Sinta-4.
SK No:164/E/KPT/2.
Wjk adalah kalimat yang terhubung dengan Wj.
Sj.
ernilai = .
3 Similarity Matriks Similarity Matriks merupakan konsep yang digunakan untuk menghitung kesamaan antara kalimat-kalimat yang ada dalam dokumen dengan melihat berapa banyak kata yang sama diantara ISSN:2657-0327 METODE PENELITIAN Dalam penelitian ini, dilakukan beberapa tahapan untuk mendapatkan hasil dan kesimpulan yang diperoleh dari penelitian yang dilakukan.
Berikut alur penelitian yang dilakukan yang disajikan pada Gambar Perhitungan similarity matriks melibatkan WkW_kWk, yaitu jumlah kata yang sama antara dua kalimat SiS_iSi dan SjS_jSj.
Panjang kalimat SiS_iSi dan SjS_jSj dihitung berdasarkan jumlah kata atau token.
Nilai kesamaan dihitung dengan mempertimbangkan WkW_kWk dan panjang kedua kalimat untuk merepresentasikan hubungan antar kalimat .
4 ROUGE
ROUGE (Recall-Oriented Understudy for Gisting Evaluatio.
adalah sekumpulan metrik yang dirancang untuk menilai hasil peringkasan teks otomatis maupun terjemahan yang dihasilkan oleh komputer.
Metrik ini berperan penting dalam pengembangan bidang pemrosesan bahasa alami (NLP).
ROUGE digunakan untuk mengevaluasi kualitas ringkasan teks yang dibuat oleh sistem dengan membandingkannya dengan ringkasan ideal yang dihasilkan oleh manusia.
Proses evaluasi dilakukan dengan menghitung kesamaan unit- unit tertentu dan membandingkannya berdasarkan beberapa aspek, seperti n-gram, urutan kata, serta kesesuaian unit antar ringkasan .
Gambar 1.
Alur Penelitian 1 Pengumpulan Data Pengumpulan data merupakan suatu proses yang dilakukan untuk mengumpulkan dokumen atau teks yang digunakan sebagai bahan masukan dalam Dalam penelitian ini, sebanyak 1000 data .
diambil dari situs katadata.
id dengan fokus pada pengumpulan artikel yang mencakup topik politik.
Topik politik dipilih karena pada tahun 2023-2024, sebanyak 40,56% menunjukkan masyarakat di Indonesia mengakses berita politik .
Proses pengumpulan dilakukan dengan memilih artikel-artikel yang diterbitkan dalam rentang waktu tertentu untuk memastikan data sesuai dengan konteks penelitian seperti pada Gambar 2.
ROUGE-1: Mengukur unit teks berdasarkan 1-gram .
ata per kat.
Sedangkan ROUGE-2: Mengukur diagram yang mencakup pasangan kata dalam teks sistem.
Dan ROUGE-L: Mengukur keefektifan ringkasan otomatis yang dihasilkan oleh sistem .
http://jtika.
id/index.
php/JTIKA/ Gambar 2.
Web Scrapping Data 2 Text Processing 1 Cleaning Tahapan cleaning pada penelitian ini dilakukan untuk menghapus kata, katakter dan simbol yang tidak diperlukan dalam penelitian.
Elemen-elemen seperti, hastag (#), tanda baca, angka, serta simbol lain yang tidak relevan akan dihilangkan.
Proses ini bertujuan untuk membuat data bersih dan mudah diolah untuk menghasilkan analisis yang akurat.
Jurnal Teknologi Informasi.
Komputer dan Aplikasinya (JTIKA) Vol.
No.
Maret 2026, (Terakreditasi Sinta-4.
SK No:164/E/KPT/2.
TABEL I.
CLEANING DATA
Sebelum Cleansing Sejumlah pakar politik Partai Demokrasi Indonesia Perjuangan (PDIP) yang meraih pemilihan kepala daerah (Pilkad.
14 provinsi tak berpengaruh terhadap peta politik nasional.
Direktur Trias Politika Strategis.
Agung Baskoro mengatakan pemilihan gubernur .
tidak tawar dan posisi politik partai secara nasional.
Sesudah Cleansing sejumlah pakar politik indonesia perjuangan pemilihan kepala daerah pilkada provinsi tak berpengaruh terhadap peta politik nasional direktur trias politika strategis agung baskoro mengatakan pemilihan gubernur pilgub tidak tawar dan posisi politik partai secara nasional 3 Case Folding Tahapan ini merupakan bagian dari pemrosesan teks yang akan digunakan untuk mengubah karakter data berita menjadi huruf kecil secara konsisten.
Proses ini bertujuan untuk memastikan data memiliki format yang seragam sehingga algoritma dapat menganalisis dan menghasilkan informasi penting secara lebih tepat.
TABEL II.
CASE FOLDING
Sebelum Case Folding Nilai ditutup menguat meski masih bertengger sekitar Rp 15.
900 per dolar AS.
Berdasarkan Bloomberg sore ini, rupiah ditutup menguat delapan poin pada level Rp 15.
937 per dolar AS.
Melihat pergerakan saat ini, sejumlah analis memperkirakan rupiah masih akan menghadapi banyak dan tantangan.
Sesudah Case Folding nilai tukar rupiah ditutup menguat meski masih bertengger sekitar rp 900 per dolar as.
bloomberg sore ini, rupiah ditutup menguat delapan poin pada level 937 per dolar melihat pergerakan saat ini, sejumlah analis memperkirakan rupiah masih akan menghadapi banyak dan tantangan.
ISSN:2657-0327
2 Tokenize Tokenize pada penelitian ini merupakan proses yang dilakukan untuk memisahkan kata-kata sehingga tiap kata terpisah satu sama lainnya.
Tokenize dapat membantu memisahkan teks menjadi bagian-bagian kecil yang disebut token, seperti kata, frase, untuk memudahkan menganalisis hubungan antar kata dari setiap teks.
TABEL i.
TOKENIZE
Sebelum Tokenize Presiden Prabowo Subianto mewaspadai geopolitik yang kian Prabowo darurat militer yang sempat diberlakukan di Negeri Ginseng pada Selasa .
Sesudah Tokenize ['presiden', 'prabowo', 'subianto', 'mewaspadai', 'eskalasi', 'ketegangan', 'geopolitik', 'yang', 'kian', 'meningkat', '.
'prabowo', 'juga', 'menyinggung', 'darurat', 'militer', 'yang', 'sempat', 'diberlakukan', 'di', 'negeri', 'ginseng', 'pada', 'selasa', '312.
3 Stopword Removal Stopwords Removal adalah kata-kata umum, yang sering muncul, dan tidak memiliki makna penting.
Kata-kata ini termasuk kata penghubung, kata ganti, kata bantu, atau kata-kata yang tidak yang tidak memberikan kontribusi signifikan pada pemahaman konteks teks.
TABEL IV.
STOPWORD REMOVAL
Sebelum Stop Removal Presiden Prabowo Subianto mewaspadai geopolitik yang kian Prabowo darurat militer yang sempat diberlakukan di Negeri Ginseng pada Selasa .
Sesudah Stop Removal ['presiden', 'prabowo', 'subianto', 'mewaspadai', 'eskalasi', 'ketegangan', 'geopolitik', 'kian', 'meningkat', 'prabowo', 'menyinggung', 'darurat', 'militer', 'diberlakukan', 'negeri', 'ginseng', 'selasa' HASIL DAN PEMBAHASAN Tahap ini akan membahas terkait hasil evaluasi ROUGE dalam implementasi sistem peringkasan teks berbahasa Indonesia.
http://jtika.
id/index.
php/JTIKA/ Jurnal Teknologi Informasi.
Komputer dan Aplikasinya (JTIKA) Vol.
No.
Maret 2026, (Terakreditasi Sinta-4.
SK No:164/E/KPT/2.
1 Representasi Kata Proses representasi kata pada penelitian ini menggunakan word frequencies.
Word Frequencies digunakan untuk menentukan bobot kemunculan dari setiap kata dalam teks.
Bobot ini nantinya akan digunakan untuk menghubungkan kalimat satu dengan yang lainnya.
Tabel V.
menampilkan hasil dari Word Frequencies TABEL V.
HASIL DARI WORD FREQUENCIES
Sebelum Presiden Prabowo Subianto mewaspadai geopolitik yang kian Prabowo darurat militer yang sempat diberlakukan di Negeri Ginseng pada Selasa .
Sesudah {'presiden':
'prabowo':
'subianto':
'mewaspadai':
'eskalasi':
'ketegangan':
'geopolitik': 3, 'kian': 1, 'meningkat':
'menyinggung':
'darurat': 4, 'militer': 3, 'diberlakukan':
'negeri': 2, 'ginseng': 1, 'selasa': 2.
ISSN:2657-0327 bersifat simetris, yang artinya nilai pada baris S1 kolom S2 akan sama dengan nilai pada baris S2 kolom S1.
Hal ini terjadi karena kemiripan antara dua kalimat bersifat dua arah dan tidak berubah meskipun posisinya 3 Textrank 1 Graph Setelah melakukan perhitungan nilai kemiripan antar kalimat, tahap selanjutnya adalah membentuk sebuah graph .
yang merepresentasikan hubungan kemiripan tersebut sebagai bagian dari proses Textrank.
Gambar 3.
Graph Textrank 2 Similarity Matriks Similarity Matriks adalah sebuah matriks dua dimensi yang menunjukkan tingkat kemiripan antar kalimat dalam berita.
TABEL VI.
HASIL PERHITUNGAN SIMILARITY MATRIKS
S10 S11 S12 S13 S14 S15 S16 S17 S18 S19 S20
S1 1 0,066 0,062 0 0,016 0,023 0,034 0
0 0,044 0,117 0,031 0 0,021 0,021 0 0,081 0,054 0,084 0
S2 0,066 1 0,093 0,066 0,072 0,092 0,067 0
0,04 0,051 0,072 0,081 0,08 0,069 0 0,074 0,049 0,32 0,116
S3 0,062 0,093 1
0,08 0,388 0,105 0
0 0,025 0,091 0 0,059 0,012 0,038 0,047 0,019 0,024 0,096 0,098
S4 0 0,066 0
0 0,121 0
0 0,307 0,064
S5 0,016 0,08 0,08
1 0,089 0,021 0,168 0,042 0,064 0,012 0,026 0,055 0,011 0,011 0,028 0,107 0 0,031 0
S6 0,023 0,092 0,388 0 0,089 1 0,062 0
0 0,035 0,018 0 0,054 0,069 0,052 0 0,026 0,033
S7 0,034 0,067 0,105 0 0,021 0,062 1
0 0,124 0 0,075 0,082 0,027 0,098 0,044 0,134 0,038 0,093
0 0,137
S8 0
0 0,168 0
1 0,099 0,092 0
0 0,195 0,069 0
S9 0
0 0,042 0 0,124 0,099 1 0,115 0
0 0,082 0,087 0
S10 0,044 0,04 0,025
0,064 0,035
0,092 0,115
0,034
0,031 0,031 0,076 0,131
S11 0,117 0,051 0,091 0 0,012 0,018 0,075 0
0 0,034 1 0,024 0 0,016 0,068 0,064 0,063 0,042
S12 0,031 0,072 0
0 0,026 0 0,082 0
0 0,024 1 0,277 0
0,04
0 0,163 0,039 0,041 0
S13 0 0,081 0,059 0 0,055 0,054 0,027 0
0 0,277 1
0 0,038 0 0,122 0
S14 0,021 0,08 0,012 0 0,011 0,069 0,098 0
0 0,031 0,016 0
1 0,099 0 0,084 0,034
S15 0,021 0,069 0,038 0,121 0,011 0,052 0,044 0
0 0,031 0,068 0,04 0,038 0,099 1
0 0,084 0,029 0,095 0
S16 0
0 0,047 0 0,028 0 0,134 0,195 0,082 0,076 0,064 0
1 0,057 0,064
S17 0,081 0,074 0,019 0 0,107 0,026 0,038 0,069 0,087 0,131 0,063 0,163 0,122 0,084 0,084 0,057 1 0,185
S18 0,054 0,049 0,024 0
0 0,033 0,093 0
0 0,042 0,039 0 0,034 0,034 0,064 0,185 1
S19 0,084 0,32 0,096 0,307 0,031 0
0 0,041 0
1 0,111
S20 0 0,116 0,098 0,064 0
0 0,137 0
0 0,111 1
Hasil
TABEL
VI.
menunjukkan tingkat kemiripan antar 20 kalimat (S1 hingga S.
Nilai 1 muncul ketika suatu kalimat dibandingkan dengan dirinya sendiri .
isalnya S1 dengan S.
karena pasti akan sama.
Nilai 0 menunjukkan bahwa dua kalimat tidak memiliki kemiripan sama sekali, hal ini karena tidak ada kata atau konteks yang sama di antara keduanya.
Sedangkan, nilai seperti 0,066 menggambarkan tingkat kemiripannya, yang berarti kedua kalimat memiliki beberapa kata atau konteks yang serupa.
Matriks ini http://jtika.
id/index.
php/JTIKA/ Gambar 3 menggambarkan representasi graph dari algoritma Textrank yang menunjukkan hubungan kemiripan antar kalimat dalam sebuah teks.
Setiap lingkaran berwarna biru .
mewakili satu kalimat, yang diberi label angka mulai dari 0 hingga 19.
Garisgaris yang menghubungkan antar node disebut edge .
, yang menunjukkan bahwa kalimat-kalimat tersebut memiliki kemiripan berdasarkan kata-kata yang sama.
Semakin banyak edge .
yang dimiliki sebuah node, maka semakin besar kemungkinan kalimat tersebut dianggap penting dalam teks, karena memiliki hubungan kuat dengan kalimat lainnya.
2 Sentence Ranking Sentence Ranking merupakan tahap untuk melakukan pemberian skor .
berdasarkan tingkat kepentingannya dalam teks.
Proses ini bertujuan untuk menentukan kalimat mana yang paling relevan dan mewakili inti dari isi dokumen.
Tabel VII merupakan hasil sentence ranking dengan hasil skor Jurnal Teknologi Informasi.
Komputer dan Aplikasinya (JTIKA) Vol.
No.
Maret 2026, (Terakreditasi Sinta-4.
SK No:164/E/KPT/2.
TABEL VII.
HASIL SENTECE RANKING
Kalimat Presiden Prabowo Subianto mewaspadai eskalasi ketegangan geopolitik yang kian meningkat.
Prabowo juga menyinggung darurat militer yang sempat diberlakukan di Negeri Ginseng pada Selasa 312.
Skor Pagerank 4 Summary Hasil ringkasan ini merupakan hasil dari pengaplikasian algoritma Textrank yang menyajikan inti informasi dari berita secara efektif.
Tabel Vi merupakan contoh ringkasan yang dihasilkan tentunya berdasarkan kalimat-kalimat yang memiliki skor tertinggi hasil perhitungan pagerank dalam graph kalimat pada tahapan sebelumnya.
Hasil ringkasan mampu menunjukkan isi utama dokumen asli secara ringkas namun tetap mempertahankan konteks dan makna yang relevan.
TABEL Vi.
HASIL RINGKASAN
Artikel Asli Presiden Prabowo Subianto mewaspadai eskalasi ketegangan geopolitik yang kian Prabowo darurat militer yang sempat diberlakukan di Negeri Ginseng pada Selasa .
Hasil Ringkasan Prabowo darurat militer yang Negeri Ginseng pada Selasa .
1 Ringkasan dengan API Deepseek Hasil ringkasan yang dihasilkan oleh sistem dengan algoritma texrank sudah baik dalam menyajikan kalimat penting dari teks aslinya.
Namun masih cenderung mempertahankan bentuk kalimat apa adanya tanpa melakukan perbaikan susunan kalimat, karena kalimat dipilih berdasarkan skor pagerank yang lebih menekankan pada hubungan antar kalimat saja.
Sehingga disisi lain diperlukan perbaikan menggunakan API Deepseek untuk penyempurnaan ringkasan yang lebih terstruktur dengan menyatukan ide-ide utama ke http://jtika.
id/index.
php/JTIKA/ ISSN:2657-0327 dalam kalimat yang lebih ringkas tanpa kehilangan Penggunaan Deepseek API dalam penelitian ini bukan untuk menggantikan proses peringkasan utama, melainkan sebagai tahap penyempurnaan .
terhadap hasil Textrank.
Textrank berfungsi untuk memilih kalimat-kalimat penting berdasarkan struktur graf dan hubungan antar kalimat, sedangkan Deepseek digunakan untuk menyusun ulang kalimat agar lebih koheren dan mudah dibaca tanpa menambahkan informasi baru.
Dalam penelitian ini, evaluasi utama menggunakan metrik ROUGE dilakukan pada hasil Textrank .
ebelum Deepsee.
Sementara itu, penggunaan Deepseek diposisikan sebagai eksperimen tambahan untuk meningkatkan skor evaluasi secara langsung.
Dengan demikian, pendekatan ini tetap mempertahankan prinsip ekstraktif, namun memberikan insight terhadap kemungkinan integrasi metode ekstraktif dan model Bahasa.
Tabel IX merupakann hasil ringkasan dengan API Deepseek.
TABEL IX.
HASIL RINGKASAN DENGAN API DEEPSEK
Hasil Ringkasan Sistem Prabowo darurat militer yang sempat diberlakukan di Negeri Ginseng pada Selasa .
Perbaikan dengan API Deepseek Prabowo Subianto darurat militer di Korea Selatan .
5 Evaluasi Ringkasan Setelah proses peringkasan teks dilakukan Textrank penyempurnaan menggunakan API Deepseek, tahap selanjutnya adalah melakukan evaluasi terhadap kualitas ringkasan yang dihasilkan.
Evaluasi ini bertujuan untuk mengukur sejauh mana ringkasan yang dihasilkan mampu merepresentasikan informasi penting dari teks asli secara akurat dan relevan.
Dalam penelitian ini, evaluasi dilakukan dengan menggunakan metrik ROUGE yang umum digunakan dalam penelitian peringkasan teks untuk mengukur tingkat kesamaan antara ringkasan sistem dan ringkasan referensi .
old standar.
Selain itu, untuk memperoleh hasil evaluasi yang lebih objektif, metode Textrank juga dibandingkan dengan metode baseline sederhana, yaitu Lead-3.
Jurnal Teknologi Informasi.
Komputer dan Aplikasinya (JTIKA) Vol.
No.
Maret 2026, (Terakreditasi Sinta-4.
SK No:164/E/KPT/2.
ISSN:2657-0327 Dengan demikian, pada subbab ini akan implementasi baseline Lead-3 sebagai pembanding, serta hasil evaluasi dan analisis perbandingan antara metode yang diusulkan dengan baseline.
6812 yang menunjukkan bahwa sistem sudah bekerja dengan baik dalam membuat ringkasan otomatis dari teks berita.
Nilai ini mencerminkan tingkat efektivitas algoritma dalam menangkap informasi penting dari teks.
1 Metode Evaluasi (ROUGE) 2 Baseline Lead-3 Evaluasi kualitas ringkasan dilakukan dengan ROUGE, membandingkan ringkasan yang dibuat oleh sistem dengan ringkasan referensi yang dibuat secara manual.
ROUGE-1 akan mengukur kesamaan berdasarkan kata per kata.
ROUGE-2 mengukur kesamaan berdasarkan pasangan dua kata yang berurutan, dan ROUGE-L mengukur kesamaan berdasarkan urutan kata terpanjang yang sama antara dua teks.
Setiap metrik akan menghasilkan 3 nilai yaitu precision yang menghitung seberapa banyak kata atau frasa dalam ringkasan sistem yang benar-benar cocok dengan ringkasan referensi, lalu recall akan menghitung seberapa banyak kata atau frasa dari ringkasan referensi yang berhasil ditangkap oleh sistem, sedangkan dan F1-score, yang merupakan gabungan antara precision dan recall dan biasanya akan digunakan untuk mewakilkan hasil evaluasi ringkasan.
Selain menggunakan metode Textrank, penelitian ini juga menerapkan metode baseline Lead-3 sebagai pembanding dalam evaluasi performa sistem peringkasan teks.
Lead-3 merupakan metode sederhana yang menghasilkan ringkasan dengan mengambil tiga kalimat pertama dari dokumen.
TABEL X.
HASIL EVALUASI METRIK ROUGE
Metric
Precision Recall F1-Score
ROUGE-1
ROUGE-2
ROUGE-L
Tabel X menunjukkan hasil evaluasi algoritma Textrank menggunakan metrik ROUGE menghasilkan nilai yang berbeda pada setiap metrik.
ROUGE-1 yang mengukur kesamaan kata .
, yaitu dengan membandingkan seberapa banyak kata yang sama muncul antara ringkasan hasil dan ringkasan referensi diperoleh precision 0.
7708, recall 0.
6930, dan F1-score ROUGE-2 mengukur kesamaan berdasarkan pasangan kata berurutan .
, hasilnya adalah 6936, recall 0.
6212, dan F1-score 0.
Sementara itu.
ROUGE-L yang menghitung kemiripan struktur kalimat secara keseluruhan, dengan nilai 7210, recall 0.
F1-score sebesar Untuk mendapatkan nilai akhir evaluasi dilakukan perhitungan rata-rata dari nilai F1-score pada ketiga metrik ROUGE, nilai evaluasi akhir yang diperoleh http://jtika.
id/index.
php/JTIKA/ Pendekatan ini didasarkan pada struktur umum penulisan berita, di mana informasi penting cenderung disampaikan pada bagian awal teks.
Oleh karena itu.
Lead-3 sering digunakan sebagai baseline dalam penelitian text summarization, khususnya pada domain berita, karena memberikan performa yang cukup kompetitif meskipun tanpa menggunakan pendekatan berbasis model atau graph.
Dalam penelitian ini, penerapan Lead-3 dilakukan dengan langkah berikut:
Dokumen preprocessing dipisahkan menjadi beberapa Tiga kalimat pertama dari dokumen dipilih secara langsung sebagai ringkasan.
Ringkasan tersebut kemudian dibandingkan dengan ringkasan referensi .
old standar.
Ringkasan yang dihasilkan oleh metode Lead-3 kemudian digunakan sebagai pembanding terhadap hasil ringkasan yang dihasilkan oleh metode Textrank.
Dengan demikian, perbandingan ini memungkinkan analisis yang lebih objektif dalam menilai efektivitas metode yang diusulkan dibandingkan pendekatan sederhana berbasis posisi 2 Hasil Evaluasi dan Perbandingan Penerapan metode Textrank dan baseline Lead-3, tahap selanjutnya adalah melakukan analisis terhadap hasil ringkasan yang dihasilkan oleh kedua metode Analisis ini bertujuan untuk membandingkan masing-masing menghasilkan ringkasan yang representatif terhadap isi dokumen.
Perbandingan dilakukan berdasarkan nilai evaluasi yang diperoleh dari masing-masing metode, sehingga dapat memberikan gambaran yang lebih jelas mengenai perbedaan performa antara pendekatan berbasis graph pada Textrank dan pendekatan Jurnal Teknologi Informasi.
Komputer dan Aplikasinya (JTIKA) Vol.
No.
Maret 2026, (Terakreditasi Sinta-4.
SK No:164/E/KPT/2.
sederhana berbasis posisi pada Lead-3.
Hasil perbandingan tersebut disajikan pada Tabel XI berikut.
TABEL XI.
PERBANDINGAN HASIL EVALUASI
METODE LEAD-3 DAN TEXTRANK
Metode ROUGE-1
ROUGE-2
ROUGE-L
Lead-3 Textrank Analisis ini juga bertujuan untuk menunjukkan sejauh mana metode Textrank mampu memberikan peningkatan performa dibandingkan baseline Lead-3 sebagai pendekatan sederhana yang umum digunakan dalam penelitian peringkasan teks.
KESIMPULAN DAN SARAN
Hasil penelitian yang dilakukan yaitu Penggunaan Algoritma Textrank untuk Peringkasan Otomatis Berita Bahasa Indonesia diperoleh kesimpulan bahwa Algoritma Textrank berhasil diimplementasikan untuk melakukan peringkasan otomatis pada teks berita berbahasa Indonesia, dengan hasil ringkasan yang mampu merepresentasikan isi utama dari teks sumber.
Ringkasan yang dihasilkan menunjukkan bahwa pemilihan kalimat didasarkan pada skor dalam graph, tanpa mempertimbangkan urutan kalimat dalam teks Berdasarkan hasil evaluasi menggunakan metrik ROUGE, sistem mampu mencapai skor rata-rata 6812 yang mampu menunjukkan tingkat evaluasi model baik.
Skor ROUGE-1 menunjukkan nilai 7708, recall 0.
6930, dan F1-score 0.
ROUGE-1 ini mengukur kemiripan antara ringkasan sistem dan ringkasan referensi berdasarkan kata tunggal .
atu kat.
Skor ROUGE-2 mengukur kesamaan berdasarkan pasangan kata berurutan .
, hasilnya adalah precision 0.
6936, recall 6212, dan F1-score 0.
6480 yang menilai kemiripan berdasarkan dua kata yang muncul berdampingan dalam suatu teks.
Sementara itu.
ROUGE-L yang mengukur kesamaan berdasarkan urutan kalimat terpanjang, mencatat nilai precision 0.
7210, recall 6465.
F1-score sebesar 0.
Nilai-nilai ini menunjukkan bahwa algoritma Textrank cukup efektif mempertahankan informasi penting dari teks asli secara ringkas dan tetap representatif.
Berdasarkan hasil dan temuan dalam penelitian ini, terdapat beberapa saran yang dapat diajukan guna mendukung pengembangan penelitian lebih lanjut serta meningkatkan kualitas peringkasan text http://jtika.
id/index.
php/JTIKA/ ISSN:2657-0327 kedepannya adalah penelitian saat ini menggunakan acuan 100 data dari 1.
000 yang dilakukan secara acak .
andom sampl.
data dalam pembuatan ringkasan manual .
old standar.
, sehingga pada penelitian selanjutnya dapat dilakukan lebih dari 100.
Hal ini menjadi bagian penting dalam proses evaluasi sistem karena ringkasan manual berperan sebagai pembanding utama dalam menilai kualitas ringkasan otomatis yang dihasilkan.
Hasil evaluasi menggunakan metrik ROUGE-L sudah menunjukkan nilai yang baik.
Meskipun performa sistem sudah dikatakan baik, namun masih terdapat potensi untuk dilakukan pengembangan lebih lanjut.
Pengembangan ini dapat difokuskan pada peningkatan akurasi dengan optimasi dan relevansi ringkasan agar lebih sesuai dengan kebutuhan pengguna.
UCAPAN TERIMA KASIH
Penulis ingin mengucapkan terima kasih kepada Institut Bisnis dan Teknologi Indonesia atas dukungan atas pendanaan hibah internal IRDP 2026.
DAFTAR PUSTAKA