BULLETIN OF COMPUTER SCIENCE RESEARCH
ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
Implementasi Metode Cosine Similarity Dalam Sistem Profiling Dosen Berbasis Data Bibliometrik Untuk Pemetaan Kompetensi Akademik Jefry Sunupurwa Asri1,*.
Firnanda Amalia2.
Muhammad Thifaal Dzaki2.
Muhammad Fikri1.
Ardra Rianisa2 1 Fakultas Ilmu Komputer.
Teknik Informatika.
Universitas Esa Unggul.
Jakarta.
Indonesia 2 Fakultas Ilmu Komputer.
Sistem Informasi.
Universitas Esa Unggul.
Jakarta.
Indonesia Email: 1,*jefry.
sunupurwa@esaunggul.
id, 2firnandaamalia05@student.
3muhammadthifaaldzaki@student.
id, 4muhammadfikrii77xc@student.
5rianisaardra49@student.
Email Penulis Korespondensi: jefry.
sunupurwa@esaunggul.
AbstrakOeProfiling dosen berbasis publikasi ilmiah menjadi komponen strategis dalam pengelolaan sumber daya manusia perguruan Proses identifikasi kompetensi dosen yang dilakukan secara manual sering memerlukan waktu lama dan berpotensi menimbulkan ketidaktepatan.
Penelitian ini bertujuan mengembangkan aplikasi otomatis untuk profiling dosen dan pemetaan kompetensi terhadap mata kuliah menggunakan pendekatan unsupervised text similarity berbasis metode Term FrequencyAeInverse Document Frequency (TF-IDF) dan Cosine Similarity.
Aplikasi dikembangkan menggunakan framework Streamlit dengan integrasi data dari Google Scholar.
SINTA, dan Scopus.
Evaluasi dilakukan terhadap 50 dosen 120 pasangan data dosenAemata kuliah menggunakan metrik akurasi, precision, recall.
F1-score, waktu respons, dan usability.
Hasil pengujian menunjukkan akurasi sebesar 85,3%.
F1-score 0,853, waktu respons rata-rata 2,3 detik, serta skor usability 86,4, yang termasuk kategori excellent.
Sistem mampu menampilkan profil dosen secara interaktif, melakukan pemetaan kompetensi terhadap mata kuliah, serta menghasilkan laporan otomatis dalam format PDF.
Dengan demikian, aplikasi ini efektif mendukung proses pengambilan keputusan akademik berbasis data dalam penempatan dosen sesuai bidang keahlian mereka.
Kata Kunci: Profiling Dosen.
Streamlit.
Cosine Similarity.
TF-IDF.
Pemetaan Kompetensi AbstractOeLecturer profiling based on scientific publications is a strategic component in managing human resources in higher education The manual process of identifying lecturer competencies often requires considerable time and may lead to inaccuracies.
This study aims to develop an automated application for lecturer profiling and competency mapping to relevant courses using an unsupervised text similarity approach based on the Term FrequencyAeInverse Document Frequency (TF-IDF) and Cosine Similarity The application was developed using the Streamlit framework with integrated data from Google Scholar.
SINTA, and Scopus.
The evaluation involved 50 lecturers and 120 lecturerAecourse pairs, measured using accuracy, precision, recall.
F1-score, response time, and usability metrics.
The results show an accuracy of 85.
3%, an F1-score of 0.
853, an average response time of 2.
3 seconds, and a usability score of 86.
4, which falls into the excellent category.
The system is capable of displaying interactive lecturer profiles, performing competency mapping to relevant courses, and generating automatic reports in PDF format.
Therefore, this application effectively supports data-driven academic decision-making processes for assigning lecturers according to their areas of expertise.
Keywords: Lecturer Profiling.
Streamlit.
Cosine Similarity.
TF-IDF.
Competency Mapping PENDAHULUAN Perkembangan teknologi informasi yang pesat telah membawa perubahan signifikan dalam pengelolaan sumber daya manusia di perguruan tinggi, khususnya dalam bidang akademik dan penelitian.
salah satu aspek krusial manajemen sumber daya manusia adalah profil dosen, yaitu proses identifikasi kompetensi dan bidang keahlian berdasarkan rekam jejak akademik dan publikasi ilmiah.
Profil dosen yang akurat sangat penting untuk memastikan kesesuaian antara kompetensi dosen dengan mata kuliah yang diajarkannya, sehingga tercapai pembelajaran yang optimal dan keselarasan dengan bidang keahlian dosen .
Namun, pada praktiknya, proses identifikasi kompetensi dosen di banyak perguruan tinggi masih dilakukan secara manual, melalui wawancara, kuesioner, atau penelusuran data publikasi secara terpisah di berbagai platform seperti Google Scholar.
SINTA, dan Scopus.
Proses manual tersebut tidak hanya memakan waktu lama, tetapi juga berpotensi menimbulkan ketidaktepatan dalam pemetaan bidang keahlian.
Hal ini disebabkan oleh data publikasi yang tersebar di beberapa platform dengan struktur dan format data yang berbeda.
Fokus utama penelitian ini tidak hanya pada pengelolaan data akademik secara umum, tetapi lebih spesifik pada bagaimana publikasi ilmiah dosen dapat dimanfaatkan untuk memetakan kompetensi dan kesesuaiannya dengan mata kuliah yang diajarkan.
Beberapa penelitian sebelumnya telah mengembangkan sistem profil dosen berbasis publikasi ilmiah, tetapi sebagian besar terbatas pada satu sumber data dan belum menghubungkan hasilnya dengan pemetaan kompetensi mata kuliah.
Penelitian ini berupaya mengatasi kesenjangan tersebut dengan mengintegrasikan tiga sumber data utama, yaitu Google Scholar.
SINTA, dan Scopus, ke dalam satu sistem terpusat, serta menerapkan metode TF-IDF dan cosine similarity untuk menganalisis relevansi antara bidang penelitian dosen dan deskripsi mata kuliah Beberapa penelitian sebelumnya telah mengembangkan sistem profiling dosen berbasis publikasi ilmiah, namun sebagian besar masih terbatas pada satu sumber data.
Penelitian oleh Park et al.
memanfaatkan data publikasi untuk menampilkan profil akademik dosen menggunakan pendekatan cosine similarity.
Penelitian lain oleh Aini dan Yulianti .
menerapkan metode Adjusted TF-IDF untuk mengelompokkan bidang keahlian dosen, tetapi belum mengintegrasikan hasilnya dengan pemetaan kesesuaian terhadap mata kuliah.
Selain itu.
Rinjeni et al.
menerapkan metode TF-IDF dan cosine similarity untuk pencocokan judul artikel ilmiah, namun tanpa integrasi lintas sumber data akademik.
Copyright A 2025 The Author.
Page 1351 This Journal is licensed under a Creative Commons Attribution 4.
0 International License BULLETIN OF COMPUTER SCIENCE RESEARCH ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
Selain itu.
Studi lain menekankan efektivitas metode berbasis TF-IDF dan algoritma kecerdasan buatan dalam identifikasi kompetensi dan pakar di berbagai domain.
Fonseca et al.
menunjukkan pentingnya penerapan algoritma TF-IDF untuk meningkatkan akurasi identifikasi bidang keahlian peneliti, sementara Borna et al.
menyoroti efektivitas algoritma AI dalam proses identifikasi pakar di domain medis.
Suryanto dan Khan .
membuktikan efektivitas varian TF-IDF dalam klasifikasi teks ilmiah, dan Lu.
Wang, & Chen .
membandingkan berbagai model pemrosesan teks, seperti TF-IDF.
Word2Vec.
FastText.
BERT, dan GPT, untuk analisis topik penelitian menunjukkan bahwa TF-IDF masih relevan untuk pemetaan berbasis teks.
Lebih lanjut, penelitian terbaru oleh Sabilillah et al.
Yasni et al.
, dan Hairani .
mengonfirmasi bahwa integrasi multi-platform berbasis bibliometrik dapat meningkatkan akurasi profiling akademik hingga 20%, sehingga menegaskan pentingnya pendekatan komprehensif dalam analisis kompetensi dosen.
Berdasarkan kajian terhadap penelitian terdahulu, dapat diidentifikasi bahwa belum ada penelitian yang mengintegrasikan tiga sumber data utama Google Scholar.
SINTA, dan Scopus ke dalam satu sistem profiling terpusat yang terhubung langsung dengan proses pemetaan kesesuaian mata kuliah.
Dengan demikian, masih terdapat research gap dalam hal integrasi data multi-platform dan penerapan metode berbasis cosine similarity untuk menentukan relevansi antara bidang penelitian dosen dan deskripsi mata kuliah .
Ae.
Untuk menjawab kesenjangan tersebut, penelitian ini bertujuan mengembangkan aplikasi profiling dosen berbasis Streamlit dengan integrasi data dari Google Scholar.
SINTA, dan Scopus.
Sistem ini menggunakan metode TF-IDF dan Cosine Similarity untuk menganalisis kesesuaian antara kompetensi dosen dan mata kuliah, serta mengevaluasi performa sistem berdasarkan akurasi, waktu respons, dan tingkat usability.
Diharapkan, hasil penelitian ini dapat memberikan kontribusi nyata dalam penyediaan solusi otomatis untuk pemetaan kompetensi dosen berbasis data, sehingga dapat mendukung proses pengambilan keputusan akademik yang lebih objektif dan efisien di perguruan tinggi.
METODOLOGI PENELITIAN
1 Bagan Alir Penelitian Gambar 1.
Bagan Alir Penelitian Gambar 1 menunjukkan bagan alir penelitian yang terdiri atas enam tahapan utama, yaitu Data Collection.
Preprocessing.
Feature Extraction.
Similarity Analysis.
Visualization, dan Reporting.
Setiap tahapan memiliki peran penting dalam membangun sistem profiling dosen berbasis publikasi ilmiah yang terintegrasi dengan Google Scholar.
SINTA, dan Scopus.
Data Collection Tahapan ini merupakan proses awal penelitian yang berfokus pada pengumpulan data publikasi dosen dari tiga sumber utama, yaitu Google Scholar.
SINTA, dan Scopus.
Data yang dikumpulkan meliputi judul publikasi, abstrak, kata kunci, serta informasi afiliasi penulis.
Pengambilan data dilakukan secara otomatis menggunakan application programming interface (API) dan web scraping sesuai kebijakan masing-masing platform.
Tahapan ini bertujuan untuk menyediakan kumpulan data yang representatif dan relevan dengan bidang keilmuan dosen.
Preprocessing Setelah data terkumpul, dilakukan tahap preprocessing untuk memastikan kualitas dan konsistensi data.
Proses ini meliputi pembersihan .
ata cleanin.
, penghapusan duplikasi .
, standarisasi format teks .
ext normalizatio.
, serta penghapusan karakter khusus atau kata-kata yang tidak bermakna .
Hasil dari tahap Copyright A 2025 The Author.
Page 1352 This Journal is licensed under a Creative Commons Attribution 4.
0 International License BULLETIN OF COMPUTER SCIENCE RESEARCH ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
ini berupa dataset yang siap dianalisis secara komputasional.
Feature Extraction Tahap ini menggunakan metode Term FrequencyAeInverse Document Frequency (TF-IDF) untuk mengekstraksi fitur kata kunci dari kumpulan teks publikasi dan deskripsi mata kuliah.
TF-IDF berfungsi untuk memberikan bobot pada setiap kata berdasarkan frekuensi kemunculannya di dalam dokumen dan relevansinya terhadap seluruh korpus data.
Dengan metode ini, sistem dapat mengenali kata-kata penting yang mencerminkan bidang keilmuan dosen dan topik mata kuliah.
Similarity Analysis Pada tahap ini dilakukan analisis kesesuaian antara bidang penelitian dosen dengan deskripsi mata kuliah menggunakan metode cosine similarity.
Teknik ini mengukur tingkat kedekatan dua vektor teks berdasarkan sudut kosinus di antara keduanya.
Semakin tinggi nilai kesamaan .
, semakin relevan bidang penelitian dosen dengan mata kuliah yang dianalisis.
Tahap ini menjadi inti dari sistem pemetaan kompetensi dosen.
Visualization Hasil analisis kesesuaian divisualisasikan secara interaktif melalui antarmuka Streamlit.
Modul ini menampilkan informasi profil dosen, bidang keilmuan dominan, tingkat kesesuaian dengan setiap mata kuliah, serta grafik hubungan antar topik.
Pendekatan visual ini memudahkan pihak fakultas atau program studi dalam memahami hasil analisis secara intuitif dan cepat.
Reporting Tahap terakhir adalah pembuatan laporan hasil analisis dalam format PDF.
Laporan mencakup ringkasan profil dosen, bidang keilmuan utama, serta rekomendasi mata kuliah yang sesuai dengan kompetensi dosen.
Laporan ini dapat dijadikan dokumen pendukung dalam proses pengambilan keputusan akademik, seperti penugasan mengajar, perencanaan kurikulum, atau evaluasi kinerja dosen.
Secara keseluruhan, enam tahapan tersebut membentuk kerangka penelitian yang sistematis dalam mengembangkan sistem profiling dosen berbasis integrasi multi-platform dan analisis kesesuaian berbasis teks.
2 Pengumpulan Data Proses pengumpulan data dilakukan melalui tiga metode utama sesuai dengan sumber data yang digunakan.
Untuk data Google Scholar, digunakan teknik web scraping dengan library BeautifulSoup4 dan Selenium WebDriver.
Implementasi scraping dirancang dengan memperhatikan robots.
txt dan terms of service dari masing-masing platform.
Data yang diambil meliputi profil dasar .
ama, afiliasi, bidang mina.
, metrik penelitian .
-index, i10-index, citation.
, dan daftar publikasi .
udul, tahun, journal, abstrak.
Untuk data SINTA, digunakan API resmi yang disediakan oleh Kemdikbudristek dengan authentication token.
Data yang diperoleh meliputi score SINTA, jumlah publikasi terindeks, dan data kinerja penelitian lainnya.
Sedangkan untuk data Scopus, digunakan API dari Elsevier dengan subscription yang Proses autentikasi dilakukan menggunakan API key dan instution token untuk mengakses data yang lebih 3 Preprocessing Data Tahapan preprocessing data merupakan langkah penting dalam penelitian berbasis text mining yang bertujuan untuk menyiapkan dan menstandarkan data sebelum dilakukan proses analisis lebih lanjut.
Fokus penelitian ini adalah analisis kesesuaian bidang keilmuan antara publikasi dosen dan deskripsi mata kuliah, sehingga proses preprocessing difokuskan pada pembersihan serta normalisasi teks agar hasil representasi fitur lebih akurat pada tahap ekstraksi.
Proses preprocessing teks meliputi beberapa tahapan utama.
Tahap pertama adalah case folding, yaitu proses konversi seluruh karakter menjadi huruf kecil .
untuk menghindari perbedaan makna akibat variasi kapitalisasi.
Selanjutnya dilakukan tokenizing, yaitu pemecahan teks menjadi satuan kata atau token menggunakan pustaka Natural Language Toolkit (NLTK).
Tahap berikutnya adalah filtering atau penghapusan stop words, yakni kata-kata umum yang tidak memiliki kontribusi semantik signifikan terhadap konteks analisis.
Daftar stop words mencakup bahasa Indonesia dan bahasa Inggris, serta diperluas dengan istilah akademik yang sering digunakan.
Setelah itu dilakukan stemming, yaitu proses mengembalikan setiap kata ke bentuk dasarnya menggunakan algoritma Porter Stemmer untuk teks berbahasa Inggris dan NaziefAeAdriani Stemmer untuk teks berbahasa Indonesia.
Adapun data numerik seperti h-index, jumlah sitasi, dan skor SINTA hanya melalui proses validasi dasar untuk memastikan konsistensi serta integritas hasil integrasi data dari berbagai sumber.
Proses tersebut tidak digunakan dalam analisis utama karena fokus penelitian terletak pada pengolahan data teks untuk pemetaan kompetensi.
Dengan demikian, handling missing values maupun outlier detection terhadap data numerik dilakukan semata-mata untuk verifikasi kualitas dataset, bukan untuk tahap analisis berbasis text mining.
Seluruh tahapan preprocessing diimplementasikan menggunakan pustaka pandas, numpy, dan NLTK dalam lingkungan pemrograman Python guna menjamin efisiensi dan reprodusibilitas proses.
4 Ekstraksi Fitur dan Analisis Kesamaan Analisis data menggunakan pendekatan Text Mining dengan TF-IDF (Term Frequency-Inverse Document Frequenc.
untuk feature extraction.
TF-IDF mampu mengukur importance suatu term dalam dokumen relatif terhadap kumpulan Perhitungan TF-IDF menggunakan formula:
Copyright A 2025 The Author.
Page 1353 This Journal is licensed under a Creative Commons Attribution 4.
0 International License BULLETIN OF COMPUTER SCIENCE RESEARCH ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
TF-IDF.
c, yc.
= TF.
c, yc.
y IDF.
dimana $\text{TF}.
$ adalah term frequency dalam dokumen, dan $\text{IDF}.
$ adalah inverse document frequency.
Algoritma Cosine Similarity digunakan untuk mengukur kemiripan antara vektor representasi bidang penelitian dosen dengan deskripsi mata kuliah.
Cosine similarity efektif untuk mengukur kesamaan orientasi antara dua vektor tanpa memperhatikan besarnya.
Perhitungan dilakukan menggunakan formula:
yaAUIyaA similarity = cosA.
uE) = OuyaAOuOuyaAOu = Ocycu ycn=1 ocycu ycn=1 yaycnyaAycn ya2ycn ocycu ycn=1 .
yaAycn2 Implementasi menggunakan library scikit-learn dengan optimasi parameter untuk domain akademik.
5 Implementasi Sistem Sistem diimplementasikan menggunakan Python 3.
9 dan framework Streamlit untuk antarmuka pengguna.
Arsitektur sistem dibangun secara modular dengan prinsip separation of concerns, yang memisahkan pengelolaan data, logika bisnis, dan tampilan hasil analisis.
Setiap modul dalam sistem memiliki tanggung jawab yang jelas, meliputi pengumpulan data, pemrosesan teks, visualisasi hasil, dan pelaporan.
Pendekatan ini memastikan alur kerja sistem tetap terstruktur, mudah dikembangkan, dan efisien dalam proses pemetaan kompetensi dosen.
Database menggunakan SQLite untuk development dan PostgreSQL untuk production environment.
Modul utama sistem terdiri dari: data collector module untuk pengambilan data dari berbagai sumber, processing module untuk analisis teks dan perhitungan similarity, visualization module untuk menampilkan hasil dalam bentuk chart dan tabel, serta reporting module untuk generate laporan PDF.
Implementasi docker containerization memungkinkan deployment yang konsisten across different environments.
Tabel 1.
Spesifikasi Teknis Sistem
Komponen
Backend
Frontend
Database Container Teknologi Python
Streamlit
SQLite/PostgreSQL Docker
Versi
38/14
6 Evaluasi Sitem Evaluasi sistem dilakukan untuk menilai kinerja dan efektivitas aplikasi profiling dosen dalam melakukan pemetaan kompetensi terhadap mata kuliah.
Pengujian dilakukan terhadap 50 dosen yang berasal dari berbagai disiplin ilmu, dengan tujuan mengukur akurasi sistem, waktu respons, serta tingkat usability dari antarmuka pengguna.
Pengujian akurasi pemetaan dilakukan dengan membandingkan hasil keluaran sistem dengan hasil penilaian manual oleh tiga ahli bidang yang memiliki kompetensi dalam analisis bidang keilmuan dosen.
Proses ini bertujuan untuk memverifikasi tingkat kesesuaian antara hasil otomatis sistem dengan evaluasi berbasis expert judgment.
Nilai akurasi dihitung menggunakan metrik precision, recall, dan F1-score untuk menggambarkan performa sistem dalam mengidentifikasi relevansi antara bidang penelitian dan deskripsi mata kuliah.
Aspek usability sistem diukur menggunakan instrumen System Usability Scale (SUS) yang diisi oleh 10 pengguna, terdiri atas dosen dan staf akademik yang berinteraksi langsung dengan aplikasi.
Skor SUS digunakan untuk menilai kemudahan penggunaan, efisiensi antarmuka, serta kepuasan pengguna terhadap pengalaman interaksi sistem.
Selain itu, pengukuran waktu respons sistem dilakukan dengan menghitung rata-rata durasi pemrosesan terhadap 100 permintaan pencarian profil dosen.
Pengujian ini bertujuan untuk menilai efisiensi sistem dalam memproses data dari berbagai sumber sekaligus menampilkan hasil analisis kesesuaian secara real time.
Hasil evaluasi menunjukkan bahwa sistem memiliki tingkat akurasi yang tinggi dalam pemetaan kompetensi dosen, waktu respons yang efisien, serta tingkat usability yang baik berdasarkan hasil penilaian pengguna.
Dengan demikian, sistem dapat dinyatakan layak untuk diimplementasikan sebagai alat bantu dalam pengambilan keputusan akademik berbasis data publikasi ilmiah
HASIL DAN PEMBAHASAN
1 Implementasi Aplikasi 1 Arsitektur dan Desain Sistem Arsitektur sistem yang dikembangkan dalam penelitian ini dirancang berbasis modular architecture dengan pendekatan three-tier system yang terdiri atas frontend layer, backend layer, dan database layer.
Selain itu, sistem juga mengintegrasikan tiga sumber data utama, yaitu Google Scholar.
SINTA, dan Scopus melalui mekanisme API integration dan web scraping.
Gambar 2 berikut menggambarkan arsitektur akhir sistem yang diimplementasikan.
Arsitektur tersebut terdiri dari beberapa komponen utama sebagai berikut:
Copyright A 2025 The Author.
Page 1354 This Journal is licensed under a Creative Commons Attribution 4.
0 International License BULLETIN OF COMPUTER SCIENCE RESEARCH ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
Frontend (Streamlit Interfac.
Gambar 2.
Diagram Arsitektur Sistem Profiling Dosesn Berbasis Streamlit Bagian frontend dikembangkan menggunakan framework Streamlit, yang berfungsi sebagai antarmuka interaktif antara pengguna dan sistem.
Pengguna dapat mengakses sistem melalui browser untuk melakukan pencarian profil dosen, melihat hasil analisis kompetensi, serta mengunduh laporan.
Antarmuka ini menampilkan hasil pemetaan kompetensi dalam bentuk tabel, bar chart, word cloud, dan grafik kemiripan antar bidang penelitian dengan deskripsi mata kuliah.
Visualisasi ini membantu pengguna mengeksplorasi data secara dinamis dan memperoleh insight yang relevan.
Streamlit dipilih karena kemampuannya menghasilkan visualisasi real-time dengan sintaks yang sederhana, sehingga mempermudah pengembangan prototipe interaktif.
Backend (Processing & Integration Layer.
Bagian backend berfungsi sebagai pusat logika bisnis sistem yang mengatur seluruh proses mulai dari pengambilan data, pra-pemrosesan, hingga analisis kemiripan kompetensi.
Komponen backend ini juga mengelola interaksi dengan database PostgreSQL untuk persistensi data dan mengintegrasikan berbagai model AI untuk pemrosesan data, seperti TF-IDF dan Cosine Similarity, guna menghasilkan insight yang relevan.
Di dalamnya terdapat empat modul Data Collector Module Modul ini bertugas mengumpulkan data publikasi dosen dari tiga platform berbeda.
Untuk Google Scholar digunakan web scraping dengan library BeautifulSoup4 dan Selenium, sedangkan untuk SINTA dan Scopus digunakan API integration dengan authentication key.
Hasil dari proses ini berupa data mentah dalam format JSON atau CSV yang berisi nama dosen, judul publikasi, afiliasi, dan bidang penelitian.
Processing Module Modul ini melakukan data preprocessing untuk membersihkan data publikasi.
Proses mencakup case folding, tokenization, stopword removal, stemming, dan feature extraction menggunakan metode TF-IDF (Term FrequencyAeInverse Document Frequenc.
Setelah representasi vektor dihasilkan, sistem menerapkan Cosine Similarity untuk mengukur tingkat kesamaan antara topik penelitian dosen dengan deskripsi mata kuliah dalam Hasilnya berupa skor kemiripan yang menunjukkan relevansi antara keahlian dosen dan mata kuliah Visualization Module Modul ini menampilkan hasil analisis dalam bentuk visual interaktif seperti bar chart, pie chart, dan heatmap.
Visualisasi dibuat menggunakan library Plotly dan Matplotlib yang terintegrasi dengan Streamlit.
Tujuannya agar pengguna dapat memahami pola kompetensi dosen secara intuitif, misalnya bidang yang paling dominan, tren penelitian, dan distribusi kesesuaian dengan mata kuliah.
Reporting Module Modul ini menghasilkan laporan otomatis dalam format PDF menggunakan library ReportLab.
Laporan berisi ringkasan profil dosen, daftar publikasi, hasil analisis kesamaan topik, dan rekomendasi penugasan mata kuliah.
Modul ini juga mendukung batch reporting, sehingga beberapa profil dosen dapat diproses sekaligus untuk keperluan administrasi fakultas.
Database Layer Penyimpanan data dilakukan menggunakan SQLite pada tahap pengembangan .
evelopment environmen.
dan PostgreSQL untuk tahap implementasi .
roduction environmen.
Database menyimpan hasil ekstraksi data publikasi, profil dosen, serta hasil analisis kemiripan.
Struktur database dirancang dengan beberapa tabel utama, yaitu Copyright A 2025 The Author.
Page 1355 This Journal is licensed under a Creative Commons Attribution 4.
0 International License BULLETIN OF COMPUTER SCIENCE RESEARCH ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
lecturer_profile, publication_data, subject_description, dan similarity_result.
Relasi antar tabel menggunakan foreign key untuk menjaga konsistensi data.
API Integration Layer Lapisan ini bertugas sebagai jembatan antara sistem internal dengan sumber data eksternal.
Integrasi dilakukan melalui RESTful API untuk Scopus dan SINTA, sedangkan Google Scholar diakses melalui custom scraping handler.
Setiap permintaan data dikontrol menggunakan scheduler untuk menghindari rate limit dan menjaga kepatuhan terhadap kebijakan penggunaan data masing-masing platform.
Secara umum, hubungan antar komponen dapat dijelaskan sebagai berikut: pengguna melakukan permintaan melalui antarmuka Streamlit .
, sistem kemudian meneruskan permintaan ke backend untuk mengeksekusi modul pengumpulan dan analisis data.
Hasil analisis disimpan sementara di database, lalu dikirim kembali ke frontend untuk Jika pengguna ingin mengunduh hasilnya, sistem memanggil reporting module untuk menghasilkan dokumen laporan.
Dengan desain arsitektur seperti ini, sistem memiliki keunggulan dalam hal skalabilitas, portabilitas, dan kemudahan pemeliharaan.
Penambahan sumber data baru atau metode analisis lain di masa depan dapat dilakukan dengan menambahkan modul tambahan tanpa mengubah struktur utama sistem.
Arsitektur ini juga mendukung implementasi berbasis containerization menggunakan Docker, sehingga sistem dapat dijalankan secara konsisten di berbagai lingkungan server.
2 Antarmuka Aplikasi (User Interfac.
Antarmuka aplikasi Profiling Dosen Fasilkom Esa Unggul dibangun menggunakan framework Streamlit dengan pendekatan visual yang sederhana dan fungsional.
Desainnya menekankan kemudahan navigasi, tampilan yang bersih, serta penyajian data yang ringkas agar mudah dipahami oleh pengguna non-teknis seperti dekan, kaprodi, dan staf Warna dominan yang digunakan adalah tema gelap .
ark mod.
untuk meningkatkan kenyamanan visual sekaligus menonjolkan elemen teks dan tabel yang menjadi fokus utama.
Gambar 3.
Halaman Utama Tampilan pertama merupakan halaman awal aplikasi yang menampilkan judul besar AuProfiling Dosen Fasilkom Esa UnggulAy dan subjudul AuData Dosen yang Sudah Terproses.
Ay Pada bagian ini pengguna dapat melakukan pencarian dosen berdasarkan nama melalui kolom pencarian yang berada di bagian atas, serta melakukan penyaringan berdasarkan program studi melalui menu dropdown.
Pilihan program studi mencakup Magister Ilmu Komputer.
Sistem Informasi.
Teknik Informatika, dan Teknik Informatika (PJJ).
Setiap kali pengguna memilih salah satu program studi, sistem secara otomatis memperbarui daftar dosen yang muncul tanpa perlu memuat ulang halaman.
Seluruh daftar dosen ditampilkan dalam bentuk tabel yang menampilkan informasi penting seperti nama dosen, program studi.
ID Google Scholar, h-index, dan i10-index.
Tampilan ini berfungsi sebagai beranda utama yang memberikan gambaran umum tentang data dosen yang telah berhasil diproses dan diintegrasikan dari berbagai sumber.
Gambar 4.
Hasil Profiling Dosen Copyright A 2025 The Author.
Page 1356 This Journal is licensed under a Creative Commons Attribution 4.
0 International License BULLETIN OF COMPUTER SCIENCE RESEARCH ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
Setelah pengguna memilih salah satu dosen dari daftar pada halaman utama, sistem menampilkan halaman hasil analisis profil dosen secara detail.
Tampilan ini memuat informasi lengkap berupa identitas dosen, afiliasi program studi, dan ID publikasi ilmiah yang terhubung dengan Google Scholar.
Di bawah informasi dasar tersebut, sistem menampilkan hasil analisis bidang keilmuan yang terdiri dari lima bidang teratas yang paling sering muncul dalam publikasi dosen Hasil ini diperoleh melalui proses text mining dan cosine similarity terhadap data publikasi dari Google Scholar.
SINTA, dan Scopus.
Setiap bidang disertai dengan nilai kesesuaian dalam bentuk persentase, yang menggambarkan seberapa kuat korelasi antara tema penelitian dosen dengan bidang tersebut.
Selain bidang keilmuan, tampilan ini juga menampilkan bagian Rekomendasi Mata Kuliah yang berisi daftar mata kuliah yang sesuai dengan kompetensi dosen berdasarkan hasil analisis teks.
Setiap mata kuliah disertai dengan nilai kesesuaian, daftar publikasi relevan, serta indikator apakah mata kuliah tersebut pernah diajarkan oleh dosen yang Fitur ini membantu pihak fakultas dalam menentukan penugasan mengajar secara objektif berdasarkan rekam jejak publikasi ilmiah.
Di bagian bawah halaman, terdapat tombol AuDownload PDFAy yang memungkinkan pengguna mengunduh hasil analisis ke dalam format laporan untuk dokumentasi atau evaluasi lebih lanjut.
Gambar 5.
Analisis Bidang Ilmu Dosen Tampilan ketiga menampilkan halaman analisis bidang keilmuan dosen secara keseluruhan.
Pada bagian ini, pengguna dapat memilih satu atau beberapa bidang keilmuan tertentu seperti Artificial Intelligence atau Data Science melalui menu seleksi.
Setelah bidang keilmuan dipilih, sistem secara otomatis menampilkan daftar dosen yang paling relevan dengan bidang tersebut berdasarkan nilai kesesuaian yang dihasilkan dari perhitungan cosine similarity.
Data ditampilkan dalam bentuk tabel dengan kolom nama dosen, program studi, bidang keilmuan, dan skor kesesuaian.
Tampilan ini memberikan gambaran yang komprehensif mengenai sebaran kompetensi dosen di lingkungan fakultas, sehingga memudahkan pimpinan dalam proses pemetaan keahlian, penyusunan tim penelitian, maupun pengembangan kurikulum berbasis kompetensi.
Gambar 6.
Analisis Kesesuaian Mata Kuliah per Dosen Tampilan keempat memperlihatkan fitur analisis kesesuaian mata kuliah per dosen.
Halaman ini memungkinkan pengguna memilih program studi tertentu, misalnya Magister Ilmu Komputer, kemudian memilih mata kuliah spesifik seperti AuManajemen Informasi.
Ay Setelah pilihan ditetapkan, sistem akan menampilkan daftar dosen yang memiliki tingkat kesesuaian tertinggi terhadap mata kuliah tersebut.
Informasi yang ditampilkan meliputi nama dosen, program studi, skor kesesuaian, daftar publikasi ilmiah yang relevan, serta keterangan apakah dosen tersebut pernah mengajar mata kuliah tersebut sebelumnya.
Tampilan ini berfungsi sebagai alat bantu pengambilan keputusan bagi kaprodi atau dekan dalam menentukan dosen pengampu yang paling sesuai dengan kebutuhan kurikulum berdasarkan data objektif.
Secara keseluruhan, desain antarmuka aplikasi Profiling Dosen Fasilkom Esa Unggul berhasil menggabungkan fungsionalitas analitis dengan kesederhanaan tampilan yang ramah pengguna.
Setiap interaksi seperti pemilihan prodi, pemilihan bidang keilmuan, atau pencarian dosen diproses secara dinamis tanpa perlu memuat ulang halaman.
Copyright A 2025 The Author.
Page 1357 This Journal is licensed under a Creative Commons Attribution 4.
0 International License BULLETIN OF COMPUTER SCIENCE RESEARCH ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
memberikan pengalaman yang cepat dan efisien.
Tampilan data yang konsisten, warna kontras yang nyaman di mata, serta alur navigasi yang logis mendukung prinsip usability dan user experience yang baik.
Hasil pengujian internal menunjukkan bahwa pengguna dapat menelusuri data dosen dan menghasilkan laporan dalam waktu rata-rata di bawah dua detik untuk setiap interaksi, menandakan sistem memiliki performa antarmuka yang optimal.
Dengan demikian, antarmuka sistem ini tidak hanya berfungsi sebagai media visualisasi data, tetapi juga sebagai instrumen pendukung keputusan yang membantu institusi dalam memetakan kompetensi dosen secara komprehensif dan berbasis data.
3 Integrasi Data Multi-Platform Proses integrasi data untuk sistem Profil Dosen Fasilkom Esa Unggul menggabungkan data dari tiga platform utama:
Google Scholar.
SINTA, dan Scopus.
Ketiga platform ini memiliki format yang berbeda, sehingga memerlukan pengambilan, pembersihan, dan normalisasi data untuk analisis yang seragam.
Pengambilan data dari Google Scholar dilakukan menggunakan web scraping dengan BeautifulSoup4 dan Selenium WebDriver, karena Google Scholar tidak menyediakan API terbuka.
Data yang dikumpulkan meliputi nama dosen, afiliasi institusi, bidang penelitian yang diminati, publikasi ilmiah, jumlah sitasi, h-index, dan i10-index.
Data ini seringkali tidak terstruktur secara konsisten, sehingga memerlukan validasi dan standarisasi sebelum analisis lebih lanjut.
Integrasi dengan SINTA dilakukan menggunakan API resmi dari Kementerian Pendidikan.
Kebudayaan.
Riset, dan Teknologi, yang memungkinkan akses ke data publikasi terindeks, skor penelitian, jumlah kolaborasi, dan kategori bidang keilmuan.
Meskipun lebih terstruktur, integrasi ini menghadapi tantangan pada tahap autentikasi API, yang memerlukan token otorisasi, dan keterbatasan jumlah permintaan, yang mengharuskan penjadwalan pengambilan data secara berkala.
Integrasi dengan Scopus memanfaatkan API Elsevier, yang menyediakan data standar seperti metadata artikel.
DOI, nama jurnal, penerbit, tahun terbit, dan indeks sitasi.
Namun, tantangan utamanya adalah keterbatasan akses ke artikel non-akses terbuka dan variasi penamaan afiliasi universitas yang perlu direkonsiliasi di ketiga platform.
Untuk mengatasi hal ini, sistem menggunakan pencocokan string berbasis logika fuzzy untuk mengenali kesamaan nama meskipun terdapat sedikit perbedaan ejaa.
Setelah data dari ketiga sumber terkumpul, sistem menggabungkan dan menormalkan data berdasarkan nama dosen dan afiliasinya.
Data dari Google Scholar berfungsi sebagai referensi utama, sementara data dari SINTA dan Scopus melengkapi data numerik seperti skor penelitian dan jumlah sitasi.
Proses normalisasi meliputi konversi tanggal publikasi ke format ISO, standarisasi judul jurnal, dan penghapusan karakter yang tidak relevan.
Beberapa tantangan teknis muncul selama integrasi data multi-platform ini, seperti perbedaan struktur data dan ejaan nama dosen yang tidak Solusi yang diterapkan meliputi pembersihan data, pencocokan string, dan verifikasi manual untuk entitas dengan tingkat kemiripan di bawah 90%.
Lebih lanjut, pemetaan skema diimplementasikan untuk menstandardisasi struktur tabel di berbagai platform, seperti menggabungkan atribut "bidang_studi" dari Scopus, "bidang_subjek" dari SINTA, dan "bidang_minat" dari Google Scholar menjadi satu kolom "bidang_ilmiah" di basis data internal.
Hasil pengujian menunjukkan bahwa proses integrasi ini berhasil meningkatkan kelengkapan data sebesar 43%, sehingga menghasilkan profil dosen yang lebih komprehensif dan representatif.
Dengan proses integrasi data yang baik, sistem ini menjadi dasar yang kuat untuk analisis lebih lanjut, seperti pemetaan bidang ilmiah dan rekomendasi kursus.
2 Hasil Analisis Data Hasil analisis data pada sistem Profiling Dosen Fasilkom Esa Unggul diperoleh melalui penerapan algoritma TF-IDF (Term FrequencyAeInverse Document Frequenc.
dan Cosine Similarity terhadap kumpulan publikasi yang diambil dari Google Scholar.
SINTA, dan Scopus.
Analisis ini bertujuan untuk mengidentifikasi bidang keilmuan utama setiap dosen dan mengukur tingkat kesesuaian kompetensi mereka terhadap deskripsi mata kuliah yang tersedia di kurikulum fakultas.
Tahapan analisis dimulai dengan proses text preprocessing yang mencakup case folding, tokenizing, stopword removal, dan stemming untuk memastikan teks publikasi siap diolah.
Setiap dokumen publikasi dosen kemudian diubah menjadi representasi numerik menggunakan metode TF-IDF, di mana setiap kata memiliki bobot berdasarkan frekuensi kemunculannya dalam dokumen dan keseluruhan korpus.
Nilai TF-IDF ini menjadi dasar untuk membangun vektor yang menggambarkan fokus penelitian masing-masing dosen.
Langkah berikutnya adalah menghitung nilai kesamaan antara vektor bidang penelitian dosen dengan vektor deskripsi mata kuliah menggunakan algoritma Cosine Similarity.
Nilai kesamaan .
imilarity scor.
berkisar antara 0 hingga 1, di mana nilai yang mendekati 1 menunjukkan tingkat kecocokan yang tinggi antara kompetensi dosen dengan topik mata kuliah.
Hasil perhitungan ini disajikan dalam bentuk ranking yang menunjukkan urutan dosen paling relevan untuk setiap mata kuliah.
Dari hasil analisis yang dilakukan, sistem berhasil memetakan bidang keilmuan utama setiap dosen secara akurat.
Misalnya, dosen dengan fokus penelitian pada machine learning dan data mining memiliki nilai kesesuaian tinggi terhadap mata kuliah seperti Kecerdasan Buatan.
Analisis Data, dan Sistem Pendukung Keputusan.
Sebaliknya, dosen dengan fokus penelitian di bidang Information System Management cenderung memiliki skor tinggi pada mata kuliah Manajemen Informasi dan Analisis Sistem Informasi.
Secara keseluruhan, hasil analisis menunjukkan bahwa penerapan algoritma TF-IDF dan Cosine Similarity mampu memberikan hasil yang konsisten dan sesuai dengan bidang keahlian aktual dosen.
Tingkat akurasi sistem dalam memetakan kesesuaian kompetensi terhadap mata kuliah mencapai lebih dari 85% berdasarkan uji validasi internal terhadap data fakultas.
Temuan ini membuktikan bahwa pendekatan berbasis text mining dan similarity analysis efektif digunakan untuk mendukung proses pengambilan keputusan akademik yang objektif dan berbasis data.
Copyright A 2025 The Author.
Page 1358 This Journal is licensed under a Creative Commons Attribution 4.
0 International License BULLETIN OF COMPUTER SCIENCE RESEARCH ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
1 Hasil Preprocessing Teks Tahapan preprocessing teks dilakukan untuk menyiapkan data publikasi dan deskripsi mata kuliah agar dapat dianalisis secara akurat oleh algoritma TF-IDF dan Cosine Similarity.
Proses ini bertujuan mengubah teks mentah yang tidak terstruktur menjadi bentuk bersih dan seragam, sehingga setiap kata memiliki makna yang representatif terhadap konteks penelitian dosen.
Data awal yang digunakan terdiri atas kumpulan judul dan abstrak publikasi dari Google Scholar.
SINTA, dan Scopus, serta deskripsi mata kuliah dari kurikulum Fakultas Ilmu Komputer.
Setiap teks mengalami proses case folding dengan mengubah seluruh huruf menjadi huruf kecil, diikuti dengan tokenizing untuk memisahkan setiap kata berdasarkan spasi dan tanda baca.
Tahap selanjutnya adalah stopword removal, yaitu penghapusan kata umum yang tidak memiliki makna signifikan dalam analisis seperti AudanAy.
AuyangAy.
AupadaAy, atau AudalamAy.
Proses terakhir adalah stemming, yang mengembalikan setiap kata ke bentuk dasarnya agar kata seperti AupembelajaranAy.
AubelajarAy, dan AubelajarnyaAy dianggap sama.
Algoritma Nazief-Adriani Stemmer digunakan untuk teks berbahasa Indonesia, sementara Porter Stemmer digunakan untuk publikasi berbahasa Inggris.
Setelah seluruh proses dilakukan, data teks menjadi lebih padat dan relevan untuk perhitungan bobot kata menggunakan TF-IDF.
Sebagai contoh, judul publikasi AuImplementasi Pembelajaran Mesin untuk Prediksi Kinerja Akademik MahasiswaAy setelah melalui preprocessing menjadi Auimplementasi belajar mesin prediksi kinerja akademik mahasiswaAy.
Begitu pula deskripsi mata kuliah AuMata kuliah ini membahas konsep dasar machine learning dan penerapannya dalam data analisisAy diubah menjadi Aukonsep dasar machine learning penerapan data analisisAy.
Hasil ini menunjukkan penghilangan kata tidak penting dan penyamaan bentuk kata, yang meningkatkan ketepatan analisis kemiripan antar-teks.
Dari keseluruhan 1.
250 publikasi dan 48 deskripsi mata kuliah yang dianalisis, rata-rata jumlah kata per dokumen berkurang dari 26 kata menjadi 14 kata setelah proses cleaning.
Sekitar 42% dari total kata dihapus karena termasuk dalam daftar stopwords.
Proses stemming berhasil mengurangi variasi kata hingga 31%, yang berarti sistem dapat mengenali konteks kata secara lebih efisien.
Dengan hasil preprocessing ini, data menjadi lebih bersih dan terstandarisasi, sehingga tahap perhitungan TF-IDF dan Cosine Similarity dapat berjalan lebih cepat dan menghasilkan nilai kesesuaian yang lebih akurat antara publikasi dosen dan deskripsi mata kuliah.
2 Perhitungan TF Ae IDF dan Cosine Similarity Tahapan utama dalam proses analisis data pada sistem Profiling Dosen Fasilkom Esa Unggul adalah penerapan algoritma TF-IDF (Term FrequencyAeInverse Document Frequenc.
dan Cosine Similarity untuk mengukur tingkat kesesuaian antara bidang riset dosen dan deskripsi mata kuliah.
Kedua algoritma ini digunakan secara berurutan, di mana TF-IDF berfungsi mengubah teks menjadi representasi numerik berbentuk vektor, sementara Cosine Similarity digunakan untuk menghitung tingkat kemiripan antar-vektor tersebut.
Metode TF-IDF memberikan bobot pada setiap kata dalam dokumen berdasarkan seberapa sering kata tersebut muncul dalam satu dokumen .
erm frequenc.
dan seberapa jarang kata itu muncul dalam keseluruhan kumpulan dokumen .
nverse document frequenc.
Dengan pendekatan ini, kata-kata yang umum seperti AudataAy.
AuanalisisAy, atau AusistemAy akan memiliki bobot rendah, sedangkan kata yang lebih spesifik seperti Aumachine learningAy atau Auinformation retrievalAy akan memiliki bobot tinggi.
Setiap publikasi dosen dan deskripsi mata kuliah kemudian direpresentasikan sebagai vektor numerik yang berisi bobot TF-IDF untuk setiap kata penting.
Langkah selanjutnya adalah menghitung tingkat kemiripan antar-vektor menggunakan Cosine Similarity, yang mengukur sudut antara dua vektor dalam ruang multidimensi.
Nilai Cosine Similarity berkisar antara 0 hingga 1, di mana nilai mendekati 1 menunjukkan tingkat kesesuaian yang tinggi antara bidang penelitian dosen dan topik mata kuliah.
Sebagai contoh hasil perhitungan, dosen dengan bidang riset Machine Learning memperoleh nilai similarity 92 terhadap mata kuliah Kecerdasan Buatan, 0.
88 terhadap Analisis Data, dan 0.
84 terhadap Data Mining.
Sementara itu, dosen dengan fokus riset Information System memiliki nilai similarity 0.
89 terhadap mata kuliah Manajemen Informasi dan 0.
86 terhadap Analisis Kebutuhan Informasi.
Data hasil perhitungan ini kemudian disajikan dalam bentuk tabel dan visualisasi grafik peringkat kesesuaian.
Tabel 2.
Hasil Perhitungan Tingkat Kesesuaian Dosen dan Matakuliah Nama Dosen Bidang Riset Mata Kuliah NUGROHO BUDHISANTOSA.
ST,
MMSI.
ALIVIA YULFITRI.
SI.
ARY PRABOWO.
Kom.
Mkom DR.
BUDI TJAHJONO.
Kom.
Kom.
SANDFRENI.
SI.
Machine Learning Kecerdasan Buatan Data Science Artificial Intelligence Information Systems Software Engineering Analisis Data Data Mining Manajem Informasi Analisis Kebutuhan Informasi Nilai Similarity Dari hasil tersebut, sistem secara otomatis menampilkan grafik peringkat kesesuaian (Top 5 Dosen Paling Releva.
untuk setiap mata kuliah.
Grafik ini divisualisasikan dalam bentuk diagram batang yang memperlihatkan nilai Cosine Similarity pada sumbu vertikal dan nama dosen pada sumbu horizontal.
Visualisasi ini membantu pihak fakultas melihat secara cepat siapa saja dosen yang paling sesuai untuk mengampu mata kuliah tertentu berdasarkan hasil analisis berbasis Secara keseluruhan, kombinasi algoritma TF-IDF dan Cosine Similarity terbukti efektif dalam merepresentasikan Copyright A 2025 The Author.
Page 1359 This Journal is licensed under a Creative Commons Attribution 4.
0 International License BULLETIN OF COMPUTER SCIENCE RESEARCH ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
bidang penelitian dosen dan menilai kecocokannya dengan kurikulum.
Hasil perhitungan menunjukkan konsistensi tinggi antara nilai similarity yang dihasilkan oleh sistem dengan keahlian aktual dosen di bidang masing-masing, sehingga sistem ini dapat dijadikan alat bantu yang andal dalam proses pemetaan kompetensi akademik.
3 Evaluasi Akurasi Pemetaan Tahapan evaluasi dilakukan untuk mengukur sejauh mana sistem Profiling Dosen Fasilkom Esa Unggul mampu memetakan bidang keilmuan dosen secara akurat terhadap mata kuliah yang relevan.
Pengujian dilakukan dengan membandingkan hasil pemetaan otomatis sistem dengan data validasi manual .
round trut.
yang diperoleh dari pihak Data validasi ini berisi penugasan mata kuliah aktual yang selama ini diampu oleh dosen berdasarkan keputusan program studi.
Untuk mengukur performa sistem, digunakan tiga metrik utama yaitu precision, recall, dan F1-score.
Metrik precision menunjukkan tingkat ketepatan hasil rekomendasi sistem seberapa banyak mata kuliah yang direkomendasikan benar-benar sesuai dengan bidang keahlian dosen.
Sementara itu, recall mengukur sejauh mana sistem berhasil menemukan seluruh kecocokan yang seharusnya ada dalam data validasi manual.
F1-score, sebagai rata-rata harmonik antara precision dan recall, memberikan ukuran tunggal yang komprehensif mengenai keseimbangan kinerja sistem dalam mengidentifikasi relevansi dan kelengkapan pemetaan.
Perhitungan masing-masing metrik dilakukan menggunakan rumus berikut:
ycNycE ycEycyceycaycnycycnycuycuA = A ycNycE yaycEA ycNycE ycIyceycaycaycoycoA = A ycNycE yaycA .
cEycyceycaycnycycnycuycuAyAycIyceycaycaycoyc.
ya1 Oe ycIycaycuycyceA = A2A y .
cEycyceycaycnycycnycuycuA AycIyceycaycaycoyc.
Keterangan:
TP (True Positiv.
: pasangan dosenAemata kuliah yang benar dipetakan oleh sistem sesuai hasil validasi manual.
FP (False Positiv.
: pasangan yang direkomendasikan sistem tetapi tidak sesuai dengan data validasi.
FN (False Negativ.
: pasangan yang seharusnya sesuai namun tidak terdeteksi oleh sistem.
Nilai F1-score kemudian digunakan sebagai ukuran keseimbangan antara precision dan recall.
Hasil evaluasi menunjukkan bahwa sistem mencapai nilai precision sebesar 0.
87, recall sebesar 0.
83, dan F1-score sebesar 0.
85 pada data uji sebanyak 120 pasangan dosen mata kuliah.
Angka ini menunjukkan bahwa sebagian besar hasil pemetaan sistem sesuai dengan data aktual fakultas.
Sebagai contoh, untuk kelompok dosen dengan fokus penelitian di bidang machine learning dan data science, sistem berhasil merekomendasikan mata kuliah Kecerdasan Buatan.
Analisis Data, dan Data Mining yang memang sesuai dengan hasil validasi manual.
Perbandingan hasil sistem dengan ground truth menunjukkan tingkat kesesuaian yang tinggi pada bidang-bidang dengan terminologi teknis yang konsisten, sementara sedikit penurunan akurasi terjadi pada bidang yang memiliki deskripsi umum seperti manajemen sistem informasi atau komputasi terapan, karena perbedaan istilah yang digunakan antar-dosen dan kurikulum.
Meski demikian, rata-rata kesalahan masih tergolong kecil dan tidak memengaruhi keandalan sistem secara keseluruhan.
Dari hasil evaluasi tersebut dapat disimpulkan bahwa model pemetaan berbasis TF-IDF dan Cosine Similarity mampu menghasilkan tingkat akurasi yang tinggi serta sesuai dengan ekspektasi.
Pemetaan yang dihasilkan tidak hanya mendekati hasil validasi manual, tetapi juga memberikan konsistensi dan objektivitas yang lebih baik dibandingkan metode manual yang cenderung subjektif.
Dengan demikian, sistem ini dapat dianggap valid untuk digunakan sebagai alat bantu dalam pengambilan keputusan akademik, khususnya dalam penugasan mengajar dan perencanaan pengembangan kompetensi dosen di lingkungan fakultas.
3 Pengujian Sistem Pengujian sistem Profiling Dosen Fasilkom Esa Unggul dilakukan untuk menilai kinerja .
dan tingkat ketergunaan .
aplikasi setelah seluruh komponen sistem berhasil diimplementasikan.
Pengujian ini bertujuan memastikan bahwa sistem tidak hanya berfungsi dengan benar secara teknis, tetapi juga memberikan pengalaman pengguna yang baik bagi dekan, kaprodi, maupun staf akademik sebagai pengguna utama.
Dari sisi performansi, pengujian dilakukan dengan mengukur waktu respons sistem, kecepatan pemrosesan data, serta konsumsi sumber daya selama proses analisis dan integrasi data berlangsung.
Berdasarkan hasil uji beban .
oad testin.
, rata-rata waktu pemrosesan satu permintaan analisis data dosen hingga menampilkan hasil rekomendasi mata kuliah adalah 1,82 detik, dengan tingkat keberhasilan respons mencapai 99,1%.
Penggunaan memori dan prosesor juga terpantau stabil pada kisaran 68%, yang menunjukkan bahwa sistem mampu berjalan secara efisien bahkan saat mengakses data dari ketiga sumber eksternal (Google Scholar.
SINTA, dan Scopu.
secara bersamaan.
Selain itu, proses scraping dan analisis teks juga berhasil berjalan secara paralel tanpa menyebabkan keterlambatan pada antarmuka pengguna .
rontend Streamli.
Dari sisi usability, pengujian dilakukan dengan melibatkan 30 responden yang terdiri atas dosen, kaprodi, dan staf akademik menggunakan metode System Usability Scale (SUS).
Setiap responden diminta untuk menilai kemudahan navigasi, kejelasan tampilan, kecepatan akses, serta kemudahan dalam memahami hasil analisis yang ditampilkan oleh Hasil pengujian menunjukkan skor rata-rata SUS sebesar 86,4, yang dikategorikan sebagai tingkat kepuasan AuExcellentAy.
Mayoritas pengguna menyatakan bahwa tampilan antarmuka mudah dipahami, interaksi antar-menu terasa responsif, dan hasil analisis ditampilkan dengan visual yang informatif.
Secara umum, hasil pengujian menunjukkan bahwa sistem memiliki performa yang stabil, respons cepat, serta antarmuka yang mudah digunakan.
Tidak ditemukan Copyright A 2025 The Author.
Page 1360 This Journal is licensed under a Creative Commons Attribution 4.
0 International License BULLETIN OF COMPUTER SCIENCE RESEARCH ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
kendala berarti selama proses uji coba, selain waktu pemrosesan sedikit lebih lama pada tahap pengambilan data awal dari Scopus akibat batasan akses API.
Dengan performa dan tingkat kepuasan pengguna yang tinggi, sistem ini dinilai siap diimplementasikan secara lebih luas sebagai alat bantu pengambilan keputusan akademik berbasis data di lingkungan Fakultas Ilmu Komputer Universitas Esa Unggul.
1 Functional Testing Uji fungsional dilakukan menggunakan metode black-box testing untuk memverifikasi bahwa seluruh fitur utama sistem bekerja sesuai dengan spesifikasi yang ditetapkan.
Pengujian dilakukan tanpa melihat kode program, melainkan dengan mengamati keluaran sistem berdasarkan masukan pengguna.
Setiap modulAimulai dari proses login, pengambilan data dari Google Scholar.
SINTA, dan Scopus, hingga perhitungan kesesuaian dan pembuatan laporan PDFAidiperiksa satu per satu untuk memastikan sistem berfungsi normal.
Hasil pengujian black-box menunjukkan bahwa seluruh fungsionalitas utama sistem Profiling Dosen Fasilkom Esa Unggul, termasuk fitur login, integrasi data dari berbagai sumber, dan pembuatan laporan, berhasil terpenuhi 100%.
Selain itu.
Hasil pengujian menunjukkan bahwa seluruh fungsi utama dapat berjalan dengan baik tanpa kesalahan Beberapa bug minor ditemukan pada tahap awal, terutama pada tampilan tabel hasil analisis yang kadang tidak menyesuaikan ukuran layar, serta keterlambatan kecil saat menampilkan grafik pada perangkat dengan spesifikasi rendah.
Namun, permasalahan tersebut telah diperbaiki dengan melakukan optimasi tampilan dan pemuatan data asinkron pada Streamlit.
Tabel 3.
Hasil Pengujian Setiap Fitur Sistem Fitur yang Diuji Login dan otentikasi pengguna Pengambilan data Google Scholar Integrasi API SINTA Integrasi API Scopus Analisis TF-IDF dan Cosine Similarity Tampilan hasil dan grafik Streamlit Pembuatan laporan PDF Hasil Pengujian Berhasil Berhasil Berhasil Berhasil Keterangan Berhasil Validasi akun admin dan kaprodi berjalan normal.
Data publikasi dan sitasi berhasil diambil melalui scraping.
Data skor dan publikasi nasional terhubung tanpa error.
Data metadata artikel berhasil diakses menggunakan API key Nilai kesesuaian berhasil dihitung dengan benar.
Berhasil Hasil analisis tampil interaktif, responsif, dan informatif.
Berhasil Laporan hasil analisis dapat diunduh tanpa kesalahan format.
Secara keseluruhan, pengujian fungsional menunjukkan tingkat keberhasilan 100% untuk seluruh fitur utama, menandakan bahwa sistem sudah stabil dan siap digunakan dalam lingkungan operasional fakultas.
2 Performance Testing Pengujian performa dilakukan untuk menilai kecepatan, efisiensi, dan stabilitas sistem ketika memproses data dalam berbagai kondisi penggunaan.
Pengujian dilakukan dengan mengukur waktu respons, waktu pemrosesan analisis, serta penggunaan sumber daya (CPU dan memor.
pada skenario jumlah pengguna dan ukuran data yang berbeda.
Pada pengujian dengan 1 hingga 5 pengguna aktif secara bersamaan, rata-rata waktu respon sistem dalam menampilkan hasil analisis adalah 1,82 detik, sedangkan waktu terlama yang tercatat adalah 2,4 detik ketika sistem melakukan integrasi data besar dari ketiga platform sekaligus.
Penggunaan CPU berada di kisaran 68%, dan konsumsi memori rata-rata sebesar 540 MB, yang masih dalam batas efisien untuk server berbasis container.
Pada skenario beban lebih tinggi .
pengguna simultan dan 500 entri publikasi per dose.
, sistem tetap dapat menampilkan hasil dengan rata-rata waktu respon 3,1 detik, tanpa terjadi penurunan performa signifikan atau kegagalan koneksi API.
Hal ini menunjukkan bahwa arsitektur sistem yang memisahkan proses pengambilan data, analisis teks, dan visualisasi berjalan efektif untuk menjaga kestabilan Berdasarkan hasil pengujian performa, dapat disimpulkan bahwa sistem memiliki tingkat efisiensi tinggi dan mampu menangani beban data besar dengan waktu respon yang konsisten.
Kombinasi framework Streamlit dan pemrosesan Python dinilai cukup optimal untuk implementasi di lingkungan akademik dengan jumlah pengguna moderat.
Dengan hasil ini, sistem dapat dikatakan siap digunakan untuk operasional harian tanpa perlu penyesuaian signifikan pada KESIMPULAN Penelitian ini berhasil mengembangkan sistem Profiling Dosen Berbasis Streamlit dengan integrasi data dari Google Scholar.
SINTA, dan Scopus untuk pemetaan kompetensi mata kuliah menggunakan metode TF-IDF dan Cosine Similarity.
Arsitektur sistem dirancang secara modular dengan pemisahan fungsi antara pengelolaan data, pemrosesan teks, visualisasi hasil, dan pelaporan agar proses analisis berjalan terstruktur dan efisien.
Hasil pengujian menunjukkan bahwa sistem mencapai tingkat akurasi pemetaan sebesar 85% dengan nilai F1-Score 0,85, rata-rata waktu respons 1,82 detik, serta skor System Usability Scale (SUS) sebesar 86,4 yang termasuk kategori Excellent.
Nilai-nilai tersebut Copyright A 2025 The Author.
Page 1361 This Journal is licensed under a Creative Commons Attribution 4.
0 International License BULLETIN OF COMPUTER SCIENCE RESEARCH ISSN 2774-3659 (Media Onlin.
Vol 5.
No 6.
October 2025 | Hal 1351-1362 https://hostjournals.
com/bulletincsr DOI: 10.
47065/bulletincsr.
membuktikan bahwa aplikasi mampu memberikan hasil analisis yang akurat, responsif, dan mudah digunakan.
Dengan demikian, sistem ini efektif mendukung proses pengambilan keputusan akademik berbasis data untuk penugasan dosen sesuai bidang keahliannya serta memiliki potensi untuk dikembangkan lebih lanjut dalam pengelolaan sumber daya manusia akademik di perguruan tinggi.
REFERENCES