Analisis Perbandingan Algoritma BM25 dan TF-IDF untuk Temu Kembali Metadata Jurnal Indonesia pada Temujurnal.com
Abstract
Peningkatan volume publikasi ilmiah di Indonesia melalui sistem jurnal elektronik menuntut adanya mekanisme pencarian yang efisien bagi para peneliti. Temujurnal.com merupakan platform agregator yang mengelola kumpulan jurnal nasional, Temujurnal memiliki fitur pencarian dan kategori mencakup variabel tekstual seperti nama, singkatan, penerbit, dan deskripsi, serta filter seperti peringkat Sinta, periode terbit dan biaya publikasi. Penelitian ini bertujuan untuk melakukan analisis perbandingan performa antara algoritma Term Frequency-Inverse Document Frequency (TF-IDF) dan Best Matching 25 (BM25) dalam sistem temu kembali informasi jurnal Indonesia. Metodologi yang digunakan mencakup tahap pra-pemrosesan teks menggunakan algoritma Stemming dan penerapan logika Hybrid Retrieval. Pengujian dilakukan terhadap 100 metadata jurnal dengan 20 kueri uji yang diukur melalui metrik Precision, Recall, F1-Score, dan Mean Average Precision (MAP). Hasil penelitian menunjukkan bahwa algoritma BM25 mengungguli TF-IDF dengan perolehan nilai MAP sebesar 0,74 berbanding 0,59. BM25 mencapai nilai Precision sebesar 0,78, menunjukkan stabilitas yang lebih baik dalam menangani variasi panjang metadata melalui parameter normalisasi b=0,75 dan saturasi k1=1,2. Penelitian ini merekomendasikan implementasi BM25 pada platform Temujurnal untuk meningkatkan akurasi dan efisiensi penemuan literatur ilmiah nasional.
Copyright (c) 2025 Jurnal ICT: Information Communication & Technology

This work is licensed under a Creative Commons Attribution 4.0 International License.





