Analisis Perbandingan Algoritma BM25 dan TF-IDF untuk Temu Kembali Metadata Jurnal Indonesia pada Temujurnal.com

  • Muhamad Syarif Fakultas Teknik dan Informatika, Universitas Bina Sarana Informatika
  • Rabiatus Sa’adah Fakultas Teknik dan Informatika, Universitas Bina Sarana Informatika
  • M Rafi Ardana Listi Fakultas Teknik dan Informatika, Universitas Bina Sarana Informatika
  • Ravi Manisha Fakultas Teknik dan Informatika, Universitas Bina Sarana Informatika
Keywords: BM25, TF-IDF, Temu Kembali Informasi, Metadata Jurnal, Temujurnal.com

Abstract

Peningkatan volume publikasi ilmiah di Indonesia melalui sistem jurnal elektronik menuntut adanya mekanisme pencarian yang efisien bagi para peneliti. Temujurnal.com merupakan platform agregator yang mengelola kumpulan jurnal nasional, Temujurnal memiliki fitur pencarian dan kategori mencakup variabel tekstual seperti nama, singkatan, penerbit, dan deskripsi, serta filter seperti peringkat Sinta, periode terbit dan biaya publikasi. Penelitian ini bertujuan untuk melakukan analisis perbandingan performa antara algoritma Term Frequency-Inverse Document Frequency (TF-IDF) dan Best Matching 25 (BM25) dalam sistem temu kembali informasi jurnal Indonesia. Metodologi yang digunakan mencakup tahap pra-pemrosesan teks menggunakan algoritma Stemming dan penerapan logika Hybrid Retrieval. Pengujian dilakukan terhadap 100 metadata jurnal dengan 20 kueri uji yang diukur melalui metrik Precision, Recall, F1-Score, dan Mean Average Precision (MAP). Hasil penelitian menunjukkan bahwa algoritma BM25 mengungguli TF-IDF dengan perolehan nilai MAP sebesar 0,74 berbanding 0,59. BM25 mencapai nilai Precision sebesar 0,78, menunjukkan stabilitas yang lebih baik dalam menangani variasi panjang metadata melalui parameter normalisasi b=0,75 dan saturasi k1=1,2. Penelitian ini merekomendasikan implementasi BM25 pada platform Temujurnal untuk meningkatkan akurasi dan efisiensi penemuan literatur ilmiah nasional.

Published
2025-12-29