Perbandingan Algoritma Edit Distance, Levenshtein Distance, Hamming Distance, Jaccard Similarity Dalam Mendeteksi String Matching

Susi Rianti, Riza Adrianti Supono

Sari


Saat sekarang ini dunia membutuhkan pencaraian yang cepat, tepat dan efisien. Pencarian yang dilakukan  Penulis tertarik untuk membandingkan algoritma string matching  karena belum ada yang membandingkan empat algoritma yaitu algoritma Edit Distance, Levenshtein, Hamming dan Jaccard similarity. Tujuan penulisan ini membandingkan  kecepatan akses 4 (empat) algoritma yaitu, algoritma Edit Distance, Levenstein Distance, Humming Distance,  dan Jaccard Similarity mana yang lebih cepat, tepat dengan tingkat error yang rendah, menentukan sililaritas dokumen,  dalam pencarian. Hal ini diakibatkan karena sering terjadi kesalahan pengetikan sehingga terjadi kesalahan ejaan. Kesalahan pengetikan ini biasanya  terjadi saat adalah, penghapusan, penambahan, pengantian  serta modofikasi data. Penulis mengunakan  data dari kamus besar bahasa Indonesia yang meliputi kata dasar, kata ber-awalan,  kata ber-akhiran, kata ber-imbuhan, kata sambung, kata depan, dan kata yang termasuk dalam kata bahasa baku.  Metode evaluasi yang dipakai dalam penelelitian ini adalah mAP bahasa pemograman yang digunakan adalah C++. Berdasarkan ujicoba yang dilakukan rata-rata waktu pencarian terhadap algorima Edit Distance = 47,55 ms, Levensthtein Distance = 13,125 ms, Hamming Distance = 14,25 ms, dan Jaccard similarity = 37,125 ms  Ini berarti Levenshtein Distance memiliki waktu pencarian tercepat.


Teks Lengkap:

PDF

Referensi


Awaludin, M. (2015) ‘Penerapan Metode Distance Transform Pada Linear Discriminant Analysis Untuk Kemunculan Kulit Pada Deteksi Kulit’, Journal of Intelligent Systems, 1(1), pp. 49–55.

Awaludin, M. and Yasin, V. (2020) ‘APPLICATION OF ORIENTED FAST AND ROTATED BRIEF ( ORB ) AND BRUTEFORCE HAMMING IN LIBRARY OPENCV FOR CLASSIFICATION OF e-ISSN : 2598-8719 ( Online )’, Journal of Information System, Applied, Managemgent, Accounting, and Reserarch, 4(3), pp. 51–59.

Cse, U. W. (2017) ‘Algorithmic complexity : Speed of algorithms How fast does your program run ?’, pp. 1–18.

Gulo, Y. N. (2022) ‘Penerapan Algoritma Hamming Distance Untuk Pencarian Teks Pada Aplikasi Ensiklopedia Indonesia’, 1(2), pp. 50–54.

Hakak, S. et al. (2019) ‘Exact String Matching Algorithms ’:, IEEE Access. IEEE, PP(c), p. 1. doi: 10.1109/ACCESS.2019.2914071.

Indriani, A. et al. (2018) ‘IMPLEMENTASI JACCARD INDEX DAN N-GRAM PADA REKAYASA’, 2621–069X, pp. 95–101.

Iskandar, I. D. (2018) ‘IMPLEMENTASI ALGORITMA EDIT DISTANCE PADA PENGEMBANGAN APLIKASI E-LEARNING BSI’.

Prakoso, R. P., Wahyudi, E. and Masykuroh, K. (2021) ‘Optimalisasi Bit Error Rate (BER) Jaringan Optik Hybrid Pada Sistem DWDM Berbasis Soliton’, Journal of Telecommunication, Electronics, and Control Engineering (JTECE), 3(2), pp. 62–70. doi: 10.20895/jtece.v3i2.320.

Ryu, C. and Park, K. (2018) ‘Improved pattern-scan-order algorithms for string matching ✩’, Journal of Discrete Algorithms. Elsevier B.V., 49, pp. 27–36. doi: 10.1016/j.jda.2018.05.002.

Sistem, R. (2017) ‘JURNAL RESTI’, 1(1), pp. 19–25.

Sort, B. and Sort, Q. (2022) ‘Performa Algoritma Bubble Sort Dan Quick Sort Pada Framework Flutter Dan Dart SDK ( Studi Kasus Aplikasi E-Commerce )’, 9(2), pp. 806–816.

Yousaf, M. M. et al. (2018) ‘Computation To cite this version ’:




DOI: https://doi.org/10.35968/jsi.v10i1.1010

Refbacks

  • Saat ini tidak ada refbacks.


Indexed by: