Penerapan metode cosine similarity dengan pengurangan konten judul dan abstrak berbasis frequency untuk klasifikasi artikel jurnal / Piska Dwi Nurfadila

Nurfadila, Piska Dwi (2019) Penerapan metode cosine similarity dengan pengurangan konten judul dan abstrak berbasis frequency untuk klasifikasi artikel jurnal / Piska Dwi Nurfadila. Diploma thesis, Universitas Negeri Malang.

Full text not available from this repository.

Abstract

RINGKASAN Piska Dwi Nurfadila. 2019.Penerapan Metode Cosine Similaritydengan Pengurangan Konten Judul dan Abstrak Berbasis Frequency untuk Klasifikasi Artikel Jurnal. Skripsi. Jurusan Teknik Elektro, Fakultas Teknik, Universitas Negeri Malang. Pembimbing. (I)Aji Prasetya Wibawa, S.T., M.M.T., Ph.D. (II) Ilham Ari ElbaithZaeni, S.T., M.T., Ph.D. Keywords : Klasifikasi text, Stopword removal,Frequency, Cosine Similarity, K-Fold Cross Validation Pencarian informasi dari sekumpulan dokumen berupa text dapat dilakukan dengan menggunakan metode klasifikasi. Sebelum diklasifikasikan, dokumen akan melalui tahap pre-processing. Beberapa tahap pre-processing yaitu : mengubah huruf kapital menjadi huruf kecil, menghilangkan angka dan tanda baca, stopword removal dan stemming.Dari beberapa tahapan pre-processing, yang sering digunakan adalah stopword removal. Pada penelitian ini membandingkan kinerja metode cosine similarity tanpa menerapkan tahap stopword removal dengan metode cosine similarity yang menambahkan tahap penghapusan kata berdasarkan frequency. Untuk menentukan batas frequency paling tepat dilakukan empat skenario penghapusan kata. Skenario pertama pengapusan kata dari nilai terkecil, skenario kedua pengapusan kata dari nilaiterbesar, skenario ketiga penghapusan kata dari nilai tengah dan skenario keempat penghapusan kata dari nilai lebih dari dan kurang dari. Percobaan yang dilakukan pada tiap skenario berbeda-beda. Pengujian kinerja metode dilakukan dengan menggunakan K-fold Cross Validation dengan output berupa nilai accuracy, precision, dan recall. Selain itu juga dihitung perbandingan nilai execution time dari kedua penelitian. Hasil penelitian ini menunjukkan nilai accuracytertinggi yang dihasilkan sebesar 64,28%. Peningkatan kinerja nilai accuracy dari penelitian sebelumnya kurang lebih sebesar 4%.Execution time yang dibutuhkan pada tahap pre-processing yaitu 59,406 seconds. Untuk execution time pada tahap klasifikasi lebih cepat yaitu 0,05302 seconds.

Item Type: Thesis (Diploma)
Subjects: ?? ??
Divisions: Fakultas Teknik (FT) > Jurusan Teknik Elektro (TE) > S1 Teknik Informatika
Depositing User: Users 2 not found.
Date Deposited: 12 Nov 2019 04:29
Last Modified: 09 Sep 2019 03:00
URI: http://repository.um.ac.id/id/eprint/99033

Actions (login required)

View Item View Item