Klasifikasi artikel jurnal ekonomi berdasarkan judul dan abstrak menggunakan k-nearest neighbor berbasis bigram frekuensi / Jeanny Indra Rifani

Rifani, Jeanny Indra (2020) Klasifikasi artikel jurnal ekonomi berdasarkan judul dan abstrak menggunakan k-nearest neighbor berbasis bigram frekuensi / Jeanny Indra Rifani. Diploma thesis, Universitas Negeri Malang.

Full text not available from this repository.

Abstract

RINGKASAN Rifani, Jeanny Indra. 2019. Klasifikasi Artikel Jurnal Ekonomi Berdasarkan Judul dan Abstrak Menggunakan K-Nearest Neighbor Berbasis Bigram Frekuensi. Skripsi, Program studi S1 Teknik Informatika, Jurusan Elektro, Fakultas Teknik, Universitas Negeri Malang. Pembimbing : Aji Prasetya Wibawa, S.T., M.M.T., Ph. D. dan Harits Ar Rosyid, S.T., M.T., Ph.D. Keywords — Klasifikasi Teks, N-Grams, Cosine Similarity, K-Nearest Neighbor. Dalam artikel ilmiah, rujukan berfungsi sebagai media yang dapat dipercaya untu mendukung suatu gagasan dalam penelitian ilmiah. Kumpulan dari artikel ilmiah atau laporan penelitian terdahulu dapat ditemukan dengan mudah dalam jurnal nasional maupun internasional. Untuk dapat membantu mendukung gagasan dalam penelitian ilmiah, rujukan yang digunakan harus memiliki kesesuaian topik dengan penelitian yang dilakukan. Kesesuaian topik ini ditandai dengan kumpulan artikel ilmiah yang serupa, akan masuk dalam kategori kelas yang sama. Pada beberapa kasus terjadi kesalahan dalam proses pengelompokan artikel ilmiah, sehingga beberapa artikel ilmiah masuk dalam kategori topik yang berbeda. Untuk mengurangi kesalahan tersebut, digunakan teknik klasifikasi dengan menggunakan Machine Learning untuk mengelompokkan artikel ilmiah dalam bentuk dokumen digital. Akan tetapi, teknik Machine Learning umum tidak dapat digunakan pada dokumen yang mengandung istilah kata yang terdiri dari pasangan kata atau lebih. Hal ini terjadi karena proses pengelompokan yang dilakukan adalah memotong kalimat menjadi kata per kata, sehingga dapat menyebabkan kesalahan dalam proses pengelompokan. Oleh sebab itu digunakan metode N-Grams untuk membantu mempertahankan relasi antar kata, dimana teknik ini akan memotong kalimat menjadi n bagian. Penelitian ini akan membandingkan penggunaan N-Grams, dimana nilai n= 1 dan n=2. Kemudian, digunakan pembobotan TF-IDF untuk menghitung frekuensi kemunculan atau bobot suatu kata dalam suatu dokumen dan terhadap seluruh dokumen. Algoritma klasifikasi yang digunakan adalah K-Nearest Neighbor dimana nilai k=1 dan menggunakan perhitungan jarak Cosine Similarity. Sebagai tahap pengujian digunakan Cross Validation sebanyak 6 putaran, dimana 21 instance merupakan data uji dan 105 instances merupakan data latih. Berdasarkan hasil penelitian, akurasi tertinggi didapatkan oleh skenario 2 tanpa menggunakan N-Grams; yaitu sebesar 61.90% dan nilai F-Measure sebesar 62.84%.

Item Type: Thesis (Diploma)
Subjects: ?? ??
Divisions: Fakultas Teknik (FT) > Jurusan Teknik Elektro (TE) > S1 Teknik Informatika
Depositing User: Users 2 not found.
Date Deposited: 04 Feb 2020 04:29
Last Modified: 09 Sep 2020 03:00
URI: http://repository.um.ac.id/id/eprint/99054

Actions (login required)

View Item View Item