Klarifikasi beban baca berdasarkan lexile levels menggunakan metode K-Means clustering dan Naive Bayes multinomial / Muhammad Fahmi Hidayat - Repositori Universitas Negeri Malang

Klarifikasi beban baca berdasarkan lexile levels menggunakan metode K-Means clustering dan Naive Bayes multinomial / Muhammad Fahmi Hidayat

Hidayat, Muhammad Fahmi (2019) Klarifikasi beban baca berdasarkan lexile levels menggunakan metode K-Means clustering dan Naive Bayes multinomial / Muhammad Fahmi Hidayat. Diploma thesis, Universitas Negeri Malang.

Full text not available from this repository.

Abstract

RINGKASAN Hidayat Muhammad Fahmi. 2019. Klasifikasi Beban Baca Berdasarkan Lexile Levels Menggunakan Metode K-Means Clustering dan Naive Bayes Multinomial. Skripsi Program studi S1 Teknik Informatika Jurusan Elektro Fakultas Teknik Universitas Negeri Malang. Pembimbing (I) Utomo Pujianto S.Kom. M.Kom. (II) Harits Ar Rosyid S.T. MT. Ph.D. Kata Kunci Klasifikasi Teks Bahan Bacaan Pengklasteran K-Means Clustering Naive Bayes Multinomial. Membaca merupakan suatu hal yang penting dalam proses perkembangan pendidikan seseorang. Meskipun begitu setiap orang memiliki kemampuan baca yang berbeda - beda hal ini menjadi suatu masalah ketika kompleksitas bahan bacaan melebihi kemampuan baca. Untuk membantu permasalahan ini terdapat solusi yang telah ditawarkan salah satunya adalah dengan pengelompokan bahan bacaan menggunakan lexile levels. Lexile levels merupakan notasi numerik yang merepresentasikan kemampuan baca seseorang dan tingkat kesulitan suatu bahan bacaan. Dengan lexile levels pembaca menjadi lebih mudah dalam memilih bahan bacaan yang sesuai dengan kemampuan baca yang dimiliki. Sayangnya metode yang digunakan untuk penentuan nilai lexile levels tidak dibuka untuk umum sehingga pengguna diharuskan untuk berlangganan terlebih dahulu pada penyedia layanan. Oleh karena itu penelitian ini bertujuan untuk membuat suatu sistem yang diharapkan mampu melakukan pengelompokan dan penentuan tingkat kesulitan suatu bahan bacaan secara sederhana berdasarkan bahan baca yang telah memiliki lexile levels. Penelitian ini dimulai dengan pengambilan data dari situs tweentribune.com. Adapun data yang diambil adalah judul artikel isi artikel dan nilai lexile level. Setelah pengambilan data proses berlanjut pada tahap clustering. Dalam tahap clustering metode K-means Clustering digunakan untuk mengklaster nilai lexile levels kedalam bentuk yang lebih sederhana. Pada penelitian ini proses clustering dilakukan sebanyak dua kali dengan komposisi k 2 yang berisi klaster Easy dan Difficult dan k 3 yang berisi klaster Easy Normal dan Difficult. Selanjutnya melakukan preprocessing terhadap dataset yaitu tokenisasi penghapusan stopword stemming dan pembobotan token menggunakan TF-IDF. Setelah tahap preprocessing selesai proses oversampling dilakukan untuk mengatasi distribusi klaster yang tidak seimbang menggunakan metode SMOTE (Synthetic Minority Over-Sampling Technique). Dari seluruh hasil pemrosesan tersebut klasifikasi teks dilakukan untuk menentukan beban baca menggunakan algoritma Naive Bayes Multinomial. Hasil dari penelitian ini menunjukkan bahwa proses klasifikasi menggunakan 2 klaster dengan dilakukan oversampling menghasilkan tingkat akurasi recall dan presisi yang paling tinggi yaitu 84%. Sementara hasil klasifikasi menggunakan 2 klaster tanpa disertai oversampling menunjukkan nilai akurasi dan recall sebesar 71%. Hasil yang cukup baik juga ditunjukkan pada klasifikasi menggunakan 3 klaster disertai oversampling dengan nilai akurasi dan recall sebesar 78%. Namun hasil klasifikasi menggunakan 3 klaster tanpa disertai oversampling menunjukkan nilai akurasi dan recall yang paling rendah dengan 53%.

Item Type: Thesis (Diploma)
Subjects: ?? ??
Divisions: Fakultas Teknik (FT) > Departemen Teknik Elektro (TE) > S1 Teknik Informatika
Depositing User: library UM
Date Deposited: 17 Sep 2019 04:29
Last Modified: 09 Sep 2019 03:00
URI: http://repository.um.ac.id/id/eprint/152148

Actions (login required)

View Item View Item