Klasifikasi beban baca lexile levels menggunakan metode k-means clustering dan random forest / Moch. Rajendra Yudhistira

Yudhistira, Moch. Rajendra (2019) Klasifikasi beban baca lexile levels menggunakan metode k-means clustering dan random forest / Moch. Rajendra Yudhistira. Diploma thesis, Universitas Negeri Malang.

Full text not available from this repository.

Abstract

RINGKASAN Yudhistira Moch Rajendra. 2019. Klasifikasi Beban Baca Lexile Levels Menggunakan Metode K-Means Clustering dan Random Forest. Skripsi Program studi S1 Teknik Informatika Jurusan Elektro Fakultas Teknik Universitas Negeri Malang. Pembimbing Utomo Pujianto S.Kom. M.Kom. dan Harits Ar Rosyid S.T. MT. Ph.D. Keywords Klasifikasi Teks Lexile Levels Clustering K-Means Random Forest Ada berbagai macam cara untuk meningkatkan kualitas pendidikan seseorang salah satunya adalah membaca. Dengan membaca wawasan dan pengetahuan atas berbagai macam hal dapat bertambah. Akan tetapi kemampuan dan pemahaman seseorang akan suatu bacaan berbeda-beda. Hal ini dapat menjadi masalah bagi pembaca apabila membaca bahan bacaan yang melebihi kemampuan pemahamannya. Oleh karena itu perlu dilakukan penentuan beban bahan bacaan yakni Lexile Levels. Lexile Levels adalah suatu nilai yang memberikan ukuran kompleksitas bahan bacaan maupun kemampuan baca seseorang. Namun sayangnya rumus yang digunakan dan layanan yang diberikan dalam Lexile Levels tidaklah dibuka secara umum. Sehingga mengharuskan pengguna diharuskan berlangganan untuk dapat menggunakannya. Oleh karena itu dalam penelitian ini akan dilakukan dengan tujuan untuk membuat suatu sistem yang dapat mengelompokkan artikel berdasarkan beban baca. Dengan demikian bahan bacaan akan diklasifikasikan berdasarkan Lexile Levels-nya. Pada Lexile Levels akan dilakukan clustering untuk mengelompokkannya menggunakan metode k-means clustering. Penelitian ini akan dilakukan dalam 8 skenario yakni kombinasi klaster 2 kelas yaitu mudah dan susah serta 3 kelas yaitu mudah susah dan normal penyeimbangan kelas dengan SMOTE dan pemilihan atribut dengan Gini-index. Setelah preprocessing bahan bacaan akan diklasifikasikan beban bacanya menggunakan metode Random Forest. Metode k-means dipilih karena metode ini memiliki proses komputasi yang sederhana sehingga prosesnya cepat. Sedangkan Random Forest merupakan metode pembangun decision tree yang mampu membangun beberapa decision tree kemudian memilih yang terbaik. Hasil dari penelitian ini menunjukkan bahwa pada skenario percobaan yang menggunakan 2 klaster dilakukan oversampling dengan SMOTE dan pemilihan atribut dengan Gini-index menghasilkan hasil yang cukup baik dengan tingkat akurasi sebesar 76.03% presisi sebesar 76.05% dan recall sebesar 81.85%. Sedangkan pada skenario percobaan dengan 3 klaster skenario terbaik ada pada oversampling dengan SMOTE dan tanpa pemilihan atribut dengan akurasi sebesar 69.60% presisi sebesar 69.62% dan recall sebesar 73.41%.

Item Type:	Thesis (Diploma)
Subjects:	?? ??
Divisions:	Fakultas Teknik (FT) > Departemen Teknik Elektro (TE) > S1 Teknik Informatika
Depositing User:	Users 2 not found.
Date Deposited:	04 Feb 2019 04:29
Last Modified:	09 Sep 2019 03:00
URI:	http://repository.um.ac.id/id/eprint/152111

Actions (login required)

View Item