Rasyida, Khalida Izdihar (2019) Komparasi algoritma Naive Bayes dan Random Forest untuk klasifikasi popularitas artikel, berita bahan pembelajaran / Khalida Izdihar Rasyida. Diploma thesis, Universitas Negeri Malang.
Full text not available from this repository.Abstract
RINGKASAN Rasyida Khalida Izdihar. 2019. Komparasi Algoritma Na ve Bayes dan Random Forest Untuk Klasifikasi Popularitas Artikel Berita Bahan Pembelajaran. Skripsi Program studi S1 Teknik Informatika Jurusan Teknik Elektro Fakultas teknik Universitas Negeri Malang Pembimbing (I) Ilham Ari Elbaith Zaeni S.T. M.T. Ph.D. (II) Utomo Pujianto S.Kom. M.Kom. Kata kunci- sumber belajar artikel TweenTribune Na ve Bayes Random Forest Usia anak-anak merupakan usia yang belum dapat memilih bahan bacaan yang baik untuk dirinya sehingga perlu adanya pendampingan dari pihak yang lebih bijak dalam memilih bahan bacaan dengan kesesuaian beban baca dan isi yang disampaikan. Pemilihan beban bacaan yang tepat mempengaruhi perkembangan psikologi anak dan kualitas tersampaikannya isi bacaan. Perkembangan pengguna internet yang mencapai 65% pada tahun 2005 2015 mempengaruhi semakin cepat dan pesatnya persebaran data artikel berita. Dimana hal ini mempengaruhi sulitnya pemantauan berita dan peristiwa penting yang terjadi. Data berita yang bersifat aktual dan terbaru dapat digunakan sebagai bahan literatur karena dapat merangsang pola pikir anak untuk menanggapi peristiwa yang ada di sekitarnya. Namun hingga saat ini belum ada penelitian spesifik mengenai karakteristik penulisan berita yang diminati dengan beban baca yang sesuai serta bisa digunakan sebagai bahan literatur. Penelitian ini dilakukan untuk mengetahui kemampuan teknik text mining na ve bayes dan random forest dalam mengklasifikasikan teks berdasarkan karakteristik penulisan yang diminati oleh pembaca yang dikelompokkan kedalam kelas popularitas. Terdapat lima tahapan penelitian yang dilakukan. Tahapan pertama adalah data collection. Tahapan kedua adalah preprocessing yang didalamnya terdapat empat proses yaitu menghitung jumlah kata stemming menghitung jumlah kata unik dan menghitung umur artikel. Tahapan ketiga adalah selection and additionyang didalamnya terdapat proses clustering menggunakan algoritma k-means clustering dengan dua skenario yang berbeda pada atribut inputan clustering. Tahapan keempat adalah klasifikasi menggunakan algoritma na ve bayes dan random forest. Tahapan terakhir adalah evaluasi dengan bantuan confusion matrix untuk mendapatkan algoritma dengan akurasi terbaik. Hasil dari penelitian ini diantaranya adalah algoritma na ve bayes menggunakan skenario pertama dengan akurasi sebesar 48.44% recall 36.7% dan presisi 46.7%. Algoritma random forest menggunakan skenario pertama dengan akurasi sebesar 92.37% recall 92.4% dan presisi 92.1%. Algoritma na ve bayes menggunakan skenario kedua dengan akurasi sebesar 97.31% recall 33.3% dan presisi 32.4%. Algoritma random forest menggunakan skenario kedua dengan akurasi sebesar 99.75% recall 99.7% dan presisi 98.7%. Berdasarkan paparan tersebut dapat disimpulkan bahwa algoritma dengan performa terbaik adalah algoritma random forest menggunakan skenario kedua.Dimana hal ini dapat dilihat dari hasil akurasi recall dan presisi yang relatif seimbang dengan persentase diatas 90%.
Item Type: | Thesis (Diploma) |
---|---|
Subjects: | ?? ?? |
Divisions: | Fakultas Teknik (FT) > Departemen Teknik Elektro (TE) > S1 Teknik Informatika |
Depositing User: | library UM |
Date Deposited: | 19 Dec 2019 04:29 |
Last Modified: | 09 Sep 2019 03:00 |
URI: | http://repository.um.ac.id/id/eprint/99042 |
Actions (login required)
View Item |