Studi empirik pengaruh resampling terhadap klasifikasi multiclass / Muhammad Rizal Rusdiansyah - Repositori Universitas Negeri Malang

Studi empirik pengaruh resampling terhadap klasifikasi multiclass / Muhammad Rizal Rusdiansyah

Rusdiansyah, Muhammad Rizal (2020) Studi empirik pengaruh resampling terhadap klasifikasi multiclass / Muhammad Rizal Rusdiansyah. Diploma thesis, Universitas Negeri Malang.

Full text not available from this repository.

Abstract

Klasifikasi merupakan salah satu metode dalam data mining yang menjadi salah satu fokus dalam penelitian. Klasifikasi adalah suatu proses untuk menemukan pola yang dapat menggambarkan kelas pada sekumpulan data. Ketidakseimbangan kelas menjadi masalah yang cukup serius dalam proses klasifikasi. Hal ini dapat mengakibatkan hasil klasifikasi akan cenderung mengarah pada kelas mayoritas. Salah satu pendekatan untuk mengatasi masalah ketidakseimbangan kelas adalah teknik resampling. Teknik resampling bekerja dengan cara mengurangi data pada kelas mayoritas atau menciptakan data baru pada kelas minoritas hal ini bertujuan untuk menyeimbangkan jumlah data pada setiap kelas yang ada. Pada penelitian ini akan digunakan beberapa pendekatan untuk mengatasi masalah ketidakseimbangan kelas tersebut yakni Random Under-sampling Random Over-sampling dan SMOTE. Skenario yang dilakukan pada penelitian ini adalah dengan menggunakan 66 dataset dengan kategori klasifikasi yang diunduh dari website UCI Machine Learning Repository Kaggle OpenML dan beberapa sumber online lainnya. Setiap dataset dilakukan proses resampling dan klasifikasi dengan menggunakan algoritma klasifikasi berbeda yakni Na iuml ve Bayes Decision Tree dan Neural Network. Setelah semua hasil evaluasi klasifikasi didapatkan selanjutnya dilakukan proses pengujian empiris pada seluruh hasil evaluasi yang meliputi akurasi recall presisi dan f-measure dengan menggunakan metode paired t-test atau uji-t berpasangan. Hasil yang didapatkankan dari penelitian ini menyatakan bahwa penggunaan teknik sampling terhadap proses klasifikasi multiclass memiliki pengaruh yang signifikan jika dibandingkan dengan proses klasifikasi multiclass tanpa menggunakan sampling baik dari segi akurasi recall precision serta f-measure. Hal ini dibuktikan dari nilai t-score yang lebih tinggi dari nilai t-table dan memiliki nilai confidence lebih atau sama dengan 99%. Kombinasi teknik sampling dan Neural Network memberikan hasil evaluasi terbaik dari segi mean maupun signifikansi. Hal ini dibuktikan dari nilai mean yang lebih unggul baik dari segi akurasi recall precision serta f-measure jika dibandingkan dengan kombinasi teknik sampling dan algoritma klasifikasi yang lain.

Item Type: Thesis (Diploma)
Subjects: ?? ??
Divisions: Fakultas Teknik (FT) > Departemen Teknik Elektro (TE) > S1 Teknik Informatika
Depositing User: Users 2 not found.
Date Deposited: 22 Mar 2020 04:29
Last Modified: 09 Sep 2020 03:00
URI: http://repository.um.ac.id/id/eprint/196453

Actions (login required)

View Item View Item