Perbandingan algoritma k-nn dan naïve bayes dalam memprediksi akurasi terbaik berdasarkan mayoritas tipe atribut dataset / Zacharia - Repositori Universitas Negeri Malang

Perbandingan algoritma k-nn dan naïve bayes dalam memprediksi akurasi terbaik berdasarkan mayoritas tipe atribut dataset / Zacharia

Zacharia (2023) Perbandingan algoritma k-nn dan naïve bayes dalam memprediksi akurasi terbaik berdasarkan mayoritas tipe atribut dataset / Zacharia. Diploma thesis, Universitas Negeri Malang.

Full text not available from this repository.

Abstract

Seiring dengan perkembangan teknologi kebutuhan untuk menghasilkan informasi yang berarti dari data yang telah terkumpul berkembang dengan sangat pesat. Karena itu proses Data Mining yang mengekstraksi informasi dari sebuah data memainkan peranan yang penting. Salah satu algoritma klasifikasi yang paling sering digunakan dalam Data Mining adalah k-NN dan Na iuml ve Bayes. Hal itu didasarkan dari kesederhanaan kedua algoritma tersebut dalam memproses sebuah data. Namun dalam dunia Data Mining tidak ada yang namanya ldquo Silver Bullet rdquo . Tiap-tiap algoritma memiliki kelebihan dan kekurangan masing-masing. Oleh karena itu akan lebih baik bagi jika kita mengetahui kira-kira dataset seperti apa yang cocok untuk k-NN maupun Na iuml ve Bayes. Untuk mengetahui hal tersebut peneliti mengumpulkan sebanyak 46 dataset dari repositori machine learning publik dan melakukan eksperimen menggunakan RapidMiner Studio untuk mendapatkan hasil berupa nilai akurasi baik oleh k-NN maupun Na iuml ve Bayes lalu melakukan analisis hasil tersebut dengan metadata dari dataset untuk mengetahui apakah ada hubungan antara metadata dengan nilai akurasi oleh k-NN dan Na iuml ve Bayes. Analisis dilakukan menggunakan pendekatan statistik yaitu t-test lalu dilanjutkan dengan pengkategorian tiap-tiap atribut dari metadata dataset berdasarkan nilai kuartilnya. Dari hasil analisis t-test diketahui bahwa tidak ada perbedaan yang signifikan antara algoritma k-NN dan Na iuml ve Bayes yang diperlihatkan oleh nilai P-value sebesar 0 194654345 di mana nilai tersebut lebih besar daripada nilai signifikansi yang ditetapkan penulis yaitu 0 05. Namun pada analisis pengkategorian tiap-tiap atribut dari metadata dataset algoritma k-NN memperlihatkan hasil akurasi yang lebih tinggi daripada Na iuml ve Bayes saat memproses dataset dengan jumlah instance dan jumlah atribut yang besar. Algoritma k-NN juga mampu menghasilkan akurasi yang lebih baik saat diberikan dataset dengan jumlah missing value baik pada instance maupun pada atribut.

Item Type: Thesis (Diploma)
Subjects: ?? ??
Divisions: Fakultas Teknik (FT) > Departemen Teknik Elektro (TE) > S1 Teknik Informatika
Depositing User: library UM
Date Deposited: 31 Aug 2023 04:29
Last Modified: 09 Sep 2023 03:00
URI: http://repository.um.ac.id/id/eprint/292866

Actions (login required)

View Item View Item