Al Farisi, Riswanda (2019) Analisis sentimen review hotel menggunakan metode N-Gram dan Naive Bayes / Riswanda Al Farisi. Diploma thesis, Universitas Negeri Malang.
Full text not available from this repository.Abstract
RINGKASAN Farisi Riswanda Al. 2019. Analisis Sentimen Review Hotel Menggunakan Metode N-Gram Dan Naive Bayes. Skripsi. Jurusan Teknik Elektro Fakultas Teknik Universitas Negeri Malang. Pembimbing. (I) Triyanna Widiyaningtyas S.T. M.T. (II) Ilham Ari Elbaith Zaeni S.T. M.T. Ph.D. Kata Kunci Klasifikasi Analisis Sentimen Naive Bayes N-Gram TF-IDF Penyedia jasa pemesanan hotel baik berupa website atau aplikasi berbasis online sudah memberikan fitur dimana konsumen dapat memberikan review terkait penilaiannya terhadap hotel. Namun banyaknya review yang ada membuat pengguna tidak dapat menyaring semua review tersebut. Analisis sentimen dapat dijadikan sebagai solusi untuk mengatasi hal ini dengan mengklasifikasikan review ke dalam sentimen positif atau negatif. Penelitian ini bertujuan untuk mengetahui penerapan metode n-gram dan naive bayes pada klasifikasi analisis sentimen. Penelitian ini menggunakan metode penelitian eksperimen tahap penelitian meliputi (1) proses pengumpulan dataset review hotel diperoleh dari website TripAdvisor.com (2) proses preprocessing menggunakan metode data cleaning dan case folding (3) proses tokenisasi menggunakan metode n-gram yang terdiri dari empat jenis token yaitu unigram bigram trigram dan quadgram (4) proses pembobotan kata menggunakan metode Term Frequence Inverse-Document Frequency (TF-IDF) (5) proses klasifikasi menggunakan metode naive bayes untuk mengklasifikasikan review hotel menjadi positif atau negative (6) proses evaluasi untuk mengetahui hasil kinerja algoritma menggunakan confusion matrix untuk menghitung nilai precision recall accuracy dan error rate. Berdasarkan hasil dan anallisis penelitian klasifikasi menggunakan metode naive bayes dan unigram memberikan hasil precision 94% recall 100% accuracy 97% dan error rate 3%. Metode naive bayes dan bigram memberikan hasil precision 89% recall 94% accuracy 92% dan error rate 8%. Metode naive bayes dan trigram memberikan hasil precision 52% recall 80% accuracy 58% dan error rate 42%. Metode naive bayes dan quadgram memberikan hasil precision 47% recall 94% accuracy 50% dan error rate 50%. Berdasarkan hasil nilai accuracy dapat disimpulkan bahwa metode tokenisasi unigram lebih baik dibandingkan metode tokenisasi lainnya. Adapun saran untuk penelitian selanjutnya dapat menggunakan dataset yang lebih baik dan menambahkan metode preprocessing seperti stemming. Kemudian menggunakan jenis token kombinasi unigram dan bigram untuk menggantikan jenis token trigram dan quadgram yang menghasilkan nilai accuracy rendah. Perbandingan metode juga dapat dilakukan dengan menggunakan metode klasifikasi teks yang lain seperti k-nearest neighbour atau support vector machine.
Item Type: | Thesis (Diploma) |
---|---|
Subjects: | ?? ?? |
Divisions: | Fakultas Teknik (FT) > Departemen Teknik Elektro (TE) > S1 Teknik Informatika |
Depositing User: | library UM |
Date Deposited: | 23 Aug 2019 04:29 |
Last Modified: | 09 Sep 2019 03:00 |
URI: | http://repository.um.ac.id/id/eprint/152160 |
Actions (login required)
View Item |