Ristanti, Putri Yuni (2019) Cosine similarity untuk klasifikasi judul dan abstrak jurnal ekonomi / Putri Yuni Ristanti. Diploma thesis, Universitas Negeri Malang.
Full text not available from this repository.Abstract
RINGKASAN Ristanti Putri Yuni. 2019. Cosine Similarity untuk Klasifikasi Judul dan Abstrak Jurnal Ekonomi. Skripsi. Jurusan Teknik Elektro Fakultas Teknik Universitas Negeri Malang. Pembimbing. (I) Aji Prasetya Wibawa S.T. M.MT. Ph.D. (II) Utomo Pujianto S.Kom. M.Kom. Keywords Kemiripan Klasifikasi teks Vector Space Model Cosine Similarity Artikel Jurnal Ekonomi Jurnal ekonomi Universitas Negeri Malang terdiri dari 7 Pengelompokkan bidang berdasarkan judul jurnal yaitu Ekonomi Bisnis Pendidikan Akuntansi dan Bisnis Akuntansi Aktual Ekonomi dan Studi Pembangunan (JESP) Pendidikan Akuntansi Pendidikan Bisnis dan Manajemen dan Pendidikan Bisnis dan Manajemen. Pengelompokkan bidang tersebut 4 diantaranya adalah jurnal ekonomi berbahasa Indonesia. Dasar penerimaan artikel jurnal adalah kemiripan isi artikel jurnal terhadap topik artikel jurnal. Pengelompokan topik artikel jurnal seperti Pendidikan Akuntansi Akuntansi Aktual dan Pendidikan Akuntansi dan Bisnis memiliki topik artikel yang hampir mirip. Kemiripan topik artikel tersebut menyebabkan penulis kebingungan dalam menentukan topik artikel jurnal yang tepat sesuai artikelnya. Tahapan penelitian pada klasifikasi artikel jurnal ekonomi berbahasa Indonesia terdiri dari 5 tahap yaitu pengambilan data artikel jurnal ekonomi berbahasa Indonesia preprocessing pendekatan berbasis Vector Space Model pada pembobotan TF-IDF penerapan klasifikasi dengan Cosine Similarity dan evaluasi. Pengumpulan data dilakukan pada website journal.um.ac.id Fakultas Ekonomi dengan 4 pengelompokkan bidang jurnal ekonomi berbahasa Indonesia. Tahap preprocessing dilakukan dengan cleansing case folding dan tokenisasi. Pendekatan Vector Space Model untuk merepresentasikan term dalam dimensi spasial. Metode klasifikasi Cosine Similarity untuk menghitung kemiripan antara dokumen. Evaluasi menggunakan teknik K-Fold Cross Validation dengan pengujian terhadap 6 fold untuk setiap pengacakan data set sebanyak 6 kali terhadap 126 instance artikel jurnal ekonomi berbahasa Indonesia dengan output accuracy precision dan recall. Hasil pengujian ini adalah nilai rata-rata dari 6 kali pengacakan terhadap data set dengan nilai accuracy 57 79% precision 57 79% dan recall 62 96%. Dari hasil pengujian dengan nilai rata-rata accuracy precision dan recall belum maksimal. Penambahan tahapan pada preprocessing atau teknik optimasi algoritma pada penelitian selanjutnya untuk memudahkan kemiripan antar term mudah terdeteksi sehingga nilai accuracy recall maupun precision dapat meningkat.
Item Type: | Thesis (Diploma) |
---|---|
Subjects: | ?? ?? |
Divisions: | Fakultas Teknik (FT) > Departemen Teknik Elektro (TE) > S1 Teknik Informatika |
Depositing User: | library UM |
Date Deposited: | 14 Aug 2019 04:29 |
Last Modified: | 09 Sep 2019 03:00 |
URI: | http://repository.um.ac.id/id/eprint/99023 |
Actions (login required)
View Item |