Prediksi peningkatan jumlah sitasi pada dokumen scopus berbasis algoritma logistic regression / Muhammad Ghazi Mubarokah</p>

Mubarokah, Muhammad Ghazi (2025) Prediksi peningkatan jumlah sitasi pada dokumen scopus berbasis algoritma logistic regression / Muhammad Ghazi Mubarokah</p>. Diploma thesis, Universitas Negeri Malang.

Full text not available from this repository.

Abstract

p RINGKASANMubarokah Ghazi. 2025. Prediksi Peningkatan Jumlah Sitasi pada DokumenScopus Menggunakan Algoritma Logistic Regression. Skripsi S1 TeknikInformatika Fakultas Teknik Universitas Negeri Malang. Pembimbing (I)Utomo Pujianto S.Kom. M.Kom.Kata Kunci Sitasi Scopus Logistic Regression SMOTE Prediksi Saat ini banyak peneliti yang mengerjakan proyek ilmiah di seluruh dunia danmenulis artikel penelitian. Akibatnya banyak artikel ilmiah yang diterbitkan setiaphari dengan kualitas dan dampak ilmiah yang berbeda. Dampak potensial dari karyaakademis menjadi salah satu pertimbangan bagi peneliti untuk menyempurnakanpenelitian mereka. Sitasi menjadi salah satu tolak ukur kualitas karya ilmiah. Selaindigunakan sebagai metrik evaluasi dalam karya ilmiah sitasi juga seringkalidigunakan untuk memperkirakan tren masa depan dalam membantumengalokasikan dana penelitian dengan efektif.Metode penelitian yang digunakan meliputi empat proses diantaranyaadalah pengumpulan data pra pemrosesan konfigurasi proses dan evaluasi.Pengumpulan data dilakukan dengan mengekspor data dari database Scopus denganpublikasi mulai 1 Januari 2021-30 Juli 2024. Selanjutnya dilakukan prapemrosesan data dengan pemilihan atribut dan pemberian label menggunakanalgoritma K-Means. Kemudian dilakukan konfigurasi proses dengan validasimenggunakan cross validation untuk melatih algoritma logistic regression sertamelakukan evaluasi dengan menghitung metrik evaluasi (accuracy precision recall dan F1-Score).Penelitian ini menunjukkan bahwa algoritma logistic regression berhasilditerapkan untuk memprediksi peningkatan jumlah sitasi pada dokumen Scopusdengan menggunakan berbagai atribut di antaranya yaitu document type openaccess jumlah afiliasi LN jumlah penulis jumlah penulis berafiliasi LN dan labelyang didapatkan dari proses clustering. Setelah data dipersiapkan sampai prosesclustering selanjutnya dilakukan prediksi menggunakan algoritma logisticregressiondengan validasi menggunakan cross validation serta evaluasi denganmetrik-metrik akurasi precision recall dan F1-Score. Model awal menunjukkanakurasi tinggi sebesar 96.47% dengan performa sangat baik pada kelas rendah (F1-score 98.20%) tetapi buruk pada kelas tinggi (F1-score 7.36%) akibatketidakseimbangan data. Untuk mengatasi hal ini dilakukan penyeimbangan datamenggunakan SMOTE yang meningkatkan F1-score kelas tinggi menjadi80.76% tetapi menurunkan akurasi keseluruhan menjadi 76.89%. Meskipun modellebih baik dalam mengenali kelas minoritas distribusi data yang berubahmenyebabkan penurunan performa pada kelas mayoritas. /p

Item Type:	Thesis (Diploma)
Divisions:	Fakultas Teknik (FT) > Departemen Teknik Elektro (TE) > S1 Teknik Informatika
Depositing User:	library UM
Date Deposited:	24 Jul 2025 04:29
Last Modified:	09 Sep 2025 03:00
URI:	http://repository.um.ac.id/id/eprint/400155

Actions (login required)

View Item