Klasifikasi berita pada media online menggunakan pembobotan kata berbasis term frequency / Bagaskara Khatulistiwa

Khatulistiwa, Bagaskara (2019) Klasifikasi berita pada media online menggunakan pembobotan kata berbasis term frequency / Bagaskara Khatulistiwa. Diploma thesis, Universitas Negeri Malang.

Full text not available from this repository.

Abstract

v RINGKASAN Khatulistiwa, Bagaskara. 2018. Klasifikasi Berita Pada Media Online Menggunakan Pembobotan Kata Berbasis Term Frequency. Skripsi, Jurusan Teknik Elektro, Fakultas Teknik, Universitas Negeri Malang. Pembimbing: (I) Aji Prasetya Wibawa, S.T., M.M.T., Ph.D. (II) Ilham Ari Elbaith Zaeni, S.T., M.T., Ph.D. Kata Kunci: Text Mining, Klasifikasi, pembobotan kata, Term Frequency Berita adalah suatu kejadian yang dikemas dalam bentuk informasi kemudian disebarkan dalam bentuk siaran, cetak, mulut ke mulut, ataupun melalui internet. Dengan menggunakan internet, penyebaran berita dapat dilakukan dengan mudah dan lebih cepat. Banyaknya berita yang bertambah di internet tiap bulannya, menyebabkan banyak berita belum terklasifikasi sesuai dengan isi berita. Untuk mengatasi masalah tersebut, diperlukan aplikasi yang dapat melakukan klasifikasi sesuai dengan isi berita. Penelitian ini bertujuan untuk mengembangkan sistem klasifikasi konten berita menggunakan text mining. Text Mining merupakan teknik data mining untuk melakukan klasifikasi data berupa teks. Ketika terdapat kumpulan data tekstual yang berjumlah besar, teknik ini akan mencari pola yang menarik untuk melakukan klasifikasi. Beberapa algoritma untuk melakukan text mining dan klasifikasi seperti Naive Bayes dan Rocchio. Penelitian ini menggunakan metode pembobotan kata berdasarkan term frequency. Metode ini sederhana, efisien, dan memiliki tingkat akurasi yang tinggi. Sebelum melakukan klasifikasi, terdapat tiga tahap preprocessing data pada berita dengan cara text processing, tokenizing, dan filtering untuk menyesuaikan data sesuai kebutuhan metode klasifkasi. Evaluasi yang digunakan untuk menguji algoritma adalah confussion matrix yang didapatkan hasil akurasi sebesar 87,22%. Selain itu, nilai presisi yang didadat dari masing-masing kelas sebesar 94,54% pada berita ekonomi, 85% pada berita politik, dan 83,07% pada berita hukum. Sedangkan nilai recall dari masing-masing kelas didapatkan hasil sebesar 86,67% pada berita ekonomi, 85% pada berita politik, dan 90% pada berita hukum.

Item Type: Thesis (Diploma)
Subjects: ?? ??
Divisions: Fakultas Teknik (FT) > Jurusan Teknik Elektro (TE) > S1 Teknik Informatika
Depositing User: Users 2 not found.
Date Deposited: 19 Feb 2019 04:29
Last Modified: 09 Sep 2019 03:00
URI: http://repository.um.ac.id/id/eprint/48080

Actions (login required)

View Item View Item