CeLOE LMS: RAKHMAD HIDAYAT: Analisis Sentimen Cyberbullying pada Instagram dengan Metode Support Vector Machine

Blog entry by RAKHMAD HIDAYAT

Anyone in the world

Deskripsi Permasalahan

Saat ini, media sosial menjadi kebutuhan setiap orang. Salah satu media sosial yang digunakan oleh mayoritas penduduk Indonesia adalah Instagram. Menurut Hootsuite, jumlah pengguna Instagram di Indonesia tahun 2022 : 99,15 juta jiwa (tahun 2021: 85 juta jiwa). Pemanfaatan yang beragam dari pengguna Instagram salah satunya kebebasan berpendapat pada kolom komentar dengan media teks. Akibat kebebasan berpendapat ini, banyak yang tidak sesuai etika dan merujuk pada cyberbullying.

Menurut UNICEF, cyberbullying (perundungan dunia maya) ialah bullying/perundungan dengan menggunakan teknologi digital. Hal ini dapat terjadi di media sosial, platform chatting, platform bermain game, dan ponsel. Berdasarkan riset lembaga donasi anti-bullying ditch the label terhadap 10 ribu remaja asal Inggris dengan rentang usia 12 hingga 20 tahun sebanyak 42% di antaranya mengaku pernah menjadi korban cyberbullying di Instagram.

Dampak cyberbullying diantaranya :

Dampak psikologis : mudah depresi, marah, timbul perasaan gelisah, cemas, menyakiti diri sendiri, dan perfobaan bunuh diri
Dampak sosial : menarik diri, kehilangan kepercayaan diri, lebih agresif kepada teman dan keluarga
Dampak pada kehidupan sekolah : penurunan prestasi akademik, rendahnya tingkat kehadiran, perilaku bermasalah di sekolah

Tujuan Penelitian

Mendeteksi komentar positif cyberbullying dan komentar negatif cyberbullying di Instagram dengan analisis sentimen
Mengetahui komentar yang mengandung konten cyberbullying

Metode Pemecahan Masalah

Tahapan dalam melakukan analisis sentimen dengan metode SVM dimulai dengan input data latih dan data uji. Secara umum tahapan pemecahan masalah sebagai berikut.

Input : Dokumen Data Latih dan Data Uji
Pre-processing
Pembobotan Kata (TF-IF)
Support Vector Machine
Output : Kelas Komentar Positif atau Negatif

Tahapan Pre-processing

Pada kasus ini akan dilakukan tahapan Pre-processing dengan tahapan case folding, data cleansing, normalisasi kata tidak baku, stopword removal, stemming, dan tokenisasi.

Case Folding : mengubah seluruh teks atau karakter menjadi huruf kecil
Data Cleaning : membersihkan data dari karakter-karakter tertentu (username, angka, dan tanda baca)
Normalisasi Bahasa : mengubah kata yang tidak baku menjadi baku
Stopword Removal : menghapus kata yang tidak memiliki makna penting
Stemming : mencari kata dasar (menghapus kata imbuan)
Tokenisasi : memecah menjadi kata-kata tunggal

Tahapan Pembobotan TF-IDF

TF-IDF (Term Frequency Inverse Document Frequency) merupakan metode pembobotan dalam bentuk integrasi antar term frequency dengan inverse document frequency. Tahapan ini terdiri dari :

Menentukan fitur kata
Perhitungan nilai TF
Perhitungan nilai Wtf
Perhitungan nilai DF dan IDF
Perhitungan nilai TF-IDF

Tahapan Klasifikasi Support Vector Machine

Support Vector Machine (SVM) merupakan suatu sistem yang dikembangkan untuk membantu menganalisis komentar-komentar pada Instagram yang mengandung cyberbullying atau tidak.

Data masukan yang akan digunakan untuk proses pelatihan adalah data dari 2 kelas yang berbeda yang telah melalui preprocessing. Sesuai dengan data masukan, data komentar diberi kelas positif dan negatif, lalu diberikan label kelas 1 atau -1 yang dimana kelas -1 merupakan kelas negatif sedangkan kelas 1 merupakan kelas positif.

Pemecahan Masalah

Pada penelitian kali kami akan menetukan sentimen dan kelas dari komentar data uji dengan proses manualisasi mulai dari tahapan pre-proseccing hingga klasifikasi SVM.

Data Latih


No	Komentar	Sentimen	Kelas
L1	Kereeen nih,,,enak bgt didengernya,,,gak bosen puter ulang2,,,daripada yang lipsing2 gajelas joget2 gtu,,	Negatif	-1
L2	Helooow sebuah pertemanan tdk akan melibatkan ciuman BIBIR, coba aja kalian bayangin, sanggup gak ciuman bibir ma TEMAN? pasti lbh dr teman lah itu. Dasar Kelakuan Kids jaman now yang emg bego, bukan krn kebanyakan micin lho yah	Positif	1

Data Uji


No	Komentar	Sentimen	Kelas
U1	RATU PELAKOR SEJAGAT RAYA, DIMANA2 PELAKOR YA GAK PUNYA MALU. YANG NGERASA PELAKOR DISINI TOLONG PUNYA MALU DIKIT	?	?

Manualisasi Pre-proseccing


Tahapan	Hasil
Input Data Uji	RATU PELAKOR SEJAGAT RAYA, DIMANA2 PELAKOR YA GAK PUNYA MALU. YANG NGERASA PELAKOR DISINI TOLONG PUNYA MALU DIKIT
Setelah Case Folding	ratu pelakor sejagat raya, dimana2 pelakor ya gak punya malu. yang ngerasa pelakor disini tolong punya malu dikit
Setelah Data Cleaning	ratu pelakor sejagat raya dimana pelakor ya gak punya malu yang ngerasa pelakor disini tolong punya malu dikit
Setelah Normalisasi Data	ratu pelakor sejagat raya dimana pelakor ya tidak punya malu yang ngerasa pelakor disini tolong punya malu dikit
Setelah Stopword Removal	ratu pelakor sejagat raya dimana pelakor malu ngerasa pelakor tolong malu dikit
Setelah Stemming	ratu pelakor jagat raya mana pelakor malu ngerasa pelakor tolong malu dikit
Setelah Tokenisasi	'ratu', 'pelakor', 'jagat', 'raya', 'mana', 'pelakor', 'malu', 'ngerasa', 'pelakor', 'tolong', 'malu', 'dikit'

Manualisasi Perhitungan tf, df, Wtf, idf, dan TF-IDF

Manualisasi Klasifikasi Support Vector Machine

Pengujian Support Vector Machine

Rumus Pengujian Support Vector Machine

Pada pengujian Data Uji setelah melewati perhitungan pada SVM maka nilai yang didapatkan ialah 0.00060728 (Positif)


Komentar	Sentimen	Kelas
RATU PELAKOR SEJAGAT RAYA, DIMANA2 PELAKOR YA GAK PUNYA MALU. YANG NGERASA PELAKOR DISINI TOLONG PUNYA MALU DIKIT	Positif	1

Setelah komentar dari data uji melalui tahapan-tahapan pemecahan masalah (manualisi), menghasilkan fungsi hyperplane 1 (positif). Jadi disimpulkan bahwa data uji merupakan komentar positif cyberbullying.

Akurasi Sistem

Dalam sumber yang kami baca, akurasi dari sistem ini jika diimplementasikan sebagai berikut.


Evalusi	Persentase
Accuracy	79%
Precision	89.85%
Recall	67.33%
F-Measure	74.01%

Kesimpulan

Metode klasifikasi Support Vector Machine dapat digunakan dalam menganalisis sentimen pada kolom komentar Instagram. Hasil klasifikasi yang diberikan dapat berupa kelas sentimen positif cyberbullying atau negatif cyberbullying.
Perhitungan yag kami lakukan mungkin banyak terjadi human error karena semua dilakukan manual dan belum sampai tahap sistem yang menggunkaan bantuan software.

Permalink

[ Modified: Wednesday, 6 July 2022, 5:27 PM ]

Show comments Comments (0)