Blog entry by RAKHMAD HIDAYAT
Saat ini, media sosial menjadi kebutuhan setiap orang. Salah satu media sosial yang digunakan oleh mayoritas penduduk Indonesia adalah Instagram. Menurut Hootsuite, jumlah pengguna Instagram di Indonesia tahun 2022 : 99,15 juta jiwa (tahun 2021: 85 juta jiwa). Pemanfaatan yang beragam dari pengguna Instagram salah satunya kebebasan berpendapat pada kolom komentar dengan media teks. Akibat kebebasan berpendapat ini, banyak yang tidak sesuai etika dan merujuk pada cyberbullying.
Menurut UNICEF, cyberbullying (perundungan dunia maya) ialah bullying/perundungan dengan menggunakan teknologi digital. Hal ini dapat terjadi di media sosial, platform chatting, platform bermain game, dan ponsel. Berdasarkan riset lembaga donasi anti-bullying ditch the label terhadap 10 ribu remaja asal Inggris dengan rentang usia 12 hingga 20 tahun sebanyak 42% di antaranya mengaku pernah menjadi korban cyberbullying di Instagram.
Dampak cyberbullying diantaranya :
- Dampak psikologis : mudah depresi, marah, timbul perasaan gelisah, cemas, menyakiti diri sendiri, dan perfobaan bunuh diri
- Dampak sosial : menarik diri, kehilangan kepercayaan diri, lebih agresif kepada teman dan keluarga
- Dampak pada kehidupan sekolah : penurunan prestasi akademik, rendahnya tingkat kehadiran, perilaku bermasalah di sekolah
Tujuan Penelitian
- Mendeteksi komentar positif cyberbullying dan komentar negatif cyberbullying di Instagram dengan analisis sentimen
- Mengetahui komentar yang mengandung konten cyberbullying
Metode Pemecahan Masalah
Tahapan dalam melakukan analisis sentimen dengan metode SVM dimulai dengan input data latih dan data uji. Secara umum tahapan pemecahan masalah sebagai berikut.
- Input : Dokumen Data Latih dan Data Uji
- Pre-processing
- Pembobotan Kata (TF-IF)
- Support Vector Machine
- Output : Kelas Komentar Positif atau Negatif
Tahapan Pre-processing
Pada kasus ini akan dilakukan tahapan Pre-processing dengan tahapan case folding, data cleansing, normalisasi kata tidak baku, stopword removal, stemming, dan tokenisasi.
- Case Folding : mengubah seluruh teks atau karakter menjadi huruf kecil
- Data Cleaning : membersihkan data dari karakter-karakter tertentu (username, angka, dan tanda baca)
- Normalisasi Bahasa : mengubah kata yang tidak baku menjadi baku
- Stopword Removal : menghapus kata yang tidak memiliki makna penting
- Stemming : mencari kata dasar (menghapus kata imbuan)
- Tokenisasi : memecah menjadi kata-kata tunggal
Tahapan Pembobotan TF-IDF
TF-IDF (Term Frequency Inverse Document Frequency) merupakan metode pembobotan dalam bentuk integrasi antar term frequency dengan inverse document frequency. Tahapan ini terdiri dari :
- Menentukan fitur kata
- Perhitungan nilai TF
- Perhitungan nilai Wtf
- Perhitungan nilai DF dan IDF
- Perhitungan nilai TF-IDF
Tahapan Klasifikasi Support Vector Machine
Support Vector Machine (SVM) merupakan suatu sistem yang dikembangkan untuk membantu menganalisis komentar-komentar pada Instagram yang mengandung cyberbullying atau tidak.
Data masukan yang akan digunakan untuk proses pelatihan adalah data dari 2 kelas yang berbeda yang telah melalui preprocessing. Sesuai dengan data masukan, data komentar diberi kelas positif dan negatif, lalu diberikan label kelas 1 atau -1 yang dimana kelas -1 merupakan kelas negatif sedangkan kelas 1 merupakan kelas positif.
Pemecahan Masalah
Pada penelitian kali kami akan menetukan sentimen dan kelas dari komentar data uji dengan proses manualisasi mulai dari tahapan pre-proseccing hingga klasifikasi SVM.
Data Latih
No | Komentar | Sentimen | Kelas |
---|---|---|---|
L1 | Kereeen nih,,,enak bgt didengernya,,,gak bosen puter ulang2,,,daripada yang lipsing2 gajelas joget2 gtu,, | Negatif | -1 |
L2 | Helooow sebuah pertemanan tdk akan melibatkan ciuman BIBIR, coba aja kalian bayangin, sanggup gak ciuman bibir ma TEMAN? pasti lbh dr teman lah itu. Dasar Kelakuan Kids jaman now yang emg bego, bukan krn kebanyakan micin lho yah | Positif | 1 |
Data Uji
No | Komentar | Sentimen | Kelas |
---|---|---|---|
U1 | RATU PELAKOR SEJAGAT RAYA, DIMANA2 PELAKOR YA GAK PUNYA MALU. YANG NGERASA PELAKOR DISINI TOLONG PUNYA MALU DIKIT | ? | ? |
Manualisasi Pre-proseccing
Tahapan | Hasil |
---|---|
Input Data Uji | RATU PELAKOR SEJAGAT RAYA, DIMANA2 PELAKOR YA GAK PUNYA MALU. YANG NGERASA PELAKOR DISINI TOLONG PUNYA MALU DIKIT |
Setelah Case Folding | ratu pelakor sejagat raya, dimana2 pelakor ya gak punya malu. yang ngerasa pelakor disini tolong punya malu dikit |
Setelah Data Cleaning | ratu pelakor sejagat raya dimana pelakor ya gak punya malu yang ngerasa pelakor disini tolong punya malu dikit |
Setelah Normalisasi Data | ratu pelakor sejagat raya dimana pelakor ya tidak punya malu yang ngerasa pelakor disini tolong punya malu dikit |
Setelah Stopword Removal | ratu pelakor sejagat raya dimana pelakor malu ngerasa pelakor tolong malu dikit |
Setelah Stemming | ratu pelakor jagat raya mana pelakor malu ngerasa pelakor tolong malu dikit |
Setelah Tokenisasi | 'ratu', 'pelakor', 'jagat', 'raya', 'mana', 'pelakor', 'malu', 'ngerasa', 'pelakor', 'tolong', 'malu', 'dikit' |
Manualisasi Perhitungan tf, df, Wtf, idf, dan TF-IDF
Manualisasi Klasifikasi Support Vector Machine
Pengujian Support Vector Machine
Pada pengujian Data Uji setelah melewati perhitungan pada SVM maka nilai yang didapatkan ialah 0.00060728 (Positif)
Komentar | Sentimen | Kelas |
---|---|---|
RATU PELAKOR SEJAGAT RAYA, DIMANA2 PELAKOR YA GAK PUNYA MALU. YANG NGERASA PELAKOR DISINI TOLONG PUNYA MALU DIKIT | Positif | 1 |
Setelah komentar dari data uji melalui tahapan-tahapan pemecahan masalah (manualisi), menghasilkan fungsi hyperplane 1 (positif). Jadi disimpulkan bahwa data uji merupakan komentar positif cyberbullying.
Akurasi Sistem
Dalam sumber yang kami baca, akurasi dari sistem ini jika diimplementasikan sebagai berikut.
Evalusi | Persentase |
---|---|
Accuracy | 79% |
Precision | 89.85% |
Recall | 67.33% |
F-Measure | 74.01% |
Kesimpulan
- Metode klasifikasi Support Vector Machine dapat digunakan dalam menganalisis sentimen pada kolom komentar Instagram. Hasil klasifikasi yang diberikan dapat berupa kelas sentimen positif cyberbullying atau negatif cyberbullying.
- Perhitungan yag kami lakukan mungkin banyak terjadi human error karena semua dilakukan manual dan belum sampai tahap sistem yang menggunkaan bantuan software.