Blog entry by RAKHMAD HIDAYAT

Anyone in the world
Deskripsi Permasalahan

Saat ini, media sosial menjadi kebutuhan setiap orang. Salah satu media sosial yang digunakan oleh mayoritas penduduk Indonesia adalah Instagram. Menurut Hootsuite, jumlah pengguna Instagram di Indonesia tahun 2022 : 99,15 juta jiwa (tahun 2021: 85 juta jiwa). Pemanfaatan yang beragam dari pengguna Instagram salah satunya kebebasan berpendapat pada kolom komentar dengan media teks. Akibat kebebasan berpendapat ini, banyak yang tidak sesuai etika dan merujuk pada cyberbullying.

Menurut UNICEF, cyberbullying (perundungan dunia maya) ialah bullying/perundungan dengan menggunakan teknologi digital. Hal ini dapat terjadi di media sosial, platform chatting, platform bermain game, dan ponsel. Berdasarkan riset lembaga donasi anti-bullying ditch the label terhadap 10 ribu remaja asal Inggris dengan rentang usia 12 hingga 20 tahun sebanyak 42% di antaranya mengaku pernah menjadi korban cyberbullying di Instagram.

Dampak cyberbullying diantaranya :

  • Dampak psikologis : mudah depresi, marah, timbul perasaan gelisah, cemas, menyakiti diri sendiri, dan perfobaan bunuh diri
  • Dampak sosial : menarik diri, kehilangan kepercayaan diri, lebih agresif kepada teman dan keluarga
  • Dampak pada kehidupan sekolah : penurunan prestasi akademik, rendahnya tingkat kehadiran, perilaku bermasalah di sekolah


Tujuan Penelitian

  1. Mendeteksi komentar positif cyberbullying dan komentar negatif cyberbullying di Instagram dengan analisis sentimen
  2. Mengetahui komentar yang mengandung konten cyberbullying


Metode Pemecahan Masalah

Tahapan dalam melakukan analisis sentimen dengan metode SVM dimulai dengan input data latih dan data uji. Secara umum tahapan pemecahan masalah sebagai berikut.

  1. Input : Dokumen Data Latih dan Data Uji
  2. Pre-processing
  3. Pembobotan Kata (TF-IF)
  4. Support Vector Machine
  5. Output : Kelas Komentar Positif atau Negatif

Tahapan Pre-processing

Pada kasus ini akan dilakukan tahapan Pre-processing dengan tahapan case folding, data cleansing, normalisasi kata tidak baku, stopword removal, stemming, dan tokenisasi.

  • Case Folding : mengubah seluruh teks atau karakter menjadi huruf kecil
  • Data Cleaning : membersihkan data dari karakter-karakter tertentu (username, angka, dan tanda baca)
  • Normalisasi Bahasa : mengubah kata yang tidak baku menjadi baku
  • Stopword Removal : menghapus kata yang tidak memiliki makna penting
  • Stemming : mencari kata dasar (menghapus kata imbuan)
  • Tokenisasi : memecah menjadi kata-kata tunggal

Tahapan Pembobotan TF-IDF

TF-IDF (Term Frequency Inverse Document Frequency) merupakan metode pembobotan dalam bentuk integrasi antar term frequency dengan inverse document frequency. Tahapan ini terdiri dari :

  • Menentukan fitur kata
  • Perhitungan nilai TF
  • Perhitungan nilai Wtf
  • Perhitungan nilai DF dan IDF
  • Perhitungan nilai TF-IDF

Tahapan Klasifikasi Support Vector Machine

Support Vector Machine (SVM) merupakan suatu sistem yang dikembangkan untuk membantu menganalisis komentar-komentar pada Instagram yang mengandung cyberbullying atau tidak.

Data masukan yang akan digunakan untuk proses pelatihan adalah data dari 2 kelas yang berbeda yang telah melalui preprocessing. Sesuai dengan data masukan, data komentar diberi kelas positif dan negatif, lalu diberikan label kelas 1 atau -1 yang dimana kelas -1 merupakan kelas negatif sedangkan kelas 1 merupakan kelas positif. 


Pemecahan Masalah

Pada penelitian kali kami akan menetukan sentimen dan kelas dari komentar data uji dengan proses manualisasi mulai dari tahapan pre-proseccing hingga klasifikasi SVM.

Data Latih

No  KomentarSentimen Kelas
L1   Kereeen nih,,,enak bgt didengernya,,,gak bosen puter ulang2,,,daripada yang lipsing2 gajelas joget2 gtu,,Negatif  -1
 L2  Helooow sebuah pertemanan tdk akan melibatkan ciuman BIBIR, coba aja kalian bayangin, sanggup gak ciuman bibir ma TEMAN? pasti lbh dr teman lah itu. Dasar Kelakuan Kids jaman now yang emg bego, bukan krn kebanyakan micin lho yah Positif1

Data Uji

No  KomentarSentimen Kelas
U1  RATU PELAKOR SEJAGAT RAYA, DIMANA2 PELAKOR YA GAK PUNYA MALU. YANG NGERASA PELAKOR DISINI TOLONG PUNYA MALU DIKIT? ?

Manualisasi Pre-proseccing

Tahapan Hasil
Input Data Uji RATU PELAKOR SEJAGAT RAYA, DIMANA2 PELAKOR YA GAK PUNYA MALU. YANG NGERASA PELAKOR DISINI TOLONG PUNYA MALU DIKIT
Setelah Case Folding ratu pelakor sejagat raya, dimana2 pelakor ya gak punya malu. yang ngerasa pelakor disini tolong punya malu dikit
Setelah Data Cleaning ratu pelakor sejagat raya dimana pelakor ya gak punya malu yang ngerasa pelakor disini tolong punya malu dikit
Setelah Normalisasi Data ratu pelakor sejagat raya dimana pelakor ya tidak punya malu yang ngerasa pelakor disini tolong punya malu dikit
Setelah Stopword Removal ratu pelakor sejagat raya dimana pelakor malu ngerasa pelakor tolong malu dikit
Setelah Stemming ratu pelakor jagat raya mana pelakor malu ngerasa pelakor tolong malu dikit
 Setelah Tokenisasi  'ratu', 'pelakor', 'jagat', 'raya', 'mana', 'pelakor', 'malu', 'ngerasa', 'pelakor', 'tolong', 'malu', 'dikit'

Manualisasi Perhitungan tf, df, Wtf, idf, dan TF-IDF

Perhitungan tf, df, Wtf, idf, dan TF-IDF

Manualisasi Klasifikasi Support Vector Machine

Pengujian Support Vector Machine

Rumus Pengujian Support Vector Machine

Pada pengujian Data Uji setelah melewati perhitungan pada SVM maka nilai yang didapatkan ialah 0.00060728 (Positif)

Komentar Sentimen Kelas
RATU PELAKOR SEJAGAT RAYA, DIMANA2 PELAKOR YA GAK PUNYA MALU. YANG NGERASA PELAKOR DISINI TOLONG PUNYA MALU DIKIT Positif 1

Setelah komentar dari data uji melalui tahapan-tahapan pemecahan masalah (manualisi), menghasilkan fungsi hyperplane 1 (positif). Jadi disimpulkan bahwa data uji merupakan komentar positif cyberbullying.


Akurasi Sistem

Dalam sumber yang kami baca, akurasi dari sistem ini jika diimplementasikan sebagai berikut.

Evalusi Persentase
Accuracy79%
Precision 89.85%
Recall 67.33%
F-Measure 74.01%


Kesimpulan

  1. Metode klasifikasi Support Vector Machine dapat digunakan dalam menganalisis sentimen pada kolom komentar Instagram. Hasil klasifikasi yang diberikan dapat berupa kelas sentimen positif cyberbullying atau negatif cyberbullying.
  2. Perhitungan yag kami lakukan mungkin banyak terjadi human error karena semua dilakukan manual dan belum sampai tahap sistem yang menggunkaan bantuan software.

[ Modified: Wednesday, 6 July 2022, 5:27 PM ]