December 7, 2020

296 words 2 mins read

Web App Sentimen Analisis Twitter Indonesia

Web App Sentimen Analisis Twitter Indonesia

Proyek berupa pembuatan web yang akan menampilkan 100 tweet terbaru dengan suatu topik dalam bahasa Indonesia, lalu mengembalikan sentimen terhadap tweet tersebut. Sentimen digolongkan menjadi 3 jenis: positif, negatif, atau netral. Aplikasi ini juga akan menampilkan pie chart yang menunjukkan presentasi sentimen atas topik tersebut. Pengguna dapat menggunakan aplikasi tersebut untuk memetakan sentimen masyarakat secara umum atas suatu topik.

Proyek menggunakan metode machine learning berupa SVM untuk klasifikasi sentimen. Dataset menggunakan kombinasi pelabelan manual serta dataset yang sudha dilabeli, didapat dari Kaggle. Akurasi training sebesar 76.3% untuk true positive, 71% true negative, dan 66.28% true netral.

Scrapping data menggunakan Tweepy dan dibatasi hanya pada 100 tweet terbaru dalam bahasa Indonesia. Data dipreproses dengan Cleaner (NLTK) dan Stemmer (Sastrawi). Library Sastrawi digunakan karena secara khusus digunakan untuk NLP bahasa Indonesia. Sastrawi juga memiliki stopwords built-in dalam bahasa Indonesia.

Front end dibuat dengan HTML, Bootstrap JS dan CSS, serta custom JS. Tampilan web memiliki bagian navbar, konten utama, serta footer. Konten utama berisi kolom masukan untuk pencarian tweet sesuai topik, daftar tweet yang sesuai keyword, serta pie chart yang menunjukkan jumlah dan rasio sentimen terhadap keyword tersebut. Tweet dan pie chart diberi label warna sesuai sentimen yang dideteksi.

Karena berupa single page, Flask (Pyhton) digunakan sebagai backend. Aplikasi di-deploy pada server AWS dengan spesifikasi 1 VCPU, 1 GiB RAM, 8GiB Storage, dan 1 buah NIC. EIP sudah disambungkan ke DNS dengan domain setia-dia.me. Inbound rule hanya menerima HTTP, HTTPS dan SSH, namun layanan HTTPS tidak diaktifkan pada web server. Web server mendengarkan port 80

Proyek sudah berhasil berjalan dan dapat diakses lewat Internet. Proyek ini juga berhasil memberikan label sentimen terhadap suatu tweet pada topik tertentu, mesipun akurasi label masih perlu ditingkatkan lagi.

Project Author(s)

Muhammad Athallah Rizki Putra (18117002), Muhammad Miqdad Nadra (18117025), Hafizh Mulya Harjono (18117030)

comments powered by Disqus