Klasifikasi network traffic menggunakan semi-supervised learning
Dilakukan klasifikasi network traffic menggunakan semi-supervised learning. Metode ini menggunakan data berlabel dan tidak berlabel sebagai dataset training dan testing. Penggunaan data tidak berlabel ini diharapkan dapat ditambahkan sehingga dapat menambah akurasi classifier. Klasifikasi ini sangat bermanfaat untuk manajemen jaringan dan membantu ISP memberikan layanan terbaik bagi konsumen.
Semakin berkembangnya zaman, internet kini menjadi hal penting yang wajib ada dalam kehidupan sehari-hari. Jutaan orang menggunakan internet untuk berbagai macam kegiatan seperti membaca berita, bermain games, sosial media, video conference, e-commerce, transaksi bank, dan saat-saat pandemi, banyak digunakan mahasiswa dan siswa untuk melakukan pembelajaran jarak jauh. Keadaan ini membuat topologi jaringan menjadi kompleks dan dinamis, banyaknya data yang perlu dikirim yang akan memberatkan beban bandwidth serta memberikan kesempatan seseorang untuk dapat melakukan sabotase guna mendapatkan keuntungan dari keadaan ini. Oleh karena itu, diperlukan banyak inovasi seperti infrastruktur dan mekanisme untuk dapat menyelesaikan masalah-masalah tadi. Salah satunya, dapat dilakukan monitoring dan mendata jaringan yang ada. Hal ini dikenal dengan sebutan network traffic classification.
Network traffic classification merupakan sumber utama untuk memonitor aktivitas jaringan dan mendeteksi ancaman yang dapat membahayakan jaringan. Dengan memonitor aktivitas jaringan ini berpotensi untuk menyelesaikan masalah kompleksitas dan dinamis dengan melakukan manajemen jaringan yang biasanya dilakukan oleh Internet service provider (ISP) dan vendor. Beberapa manajemen jaringan yang dapat dilakukan antara lain flow prioritization, traffic shaping/ policing, dan diagnostic monitoring.
Untuk mengatasinya, digunakan machine learning guna melakukan klasifikasi network traffic. Hal ini karena dengan metode ini telah terbukti efektif, akurat, dan dapat mengklasifikasikan private data dari beberapa penelitian sebelumnya. Ada berbagai metode machine learning yang ada antara lain supervised, unsupervised, dan semi-supervised learning. Metode supervised merupakan metode yang membutuhkan data training yang berlabel secara keseluruhan. Namun, metode ini dirasa memiliki kelemahan yaitu membutuhkan waktu lama dan lebih mahal dibandingkan metode unsupervised learning jika data yang digunakan merupakan data yang besar. Di sisi lain, untuk bisa mengklasifikasi suatu traffic kita tetap perlu suatu label untuk dapat memutuskan jenis traffic apa. Oleh karena itu, dipilih metode semi-supervised learning yaitu menggunakan sedikit data berlabel dan dengan banyak data tak berlabel.
Project Author(s)
Arba Robbani (23220901)