Visualisasi Statistika NBA
Pada tugas besar kali ini, dilakukan visualisasi data statistik pemain NBA 1950-2017. Pada tugas ini, dilakukan plotting untuk melihat trend suatu parameter terhadap waktu serta dibentuk plot untuk melihat perbandingan antar pemain. Kemudian, dibentuk machine learning untuk memprediksi rata-rata 3-point attempt yang dilakukan para pemain NBA pada tahun 2018. Selain itu, dilakukan clustering gaji yang juga dibentuk menggunakan machine learning.
Tugas besar mengenai Visualisasi Statistika NBA memiliki beberapa tujuan. Pertama adalah mengetahui trend yang ada di NBA dari tahun 1950 hingga tahun 2017. Tujuan berikutnya adalah membandingkan kualitas pemain NBA berdasarkan statistika yang terkait. Tujuan ketiga adalah membuat model untuk memprediksi 3-Point Attempt pada tahun selanjutnya. Tujuan yang terakhir adalah membuat klusterisasi gaji pemain menggunakan metode K-Means. Tugas besar ini memanfaatkan Python 3.8 sebagai bahasa pemrograman, dan juga menggunakan jupyter notebook dan google colaboratory. Untuk dataset yang digunakan pada tugas besar ini ada 2, yaitu Season_Stats.csv dan NBA_Season_Data.csv.
Tugas besar ini dimulai dengan melakuakan pencarian dataset yang diperlukan. Kemudian, dataset yang dipilih akan dilakukan data cleaning, terutama untuk kolom kosong serta baris-baris kosong. Lalu, dibuat plot dari statistika pemain NBA dan menganalisisnya. Pekerjaan ini dilanjutkan dengan membuat pemodelan menggunakan teknik regresi linear dan grid search untuk memprediksi 3PA pada tahun-tahun selanjutnya. Pemodelan yang dibuat berikutnya adalah untuk clustering gaji dan menganalisis hal-hal yang mempengaruhi gaji pemain NBA menggunakan metode K-Means.
Tugas besar ini menghasilkan beberapa grafik, yaitu grafik 3-point terhadap waktu, grafik 2-point terhadap waktu, dan lain-lain. Kemudian, dibentuk dictionary bernama player. Dictionary ini berisi pasangan nama pemain (sebagai key) dan dataframe pemain tersebut (sebagai value). Dictionary ini dipakai dalam membuat visualisasi perbandingan statistik di antara 2 pemain yang ditentukan dalam bentuk radar chart. Kemudian, pada tugas besar ini dibentuk machine learning yang bertujuan untuk memprediksi rata-rata total 3-point attempt pemain dalam setahun, pada tahun 2018. Pemodelan yang digunakan adalah Linear Regression dan Grid Search, lalu akan dianalisis mana yang lebih mendekati. Kemudian dilakukan clustering gaji pemain NBA menggunakan metode K-Means.
Kesimpulan yang didapat dari tugas besar ini adalah sebagai berikut: (1) Meskipun untuk mencetak poin di daerah 3-point memiliki tingkat kesulitan paling besar dibandingkan daerah yang lain, jumlah rata-rata 3-point shoot yang masuk dari tahun ke tahun semakin meningkat. Hal ini menunjukkan bahwa skill para pemain NBA terus meningkat. (2) Radar chart dapat dijadikan alat untuk membandingkan kualitas kedua pemain yang ditentukan. (3) Pemodelan menggunakan metode Grid Search lebih baik dibandingkan menggunakan regresi linear dalam memprediksi besar 3-point attempt rata-rata di tahun tertentu. (4) Parameter yang paling mempengaruhi gaji (salary) para pemain adalah WS, OWS, VORP, dan Contribution. Parameter-parameter tersebut merupakan parameter-parameter untuk mengukur kontribusi atau pengaruh suatu pemain terhadap kemenangan tim dalam suatu pertandingan.
Project Author(s)
Nuh Theofilus D. P. H. (18118032), Alberth Christadi (18118034)